KnigaRead.com/
KnigaRead.com » Компьютеры и Интернет » Базы данных » Охота на электроовец. Большая книга искусственного интеллекта - Марков Сергей Николаевич

Охота на электроовец. Большая книга искусственного интеллекта - Марков Сергей Николаевич

На нашем сайте KnigaRead.com Вы можете абсолютно бесплатно читать книгу онлайн Марков Сергей Николаевич, "Охота на электроовец. Большая книга искусственного интеллекта" бесплатно, без регистрации.
Перейти на страницу:

В переписи 1880 г. использовалось шесть видов листов учёта, по одному для каждой крупной статистической классификации. В первом листе население было разбито на группы по полу, расе и месту рождения; в других листах эти данные сопоставлялись с грамотностью, профессией и другими характеристиками. Для каждого из типов подсчёта сотрудникам приходилось заново перебирать миллионы переписных листов — процесс чрезвычайно медленный и дорогостоящий, не говоря уже о вероятности ошибок. Более того, он не позволял осуществлять сложный анализ данных.

Практически вся подготовительная работа и работа после переписи осуществлялась вручную. Единственным используемым механическим устройством было простое приспособление, так называемое устройство Ситона, изобретённое Чарльзом Ситоном, главным клерком переписи. Оно состояло из сплошного рулона листов учёта, намотанного на набор катушек в деревянной коробке. Рулон зигзагообразно огибал катушки устройства, собирая, таким образом, несколько столбцов листов рядом, что позволяло ускорить простановку отметок. Заполненные рулоны изымались из коробки, разрезались на отдельные листы, значения из которых затем суммировались [255].

Охота на электроовец. Большая книга искусственного интеллекта - image055.jpg
Рис. 30. Устройство Ситона

В своё время руководитель предыдущей переписи Фрэнсис Уокер сравнил результаты использования устройства Ситона с обычным способом обработки данных и обнаружил, что машина повысила производительность каждого клерка с 29 до 124 листов в день, то есть прирост производительности труда составил почти 428%. Хотя более поздний анализ показал, что эта оценка была сильно преувеличена, специальным актом Конгресса Ситону за его изобретение выплатили премию в размере 15 000 долларов (расчёт размера вознаграждения основывался на ожидаемой экономии, возникающей при использовании устройства; эта сумма равна годовому окладу 29 клерков) [256], [257]. В целом устройство Ситона не могло решить возникшую проблему. В 1880 г. число вопросов переписи в очередной раз возросло — с восемнадцати до двадцати четырёх, к тому же вырос спрос на получение более детальной статистики. Рос аппетит Конгресса к получению новых данных, и конгрессмены были готовы выделить дополнительные фонды на их сбор и обработку, а Уокер с энтузиазмом относился к возможности расширения штата. В итоге объём опубликованных результатов переписей увеличился с пяти томов разного размера в 1870 г. до двадцати двух толстых ин-кварто [258] томов в 1880 г. (да ещё и с приложением). Эта амбициозная программа потребовала значительного увеличения числа клерков, и их численность выросла с 438 человек в переписи 1870 г. до 1495 человек при подведении итогов переписи 1880 г. [259]

Охота на электроовец. Большая книга искусственного интеллекта - image056.jpg

В 1882 г. Холлерит становится инструктором по машиностроению в Массачусетском технологическом институте, где начинает строить свой первый аппарат для суммирования и классифицирования данных. Спустя год он возвращается в Вашингтон, чтобы стать экспертом патентного ведомства. Правда, в отличие от Альберта Эйнштейна, проработавшего на аналогичной позиции семь лет, Холлерит увольняется, чтобы начать карьеру изобретателя и предпринимателя.

Первоначальный дизайн машины Холлерита предполагал использование перфорированной ленты. Не исключено, что это инженерное решение было навеяно конструкцией машины Ситона, но спустя более чем столетие трудно это достоверно установить. Сама по себе идея не нова, вспомним хотя бы Жака Вокансона, который использовал перфорированные полосы бумаги в своём станке. Принципиальной инновацией в случае Холлерита было использование электричества: перфолента проходила между металлическим барабаном и большими металлическими щётками; всякий раз, когда щётки сквозь отверстие соприкасались с поверхностью барабана, возникал электрический контакт, приводивший к увеличению значения счётчика, соответствующего определённой статистической категории. Несмотря на большой прогресс, достигнутый в сравнении с операциями, выполняемыми при помощи листов учёта, Холлерит вскоре понял, что совершил серьёзную ошибку: бумажная лента оказалась неудачным носителем информации, ограничивающим скорость и гибкость системы из-за необходимости только последовательной обработки данных. Таким образом, если нужна только часть данных с ленты, приходилось проматывать рулон целиком, а после нахождения данных не было возможности их как-либо извлечь для дальнейшего анализа (разве что вырезать их с ленты) [260]. Казалось, Холлерит зашёл в тупик, забыв об идее Биллингса о картах с насечками. Однако на помощь пришёл любопытный случай во время одного путешествия. Холлерит вспоминал позже: «…У меня был билет с тем, что, как я думаю, называлось перфорационной фотографией. Когда билет первый раз предъявлялся кондуктору, он, пробивая в нём отверстия, формировал описание человека, например: светлые волосы, тёмные глаза, большой нос и т. д. Таким образом, как вы видите, я лишь выполнил перфорационные фото каждого человека» [261], [262]. Таким образом, система, созданная для борьбы с воровством билетов, помогла изобретателю создать более элегантную конструкцию машины, перейдя от непрерывной ленты к перфорационным учётным карточкам каждого человека.

Охота на электроовец. Большая книга искусственного интеллекта - image057.jpg
Рис. 31. Фото проездного билета

Интересно, что Холлерит не был первым исследователем, осознавшим всю мощь перфокарт в деле обработки больших объёмов данных. Ещё в первой половине XIX в. русский изобретатель Семён Корсаков сконструировал несколько механических устройств, основанных на использовании перфорированных таблиц и предназначенных для задач информационного поиска и классификации. Первое устройство Корсакова получило название «гомеоскоп» (от др.-греч. ὅμοιος — подобный и σκοπέω — смотреть). Самый простой вариант гомеоскопа представлял собой деревянный брусок с отверстиями, в которых находились штыри длиной немного больше толщины бруска. Один конец у каждого штыря был закруглён, и при надавливании на него противоположный конец штыря выдвигался с другой стороны бруска. Каждый штырь соответствовал какому-либо признаку некоторого объекта. Если конец штыря выступал из рабочей поверхности бруска, значит, у данного объекта соответствующий признак присутствовал, в противном случае — отсутствовал.

Гомеоскоп использовался для быстрого поиска объекта в перфорированной таблице. Каждая строка такой таблицы соответствовала объекту, а столбец — признаку. Например, в одном из экспериментов Корсакова объектом была болезнь, а признаками — наблюдаемые симптомы. Вначале надо было подготовить таблицу: при наличии у объекта некоторого признака проделывалось отверстие в соответствующей им ячейке таблицы. После этого можно было осуществлять поиск объекта: в гомеоскопе устанавливался соответствующий признакам набор штырей, и гомеоскоп, перемещаемый вдоль строк таблицы, останавливался, если для всех выдвинутых штырей в таблице находились соответствующие отверстия. Если же гомеоскоп доходил до конца таблицы, то это означало, что объект, обладающий всеми заданными при помощи штырей признаками, пока что не внесён в таблицу. Таким образом, используя гомеоскоп, можно было найти болезнь по набору наблюдаемых симптомов и узнать список рекомендуемых при ней лекарств, который записывался в дополнительном столбце таблицы.

Перейти на страницу:
Прокомментировать
Подтвердите что вы не робот:*