KnigaRead.com/
KnigaRead.com » Компьютеры и Интернет » Базы данных » Охота на электроовец. Большая книга искусственного интеллекта - Марков Сергей Николаевич

Охота на электроовец. Большая книга искусственного интеллекта - Марков Сергей Николаевич

На нашем сайте KnigaRead.com Вы можете абсолютно бесплатно читать книгу онлайн Марков Сергей Николаевич, "Охота на электроовец. Большая книга искусственного интеллекта" бесплатно, без регистрации.
Перейти на страницу:

Эксцентричный философ Александр Бард, известный публике не только своей «Трилогией Футурики» (The Futurica Trilogy) и термином «нетократия», но и благодаря участию в музыкальных коллективах Army of Lovers и Gravitonas, в одной из публичных лекций предложил переизобрести историю. Не в том смысле, конечно, чтобы подвергнуть сомнению исторические факты или их периодизацию, а скорее в том, что объективные данные исторической науки могут рассматриваться с разных точек зрения и точка зрения во многом определяется особенностями эпохи, к которой принадлежат сами историки, а также источниками их доходов. На смену истории, написанной монахами, пришла история эпохи индустриальной революции — и вот уже на смену трактатам, возводящим родословные царей к библейским персонажам, приходят работы, рассуждающие о каменном, бронзовом и железном веках. Подобная периодизация имеет в своей основе овладение технологиями обработки различных материалов, подчинение их человеческой воле, и, разумеется, венцом творения в таком случае становится современная фабрика. Сегодня, когда ИТ-гиганты бросили вызов мировому экономическому могуществу фабрикантов, появилась возможность иного взгляда на историю — построение периодизации на базе развития технологий обработки информации. На смену каменному, железному и бронзовому веку, изобретённым в эпоху индустриальной революции, грозят прийти век устной речи, век письменности, век книгопечатания, эпоха интернета [249]. Производство человека, воспроизводство человечества — это не только производство материальное, но и производство идей, знаний, технологий, именно поэтому технологии, используемые тем или иным обществом для обработки информации, возможно, в не меньшей мере характеризуют общество, чем технологии, используемые для изготовления орудий. Если взглянуть сквозь призму этого подхода на эпоху промышленной революции, то можно сказать, что она стала также первой революцией больших данных. Ян Макдугалл Хакинг, канадский специалист в области философии науки, называет процесс, развернувшийся в 1820–1840 гг., «лавиной печатных чисел». В этот период, по подсчётам учёного, количество напечатанных чисел росло в экспоненциальной прогрессии, в то время как количество печатных слов — только в линейной [250].

Предпосылки революции больших данных можно обнаружить в высказываниях её предвестников. На границе XVII–XVIII вв. Лейбниц писал, что новое прусское государство должно начаться с создания статистического бюро, потому что истинной мерой государственной власти является население. Лейбниц сформулировал эту идею приблизительно в 1685 г., через несколько лет после того, как Уильям Петти высказал аналогичную рекомендацию для Англии. Лейбниц видел роль центрального статистического бюро в том, чтобы служить различным ветвям администрации. Бюро должно вести общий реестр смертей, крещений и браков, используя собранную информацию для оценки численности населения и, следовательно, мощи государства. Задача прямого подсчёта населения тогда считалась невыполнимой. Впрочем, передовые идеи медленно пробивали себе дорогу. На протяжении XVIII в. проекты по сбору статистической информации о населении и экономике в ведущих европейских странах были уделом различных ведомств (например, торговых) и даже частных исследователей. Появление первых центральных статистических бюро относится к первой половине XIX в. Например, в Прусском королевстве указ о создании такого бюро был издан в 1805 г., Управление записей актов гражданского состояния Англии и Уэльса (General Register Office for England and Wales) образовано в 1836 г., Бюро переписи населения США (United States Census Bureau) — в 1840 г. Словом, на воплощение в жизнь идей Петти и Лейбница ушло почти полтора столетия.

В 1860 г. основатель саксонского статистического бюро, экономист и статистик Эрнст Энгель был приглашён на пост директора прусского статистического бюро. Своё 22-летнее пребывание на этом посту учёный начал в том числе с основания трёх новых периодических изданий, в одном из которых опубликовал 21-страничный список 410 регулярных статистических сборников, издаваемых центральным правительством в Берлине. Для сравнения: в 1800 г. этот список был бы пустым [251].

В 1833 г. в Великобритании возникло Манчестерское статистическое общество, а год спустя — Королевское статистическое общество. В числе его основателей, между прочим, были Чарльз Бэббидж и Томас Мальтус, основатель мальтузианства — теории, согласно которой неконтролируемый рост населения должен привести к голоду на Земле.

Рост объёмов статистических данных требовал создания эффективных механизмов для их обработки. Переписи населения в условиях его быстрого увеличения в XIX в. становились всё более сложными и затратными мероприятиями, что заставляло их организаторов идти на беспрецедентные доселе и весьма радикальные для своего времени меры: например, в ходе переписи населения США в 1880 г. женщинам впервые разрешили быть счётчиками. Однако, несмотря на это, обработка результатов растянулась почти на десятилетие. Поскольку переписи в США проводились каждые десять лет, возникла реальная угроза того, что данные, собранные в 1890 г., вообще не удастся обработать в десятилетний срок, а это, в свою очередь, грозило полным коллапсом переписной системы. Становилось очевидным, что здесь необходимо революционное решение проблемы, и оно вскоре последовало.

В 1879 г. одарённый юноша Герман Холлерит, сын немецких иммигрантов, с отличием окончил Школу горного дела при Колумбийском колледже [252] в Нью-Йорке (правда, со сниженными отметками по бухгалтерскому учёту и механике) и поступил на работу в Вашингтоне в качестве специального агента для Бюро переписи населения США. На эту работу Холлерита устроил его бывший преподаватель, профессор Уильям Троубридж, работавший в Бюро экспертом. В связи с готовящейся переписью 1880 г. организация нуждалась в сотрудниках с математическими и инженерными способностями.

Хотя сама перепись заняла всего несколько месяцев, последующая работа по составлению таблиц и анализу данных требовала многих лет кропотливого труда большого коллектива сотрудников, ввиду чего отчёты о переписи к моменту их выхода сильно устаревали.

В свободное время Холлерит помогал в составлении отчётов доктору Джону Биллингсу, главе отдела статистики естественного движения населения. Биллингс был благодарен Герману за помощь и пригласил его к себе на ужин. Этот ужин (в августе 1881 г.) стал поворотным моментом в жизни Холлерита, о котором он вспоминал позже [253]: «В один из воскресных вечеров мы сидели за чайным столиком доктора Биллингса, и он сказал мне, что необходима машина для осуществления чисто механической работы по составлению таблиц численности населения и аналогичных статистических данных. Мы говорили об этом, и я помню его идею о чём-то похожем на машину для сортировки типографских литер. Он думал о том, чтобы использовать карты с описанием индивида, выполненным при помощи вырезов на краю карты… Изучив вопрос, я вернулся к доктору Биллингсу и сказал, что, по моему мнению, я могу решить эту проблему, и предложил ему присоединиться ко мне. Доктор сказал, что ему интересно лишь увидеть работающее решение проблемы» [254].

Принявшись за самостоятельное решение проблемы, Холлерит изучил процедуру переписи. На первом этапе счётчики посещали каждое домохозяйство и записывали ответы на свои вопросы на больших переписных листах (schedules). Заполненные переписные листы отправлялись обратно в Вашингтон, где армия клерков переписывала ответы в листы учёта (tally sheets). Например, для каждого переписного листа белого мужчины в маленькую ячейку на листе учёта ставилась отметка в виде косой черты, всего в ячейке могло содержаться до пяти отметок. Общее количество отметок было несложно подсчитать, поскольку форма была разделена на большие ячейки, каждая из которых содержала определённое число маленьких. Клерки подсчитывали количество отметок и записывали его в нижней части листа. На следующем этапе суммы из листов учёта переносились в сводные таблицы, суммарные показатели которых соответствовали численности населения округа, штата и, наконец, всей страны.

Перейти на страницу:
Прокомментировать
Подтвердите что вы не робот:*