KnigaRead.com/
KnigaRead.com » Фантастика и фэнтези » Научная Фантастика » Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

На нашем сайте KnigaRead.com Вы можете абсолютно бесплатно читать книгу онлайн Жан-Батист Мишель, "Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры" бесплатно, без регистрации.
Перейти на страницу:

Мы стали встречаться и обсуждать научное исследование, в котором бы описали наши самые интересные открытия. Мы думали, что написание научной работы поможет нам сделать следующий шаг вперед. Но каждый раз, когда мы начинали писать на эту тему, нас отвлекал от работы новый набор n-грамов. Закуски! Компании! Динозавры! К концу каждой встречи мы понимали, что любые наши предыдущие открытия меркли в сравнении с тем, что мы проверили только что. Ситуация казалась попросту невозможной. Мы никак не могли понять, как же нам справиться с этой одержимостью.

Нам стало ясно, что для того, чтобы собраться с мыслями, потребуется помощь других. Поэтому мы взяли четыре ноутбука, имевших доступ к базе данных n-грамов, – единственные четыре ноутбука в мире, способные работать с нашим прототипом интерфейса Bookworm, – и раздали их. Один отправился к Пинкеру, который принялся быстро создавать с его помощью графики для включения в книгу, которую писал в то время. Другой ушел Авиве, жене Эреца. Она тут же сообщила о новых открытиях – проверка n-грама для фамилии Мендельсон заставила ее углубиться в изучение темы цензуры. Теперь на этот наркотик подсела и она.

Третья машина отправилась к Мартину Новаку. Как-то раз, вернувшись домой, он показал Bookworm своему сыну Себастьяну, которому в то время было 16 лет. Себастьян ввел запрос. На экране появился график. Заинтересовавшись, он попробовал еще; а после еще двух запросов он забрал машину у Мартина и удалился. Уже через несколько минут работы он позвонил другу: «Ты должен сейчас же прийти и увидеть, что у меня есть». Друг пришел, и они отправляли запрос за запросом до глубокой ночи.

Последняя машина отправилась на Библиотечный саммит 2010 года, проводившийся компанией Google. Нас пригласили сделать на этом мероприятии доклад. Именно на этом саммите Google обычно рассказывала главам многих библиотек мира о последних новостях своего проекта по оцифровке.

Наверное, вы считаете библиотекарей тихими и спокойными людьми. Мы столкнулись с обратной картиной.

После того как мы объяснили базовую концепцию того, чем занимаемся, уровень энтузиазма в зале резко возрос – никто и никогда не слышал ни о чем подобном (по крайней мере в таких масштабах). Мы смогли привлечь внимание каждого человека, находившегося в переполненном зале. Ко времени, когда мы стали показывать примеры, комната наполнилась удивительной энергией. Наконец, после 45 минут общения мы перестали разговаривать и загрузили Bookworm.

Мы поинтересовались у аудитории: «А теперь… какие мы отправим запросы?» В ответ раздались бурные аплодисменты, подобных которым мы не слышали никогда в жизни. Но библиотекари еще и принялись кричать, не в силах сдержать эмоции:

– Сравните слова «он» и «она»!

– Давайте попробуем «глобальное потепление»!

– «Пираты» против «ниндзя»!

Комната буквально взорвалась от восторга, любопытства и ликования.

N-грамы очаровывали, манили и моментально вызывали привыкание. Казалось, будто мы открыли новую разновидность героина для «ботаников».

Боремся с зависимостью: новая стратегия

Сидевший в первом ряду Дэн Клэнси понимал, что наше странное изобретение будет интересным не только для нас самих и кучки библиотекарей, но и для множества пользователей Google. Он пообещал, что Google займется адаптацией нашего прототипа и выпустит его в свет в рамках проекта Google Books. Мы были в восторге.

Внезапно наш проект превратился из черепахи научного метода в стремительного кролика, работающего на энергии Google. Ровно через две недели потрясающие программисты из Google Йон Орвант, Мэттью Грей и Уильям Брокман создали прекрасную веб-версию Bookworm. Чтобы избежать длительного процесса согласования новых торговых марок внутри компании, мы были вынуждены сменить прежнее название на более простое и технологичное – Ngram Viewer. В 14:00 16 декабря 2010 г. журнал Science опубликовал нашу статью с описанием исследования, и одновременно с этим Google выпустила Ngram Viewer в свет.

За первые же 24 часа на сайт зашло три миллиона посетителей. Тут же стали появляться сообщения в Twitter. Обзоры Ngram Viewer варьировались от «вызывает привыкание» (@gbilder) до «вызывает тотальное привыкание» (@paulfroberts) и «божежтымой google ngram viewer вызывает привыкание, с каким я никогда прежде в жизни не сталкивался» (@rachsyme). Журнал Mother Jones окрестила его «возможно, величайшим расточителем времени в истории Интернета» [185]. Прочитав на следующее утро газету New York Times, мы с удивлением увидели рассказ о нашей работе на первой полосе.

Проблема была решена: раз уж мы не могли избавиться от парализующей волю тяги к n-грамам, то мы решили подсадить на них весь мир.

Мамочка, откуда берутся марсиане?

В сентябре 1610 года Галилей начал серию наблюдений планеты Марс. К декабрю того же года он заметил нечто примечательное – казалось, что Марс становится все меньше и меньше, и теперь его размер составлял всего треть от сентябрьского[186]. Галилей пришел к выводу, что за несколько месяцев планета удалилась от Земли на огромное расстояние, – и это стало одним из важнейших доказательств того, что Земля не находится в центре Вселенной. Однако, помимо этого, Галилей не мог увидеть практически ничего другого. Его телескоп был слишком примитивен, чтобы что-то рассказать о поверхности планеты.

Через несколько столетий Джованни Скиапарелли навел на Красную планету значительно более мощный телескоп[187]. Он увидел совершенно потрясающую вещь – поверхность планеты была испещрена массивными линиями. Рассказы Скиапарелли настолько вдохновили человека по имени Персиваль Лоуэлл, что в 1894 году тот решил выстроить свой собственный телескоп, чтобы увидеть эту же картину своими глазами. И он действительно увидел те же линии из своей обсерватории, созданной в городе Флагстафф, штат Аризона. Другие люди, работавшие в обсерватории Лоуэлла, подтвердили его открытия. На основе прямых наблюдений команда смогла создать подробные карты с указанием линий, формировавших на поверхности планеты плотную сеть.

Чем же могли быть эти протяженные линии на поверхности Марса?

Объяснение Лоуэлла базировалось на знании, широко распространенном уже сто лет назад. Ученым было известно, что на Марсе практически нет воды, за исключением ледяных шапок на полюсах планеты. Лоуэлл считал, что линии представляли собой масштабную систему ирригационных каналов, созданных жителями умиравшей планеты для доставки воды из полярных регионов. Рассматривая систему линий в свой телескоп, Лоуэлл пришел к заключению, что на Марсе есть разумная жизнь[188]. Мы не одиноки.

Перейти на страницу:
Прокомментировать
Подтвердите что вы не робот:*