Николас Карр - Великий переход: что готовит революция облачных технологий
Большинство из нас, как и Тельма Арнольд, полагают, что в интернете мы действуем анонимно. Однако мы используем интернет не только как торговый центр и библиотеку, но и как личный дневник и даже исповедальню. Посещая сайты и осуществляя поиск, мы рассказываем не только о своей работе, хобби, семье, политических взглядах и здоровье, но и о секретах, фантазиях, навязчивых идеях, грешках, а в самых крайних случаях – о преступлениях. Однако наше ощущение анонимности в значительной мере иллюзорно. Подробная информация обо всем, что мы делаем в интернете, регулярно собирается, хранится в корпоративных или правительственных базах данных и связывается с нашей реальной личностью либо напрямую через наши имена пользователей, номера кредитных карт, а также IP-адреса, автоматически назначаемые нашим компьютерам, либо опосредованно через нашу историю поиска и посещений. Известная карикатура 1993 года в журнале New Yorker имела следующую подпись: «В интернете никто не знает, что вы собака». На самом деле известно не только то, что вы собака, но также и ваша порода, возраст, место проживания и любимая еда.
Чтобы связать конфиденциальную информацию с именами людей, совсем не нужна команда журналистов New York Times, изучающих журналы поиска и телефонные книги. Также не требуется ни случайного, ни преднамеренного разглашения сведений. По мере распространения баз данных и усложнения аналитических технологий становится все проще использовать Всемирный компьютер для добывания личной информации. За несколько месяцев до того, как компания AOL опубликовала свои журналы поиска, писатель Том Оуад показал, насколько просто стало извлечь личные данные из интернета. Оуад, который поддерживает сайт для пользователей компьютеров Macintosh, написал простой фрагмент программного кода, так называемый скрипт, для скачивания списков пожеланий, размещаемых клиентами сайта Amazon.com. Миллионы людей составляют такие списки на сайте интернет-магазина для перечисления продуктов, которые они планируют приобрести в будущем или желают получить в качестве подарка. Эти списки может просмотреть любой, и обычно они содержат имя владельца списка, а также город и штат, в котором он проживает.
Имея два пятилетних ПК и стандартное домашнее интернет-соединение, Оуад смог загрузить более четверти миллиона списков пожеланий за один день. «Теперь у меня есть информация о читательских предпочтениях 260 000 граждан США», – написал он позднее на своем сайте. В каждом списке был закодирован уникальный идентификационный номер клиента Amazon, что позволило Оуаду легко рассортировать списки по пользователям. В получившейся базе данных он произвел поиск по названиям книг и другим ключевым словам, в частности, по ряду спорных или политически значимых книг и авторов от «Бойни номер пять» Курта Воннегута до Корана, от правых воззрений Раша Лимбо[41] до левых взглядов его коллеги Майкла Мура[42]. Зная имена и местонахождение владельцев списков, он через сервис для поиска людей Yahoo People Search определил адреса и телефоны многих из них. Затем с помощью Google Maps нанес на карту их адреса. В итоге получилась карта Соединенных Штатов, отображающая точное местоположение людей, интересующихся конкретными книгами и идеями. Он разместил на своем сайте карту с указанием адресов клиентов Amazon, которые выразили заинтересованность в книге «1984» Джорджа Оруэлла. А мог так же легко опубликовать карту, показывающую, где живут люди, которых интересуют книги о выращивании марихуаны или о том, как отдать ребенка на усыновление. «Раньше считалось, – заключает Оуад, – что для наблюдения за человеком или группой людей вы должны получить ордер. Сегодня становится все проще отслеживать идеи, которые затем можно соединить с конкретными людьми».
Оуад потратил изрядное количество времени на организацию и проведение своего эксперимента. Ему пришлось написать собственный код для загрузки данных и вручную произвести поиск по базе данных. Однако то, что Оуад сделал вручную, можно более эффективно выполнить автоматически, используя алгоритмы интеллектуального анализа данных, которые позволяют извлекать информацию одновременно из многих различных сайтов. Одна из основных характеристик компьютерной сети – взаимосвязь разнообразных хранилищ информации. «Открытость» баз данных представляет собой основной источник мощи Всемирного компьютера. Однако это также позволяет легко обнаружить скрытые взаимосвязи между отдельными фрагментами данных. Проанализировав эти отношения, можно обнаружить на удивление обширный кладезь конфиденциальной информации о веб-пользователях.
В 2006 году на конференции ученых в области компьютерных наук, состоявшейся в Сиэтле на той же неделе, когда в прессе появилась информация о личности Тельмы Арнольд, пять ученых из Миннесотского университета представили документ под названием «Вы есть то, что вы говорите: угрозы конфиденциальности, связанные с публичными высказываниями» (You Are What You Say: Privacy Risks of Public Mentions). Они описали, как можно использовать программы для объединения онлайновых баз данных. Находя пересекающиеся данные, эти программы создают подробные личные профили людей, даже когда те предоставляют информацию анонимно. Такое программное обеспечение базируется на простом и очевидном принципе: люди, как правило, выражают свои интересы и мнения на разных сайтах в интернете. Они могут, например, купить альбом в музыкальном магазине iTunes, включить этот альбом в свой плейлист на сервисе Last.fm, оценить его на сайте Rate Your Music и упомянуть о нем в комментарии в музыкальном блоге. Или же отредактировать статью в энциклопедии Wikipedia, посвященную их любимому актеру, написать рецензию на его новую биографию на сайте Amazon, стать его «другом» в социальной сети MySpace и отметить его фотографии на сервисе Flickr. Сложные алгоритмы определяют такие соответствия и используют их для очень точного определения конкретных личностей, как это сделали исследователи из Миннесоты. Проанализировав всего две базы данных: одну с сайта, содержащего рейтинги фильмов, и вторую из форума, посвященного обсуждению фильмов, – они обнаружили, что их алгоритм смог успешно идентифицировать 60 % из тех, кто упомянул восемь или более фильмов.
«В современном богатом данными сетевом мире, – объясняют они в своей статье, – люди рассказывают в интернете о многих аспектах своей жизни. Обычно эти аспекты рассредоточены: вы можете писать вольные рецензии на фильмы в своем блоге под псевдонимом и в то же время участвовать в обсуждениях на форуме или сайте, посвященном медицинской этике, под своим реальным именем. И все-таки эти отдельные личности могут быть связаны» с помощью алгоритмов интеллектуального анализа данных. Такой автоматизированный процесс идентификации, утверждают они, «создает для пользователей серьезные угрозы конфиденциальности». Даже если люди нигде не проявляют свои настоящие личности, их имена, как правило, легко выяснить, если они выдают очень небольшое количество идентифицирующих характеристик. Авторы отмечают, что имя и адрес подавляющего большинства американцев могут быть определены, если известны лишь их почтовый индекс, день рождения и пол – три фрагмента информации, которые люди регулярно предоставляют при регистрации на сайте.
«У вас больше нет частной жизни, – заметил еще в 1999 году Скотт Макнили, бывший исполнительный директор компании Sun Microsystems. – Смиритесь с этим». Бытует мысль о том, что за удобство интернета приходится платить потерей конфиденциальности, и в этом есть доля правды. Однако мало кто из нас осознаёт, в какой степени мы раскрываем подробности нашей личности и жизни, равно как и то, что эти детали могут быть извлечены из журналов поиска или других баз данных и связаны с нами. И, несмотря на наше отношение к потере конфиденциальности, это далеко не единственная и даже не самая внушительная угроза современного интернета. Математики и программисты продолжают совершенствовать алгоритмы анализа данных и находят новые способы предсказания реакций людей на информацию или другие стимулы, предоставляемые онлайн. Они учатся не только определять нашу личность, но и манипулировать нами, и их открытия в настоящее время применяются на практике компаниями и правительствами, не говоря уже о мошенниках.
Вполне естественно воспринимать интернет как технологию эмансипации. Он дает нам беспрецедентную свободу самовыражения, обмена идеями и увлечениями, поиска и общения с родственными душами и нахождения информации практически на любую тему, которую только можно себе представить. Для многих людей выход в интернет представляет собой переход к новому, радикально иному виду демократического государства, освобожденного от физических и социальных ограничений, которыми характеризуется реальный мир. То, что Всемирная паутина «расширяет возможности» каждого человека, признают даже те, кто сожалеет о ее коммерциализации или осуждает грубость большей части ее содержимого. В начале 2006 года редакторы интернет-журнала Cato Unbound Института Катона опубликовали специальный выпуск о состоянии Сети. Они сообщили, что «провидцы», работавшие над изданием, казалось, были «единодушны во мнении, что интернет в будущем сохранит за собой роль освободительной силы». В июле 2007 года в своем эссе ученый Клэй Ширки написал: «Интернет производит данные, но его продукт – свобода, много-много свободы». Дэвид Вайнбергер в своей книге «Неплотно соединенные маленькие части» (Small Pieces Loosely Joined, 2002) простыми словами подытожил миф об освободительной силе интернета: «Всемирная паутина – это мир, который мы создали друг для друга».