Евгений Роговский - Нужна ли анонимность демократическому информационному обществу?
В самом деле, руководители Facebook очень скоро заметили, что пользователи продолжают «кликать» на целевую рекламу, и поняли это как то, что она им нравится. А потому Facebook продолжает собирать информацию о своих пользователях и продавать её торговым сетям, которые организуют прицельную работу с клиентом (targeting marketing).
О чем могут рассказать «цифровые следы» в ИнтернетеИтак, мы выяснили, что персональная информация, и прежде всего так называемые «профили» участников социальных сетей, подвергается пристальному анализу. А о том, как можно трактовать информацию о человеке, в своё время сказал кардинал Ришелье: «Дайте мне шесть строк, написанных честнейшим из людей, и я найду в них повод его повесить».
Это высказывание заставляет обратить особое внимание на методы анализа собранной цифровой информации. Как оказалось, такого рода анализом могут заниматься далеко не только торговцы обувью. В марте 2013 г. авторитетная американская газета Washington Post о публиковала заметку о том, что компания Amazon — один из крупнейших магазинов электронной торговли — будет помогать создавать частную сетевую инфраструктуру, способную помочь ЦРУ в работе c новыми информационными технологиями[7].
В этой связи уместно напомнить, что термин «информационные технологии» охватывает и программные продукты, в которых могут быть «зашиты» высокоэффективные научные и специальные методы, о которых абсолютное большинство наиболее продвинутых молодых пользователей даже не догадываются.
Сегодня такие важные виды человеческой деятельности, как взаимодействия (коммуникации) в социальных и профессиональных группах, развлечения, шопинг и сбор необходимой информации, во всё большей степени опосредуются цифровыми технологиями. Соответственно, поведение огромных контингентов населения, занятых такими видами деятельности, легко регистрируется и контролируется, создавая питательную среду для нарождающихся вычислительных направлений социологической науки[8], для новых видов услуг, таких, например, как персональные поисковые механизмы и рекомендующие системы[9], а также целевой онлайновый маркетинг[10].
Современные методы анализа содержащейся в «профилях» персональной информации с высокой вероятностью позволяют выявить возможных преступников. По этой причине в настоящее время маньяки стали избегать социальных сетей. Тех же, у кого нет «профиля» в социальной сети, кто хочет сохранить конфиденциальность своей персональной информации, будут подозревать ещё больше.
В своё время госсекретарь США Х. Клинтон заявила, что «честному человеку транспарентность не страшна, он не возражает против распространения информации о себе; на анонимности настаивают те люди, которым есть что скрывать от окружающих».
Так, немецкий психолог К. Мёллер считает, что отсутствие профиля в социальной сети Facebook позволяет предположить асоциальный характер человека: он либо что-то скрывает, либо у него вообще нет друзей, и значит, он асоциальная личность и вполне способен на преступление. А работодатели в Германии уже проводят предварительную проверку потенциальных сотрудников, используя информацию социальных сетей. Если же у человека нет профиля, то работодатели даже не рассматривают его кандидатуру. У норвежского серийного убийцы Брейвика не было профиля в социальной сети Facebook, так же, как и у Джеймса Холмса, убивавшего людей в кинотеатре американского города Аврора[11].
Конечно информация, которая может быть получена на основе анализа той или иной совокупности событий с помощью специальных статистических методов, является косвенной, она может носить вероятностный характер и с юридической точки зрения считается неполноценной (никакому маньяку на её основе обвинений предъявить нельзя). Тем не менее, такого рода информация может быть очень чувствительной для конкретного пользователя. Люди могут не желать обнародовать те или иные сведения о своей жизни, например свой возраст или социальную ориентацию.
Как оказалось, чувствительная информация может быть «предсказана» аналитическим путём на основе иных доступных индексов, фиксирующих поведение данного человека в сети. Например, крупнейшая в США сеть розничной торговли систематически анализирует данные о покупках молодых женщин с целью предсказания их беременности и посылает им свои коммерческие предложения, тщательно рассчитанные по времени и по своей целесообразности[12].
Информации о пользователях социальных сетей, которую можно «выловить» в Интернете, был посвящён доклад Психометрического центра Кембриджского университета «Предсказуемость особенностей личности на основе цифровых записей человеческого поведения», недавно опубликованный в «Трудах национальной Академии наук» (Proceedings for the National Academy of the Sciences)[13].
В докладе показано, как много могут рассказать о человеке пометки like(«нравится»), которые расставляют пользователи сети Facebook. В принципе пометки like подобны иным широко распространенным «цифровым следам» поведения пользователей в сети Интернет, таким, например, как «статистика использования браузеров» (browsing histories), «вопросы, задаваемые в поисковых системах» (search queries) или «история покупок в интернет-магазинах» (purchase histories). Однако пометки like отличаются от иных источников информации тем, что постоянно доступны «по умолчанию». Как оказалось, эти пометки представляют собой универсальный массив цифровой информации, подобный запросам в поисковых системах, протоколам посещения Web-сайтов или записям о покупках, сделанных по кредитной карте. На основе этого массива достаточно точно могут быть оценены многие чувствительные «атрибуты личности» от сексуальной ориентации до уровня интеллектуального развития.
Доклад демонстрирует эффективный пример применения в практической психологии хорошо опробованных методов статистического моделирования. В ней показано, как именно относительно простые, рутинные протокольные цифровые записи о действиях пользователя киберпространства могут быть использованы для автоматической оценки широкой палитры персональных характеристик («атрибутов»). Проводя в сети все больше времени, пользователи Facebook"клик за кликом" рисуют удивительно точную картину самих себя и не ощущают при этом того, что раскрывают свою конфиденциальную информацию. Авторы этого исследования честно признались, что специально выбрали те параметры, "наклонности" и "атрибуты" личности пользователей, которые в наибольшей степени иллюстрируют, насколько точными и настораживающими могут быть результаты их прогнозирования на основе общедоступной информации. Им удалось создать программу, достаточно точно "предсказывающую" не только пол и возраст пользователей, но также и такие высокочувствительные их личные данные ("персональные атрибуты"), как сексуальная ориентация, этническая и религиозная принадлежность, политические взгляды, личные наклонности, уровень интеллектуального развития и удовлетворенности своей жизнью ("уровень счастья"), употребление наркотиков, разобщенность родителей и проч. В общем виде схема проведенного исследования представлена на рис. 1.
Общая схема исследования
1) В Facebook были выбраны 58 466 добровольцев из США, которые согласились поработать с приложением My Personality Facebook (www.mypersonality.org/wiki) и расставить свои пометки like("нравится") на различных материалах (контенте), доступных в этой социальной сети: фотографиях, "друзьях", интересных страницах, спорте, музыке, книгах, ресторанах, популярных Web-сайтах и проч. В среднем каждый из участников расставил примерно 170 пометок, всего пометок удостоились 55 814 материалов, при этом абсолютное большинство из них отмечалось неоднократно, то есть разными участниками. По завершении работы с этим приложением оно содержало информацию об участниках, взятую из их "профилей Facebook", список расставленных ими пометок like, а также некоторую иную информацию.
Далее была сделана матрица "участник — пометка" (представлена на рис. 1 слева), составленная из строк, каждая из которых содержит пометки, поставленные одним участником. В клетку матрицы ставилась "1", если данный участник (строка) пометил данный материал (столбец) словом like, и "0" — в противном случае. Всего в такой матрице было проставлено около 10 млн. единиц (? 58466*170, то есть произведение количества участников на число помет).