Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры
3
Цитата из статьи в Washington Post (24 апреля 1887 г.), цит. по: Zimmer Ben. Life in These, uh, This United States // Language Log (24 ноября 2005 г.). Доступно в сети Интернет: http://goo.gl/Ug8iX.
4
Обратите внимание, что использование строчной буквы позволяет избежать неточностей в формулировках. Например, в выражении the Senate of the United States вполне понятно, что речь идет не о самих Соединенных Штатах, а о Сенате Соединенных Штатов.
5
Вопрос использования единственного или множественного числа не терял актуальности и до 1901 года, когда Джон У. Фостер, работавший госсекретарем при президенте Бенджамине Гаррисоне, опубликовал в газете New York Times статью, описывавшую преимущества использования единственного и множественного числа. См. Foster John W. Are or Is? Whether a Plural or a Singular Verb Goes with the Words United States // New York Times. Доступно в сети Интернет: http://goo.gl/Ql60b.
6
Подробная история всех этих открытий отлично описана в книге: Ilardi Vincent. Renaissance Vision from Spectacles to Telescopes. Philadelphia: American Philosophical Society, 2007.
7
По-английски и келья, и клетка называются одним словом – cell (Прим. ред.). Во время работы над настоящей книгой Эрец посетил Упсальский университет в Швеции, где ему представилась возможность изучить первое издание «Микрографии» (Micrographia: or some physiological descriptions of minute bodies made by magnifying glasses with observations and inquiries thereupon), написанной Гуком в 1665 году. Сделанные Гуком рукописные иллюстрации того, что он увидел через микроскоп, не могут не потрясать даже по современным стандартам. Нельзя даже представить себе, насколько невероятными они казались в то время. «Микрография» была первым научным бестселлером, одним из первых научно-популярных текстов. Тем не менее в наши дни первое издание представляет собой редкость. Добро пожаловать в мир революции цифровых книг: теперь любой человек может изучить оригинал книги в сети Интернет. См. Hooke Robert. Micrographia. London: Jo. Martyn and Ja. Allestry, 1665. Доступно в онлайн-библиотеке: http://lhldigital.lindahall.org/.
8
Поначалу названные «анималкулами» открывшим их Антони ван Левенгуком. См. Dobell Clifford. Antony van Leeuwenhoek and His «Little Animals». New York: Harcourt, Brace, 1932. В вашем теле бактериальных клеток в 10 раз больше, чем человеческих. См.: Savage D. C. Microbial Ecology of the Gastrointestinal Tract // Annual Review of Microbiology 31 (1977). P. 107. Доступно в сети Интернет: http://goo.gl/hzVlrR. Бактерии, живущие внутри нас, превышают человеческое население планеты примерно в 1014, то есть составляют 100 триллионов.
9
Первые телескопы Галилея были не столь мощными. 30-кратного увеличения удалось добиться только после нескольких усовершенствований. См. Westfall Richard S. Science and Patronage: Galileo and the Telescope // Isis 76, no. 1 (март 1985 г.). P. 11–30. Доступно в сети Интернет: http://goo.gl/eiPt3U; King Henry C. The History of the Telescope. London: C. Griffin, 1955.
10
См. Whitehouse David. Renaissance Genius: Galileo Galilei and His Legacy to Modern Science. New York: Sterling, 2009; Wootton David. Galileo: Watcher of the Skies. New Haven, CT: Yale University Press, 2010; Brake Mark. Revolution in Science: How Galileo and Darwin Changed Our World. New York: Palgrave Macmillan, 2009; Moss Jean Dietz. Novelties in the Heavens: Rhetoric and Science in the Copernican Controversy. Chicago: University of Chicago Press, 1993; Westman Robert S. The Copernican Question Prognostication, Skepticism, and Celestial Order. Berkeley: University of California Press, 2011.
11
Ранняя история человеческого письма стала известной нам во многом благодаря новаторской работе Денис Шмандт-Бессерат. Названный ею «розеттским камнем эпохи фишек» глиняный «амулетик», найденный в иракском Нузи и датируемый II тысячелетием до н. э., представляет собой одну из самых важных находок в области археологии древней письменности. На амулете приведен текст, написанный клинописью и расшифрованный как: «21 овца // 6 ягнят-самок // 8 взрослых баранов // 4 ягненка-самца // 6 беременных коз // 1 козел // 3 козочки // Печать Зикарру, пастуха». Когда амулет открыли, внутри него обнаружилось описание каждого из животных, перечисленных снаружи. Для чего понадобилось такое повторение? К тексту на внешней поверхности довольно легко обратиться, однако его так же легко было видоизменить. С внутренним содержимым дело обстояло наоборот. Соответственно, в случае разногласий между сторонами сделки спор решался открытием амулета и изучением его содержимого. Ученые полагают, что через какое-то время люди пришли к мысли, что можно использовать клинопись как внутри, так и снаружи, – это позволяло им полностью отказаться от изображений и создавать юридические документы на базе одного лишь текста. Практика создания контрактов, в которых часть текста оставалась «открытой» для простоты обращения, а другая часть была «запечатана» на случай возникновения разногласий, получила широкое распространение. Пример такого типа контракта зафиксирован в Еврейской Библии (Иер. 32: 10–11). См. Powell Barry B. Writing: Theory and History of the Technology of Civilization. Chichester, England: Wiley– Blackwell, 2009; Rudgley Richard. The Lost Civilizations of the Stone Age. New York: Free Press, 1999; Schmandt-Besserat Denise. How Writing Came About. Austin: University of Texas Press, 1996; Schmandt-Besserat Denise. Before Writing, vol. 1, From Counting to Cuneiform. Austin: University of Texas Press, 1992; Schmandt-Besserat Denise. Before Writing, vol. 2. A Catalog of Near Eastern Tokens. Austin: University of Texas Press, 1992. Разумеется, у исследователей нет единого мнения в данном вопросе. Кто-то считает, что в Египте письменность возникла совершенно независимо и иным образом. См. Mitchell Larkin. Earliest Egyptian Glyphs // Archaeology 52, no. 2 (март/апрель 1999 г.), доступно в сети Интернет: http://goo.gl/tM3GEQ.
12
Классическую игру в «двадцать вопросов» можно также назвать «два с половиной байта», поскольку именно такой объем информации вы должны собрать, прежде чем высказать свою догадку.
13
Подсчеты содержатся в отчете IDC Digital Universe report. См. Gantz John, Reinsel David. The Digital Universe in 2020 // EMC Corporation (декабрь 2012 г.). Доступно в сети Интернет: http://idcdocserv.com/1414. См. также: Data, Data Everywhere // Economist (25 февраля 2010 г.). Доступно в сети Интернет: http://goo.gl/VsXh5P. Bohn Roger E., Short James E. How Much Information? 2009 // Global Information Industry Center (январь 2010 г.). Доступно в сети Интернет: http://goo.gl/pt0R; Lyman Peter, Varian Hal R. How Much Information 2003? // University of California at Berkeley. Доступно в сети Интернет: http://goo.gl/vpo9N.
14
Мы исходим из предположения, что для записи типичного бита требуется примерно шесть миллиметров. В определенной степени это зависит от соотношения единиц и нулей, поскольку «1» очень узкая. Типичный размер букв в рукописном тексте рассматривается в работе Kamath Vikram et al. Development of an automated handwriting analysis system // ARPN Journal of Engineering and Applied Sciences 6, no. 9 (сентябрь 2011 г.). Доступно в сети Интернет: http://goo.gl/4mlkTm.
15
Таким образом, проблему подсчета овец можно будет считать полностью решенной, если только Вселенная не расширится очень сильно.