Итоги Итоги - Итоги № 36 (2013)
Неоцифрованный / Hi-tech / Бизнес
Неоцифрованный
/ Hi-tech / Бизнес
Почему в культурном пространстве страны возникла цифровая брешь размером примерно полстолетия
Тот же Лев Толстой, только в цифре: 185-й день рождения классика мировой литературы наша страна отмечает трудовым подвигом сотен добровольцев — они дружно создают электронное собрание сочинений писателя в 90 томах. Как же так? Уж сколько лет говорят о цифровом культурном наследии страны, проводятся конференции, даются президентские поручения, но до сих пор нет полностью оцифрованного под современные стандарты электронного чтения Льва нашего Николаевича? В чем дело?
Цифровизация всего и вся — глобальный тренд, а в части литературы первую скрипку во всем мире играют библиотеки. С одной стороны, они решают цеховую задачу доступности редких и ветхих книг. С другой стороны, являются исполнителями крупных политических проектов типа «Электронной Европы», для которой цифровой контент является базой сохранения европейской идентичности и поддержки мультикультурности. Наша страна идет по аналогичному пути.
Как рассказывает Елена Тихонова, замгендиректора по библиотечной работе Российской национальной библиотеки (РНБ), формирование электронных коллекций библиотек как раз и начиналось с оцифровки старинных книжных изданий, отражающих историю и культуру России. Например, на сайте РНБ можно увидеть уникальный книжный памятник — Лаврентьевскую летопись 1377 года, полностью соответствующую оригиналу вплоть до текстуры бумаги и тона краски, да еще с научными комментариями ведущих специалистов. Региональные партнеры Национальной электронной библиотеки (НЭБ), задуманной как единый портал, интегрирующий библиотечные ресурсы России в единую информационную сеть, передают в НЭБ коллекции, среди которых преобладает краеведческая литература. В рамках совместного проекта РНБ и столичной Российской государственной библиотеки (РГБ) выполняется масштабный проект «Русская классика», охватывающий литературные произведения XVIII — первой половины XX веков. Уже оцифровано свыше 12 тысяч классических произведений 86 авторов: от мировых звезд до литераторов меньшей величины. Только компания «ЭЛАР», по оценкам директора по маркетингу Павла Плотникова, ежегодно отправляет российским библиотекам более сотни комплектов профессионального оборудования для оцифровки книжных оригиналов стоимостью от сотен тысяч до миллионов рублей.
Но вот в чем проблема: во всем мире стандартом де-факто для оцифровки книг является формат PDF — большинство созданных к сегодняшнему дню электронных версий библиотечных книг представляет собой набор отсканированных картинок страниц. Для редких и ветхих экземпляров это, безусловно, отличный вариант, а вот для анализа, скажем, «Войны и мира» школьниками и аспирантами картинки недостаточно. Поэтому сегодня создаются PDF-книги с контекстным поиском (двухслойный файл, в котором графические изображения страниц дополняются автоматически распознанным текстом, но без его верификации) и полнотекстовые электронные книги, полностью идентичные бумажному оригиналу. Чтобы получить такой электронный вариант, с распознанным текстом работают люди — профессиональные корректоры. Именно такую цель — создание эталонной электронной версии преследует проект «Весь Толстой в один клик», начатый два месяца назад, рассказывает Григорий Липич, генеральный директор компании ABBYY Россия, предоставляющей тысячам добровольных помощников ПО автоматического распознавания текстов: «Полное собрание сочинений будет доступно в формате PDF с распознанным текстовым слоем под картинкой и в наиболее популярных форматах электронных книг ePub и fb2». Надо сказать, что волонтеры для таких задач везде в почете.
«До четверти трудозатрат по обслуживанию Нью-Йоркской публичной библиотеки приходятся на волонтеров,— рассказывает Саттар Гюльмамедов, руководитель центра разработки ПО WEXLER.— Там ведь та же ситуация, что и у нас, — оцифровкой книг библиотеки США занимаются в рамках своих бюджетов с помощью коммерческих организаций». Между тем технический прогресс будет идти дальше. «Я не знаю, какие технологии будут доступны через 100 лет, но сейчас мы поступаем так, чтобы после обработки 90-томника у нас помимо форматов PDF, ePub и fb2 также сохранился некий канонический и выверенный материал в виде размеченного текста и иллюстраций, что позволит в будущем создавать представления электронных книг в новых форматах»,— рассказывает Григорий Липич.
По сути, каждая организация, которая берется сегодня за оцифровку книги, изобретает свой велосипед, ведь единых стандартов этого процесса, регламентов и требований к качеству нет. Нет единых форматов и стандартов хранения, защиты от внесения изменений, а также регламента инвентаризации и учета оцифрованных произведений. «Есть правила бумажного комплектования, но на электронные копии эти правила не распространяются,— сетует Павел Плотников.— Библиотеки решают эти задачи самостоятельно и в зависимости от своей продвинутости». И так обстоит дело не только у нас. Еще только идет разработка международного стандарта ISO в части оцифровки материалов исторического и культурного наследия.
Кстати, единой концепции использования цифровой литературы в школе у нас тоже нет, и это дает четкий ответ на вопрос, далеко ли нашей стране до электронных учебников литературы? Как до звезд. Фекла Толстая, руководитель проекта «Весь Толстой в один клик», завотделом развития Государственного музея Л. Н. Толстого, планирует выпуск специальных приложений для школьников, посвященных произведениям Толстого из школьной программы, — своего рода мультимедийных электронных энциклопедий с текстами, озвучкой, фотоматериалами, включая ответы на вопросы учителя. «Сейчас в Интернете можно скачать тысячу сочинений и рефератов, а мы готовы предоставить материалы, за качество которых будем отвечать»,— говорит праправнучка писателя. Но для этого подвиг оцифровки, систематизации цифрового наследия и создания приложений придется совершить потомкам Достоевского, Пушкина, Салтыкова-Щедрина. Да еще договориться с Минобразования о единых форматах и месте хранения эталонных электронных собраний сочинений знаменитых предков. Нет, этот интеграл не берется. Но почему бы этим вопросом не заняться библиотекам? Причин несколько.
Для того чтобы перейти на современные форматы электронных книг, библиотекам потребуется обновить ПО и провести конвертацию всех PDF-файлов в полнотекстовые версии. Но как отреагируют на запрос соответствующих средств чиновники и общественность? Опять деньги и опять на оцифровку того же самого? К тому же, замечает Саттар Гюльмамедов, при выборе книг для оцифровки библиотеки руководствуются частотой запросов читателей: «Редко кто пойдет в библиотеку за Толстым, Достоевским или Пушкиным. Ориентируясь на вкусы своих читателей, библиотека не будет оцифровывать «Анну Каренину» или «Евгения Онегина». Да еще издатели, мягко говоря, не приветствуют деятельность библиотек по созданию электронных коллекций.
«Весь пафос противников предоставления библиотекам права на оцифровку связан с необоснованной обеспокоенностью относительно ее последующего неконтролируемого распространения. Фактически библиотеки рассматриваются как возможные пособники пиратов,— возмущается Владимир Фирсов, президент Российской библиотечной ассоциации.— Никогда библиотеки не были и не будут источником пиратского контента в сети Интернет». Надо сказать, что и сами издатели не сильно спешат в оцифрованное книжное будущее. По оценкам Саттара Гюльмамедова, хорошо, если десятая часть российских издателей решилась начать продажи электронных изданий: оцифровывать горячие бестселлеры — значит отдавать свой заработок пиратам, а прочие не востребованы читателями. Почему же они ведут себя подобно собакам на сене? У Ивана Засурского, завкафедрой новых медиа и теории коммуникации факультета журналистики МГУ есть четкий ответ: «Главная проблема в плане оцифровки сегодня — это давление книжного лобби по современным книгам».
«Определенное противостояние правообладателей и библиотек существует, так же как интернет-индустрии и правообладателей,— поясняет Владимир Фирсов.— Данное противостояние носит сущностный характер, ибо библиотекари обеспокоены правом публичным, то есть правом граждан на доступ к информации, а правообладатели — правом частным, то есть правом на получение материального вознаграждения». При этом обе стороны конфликта играют на разных полях: правообладателям более интересен актуальный ходкий товар, а библиотеки горюют над несчастной судьбой так называемых сиротских произведений — тех, для которых нельзя найти правообладателей.