Михаил Кондратович - Создание электронных книг в формате FictionBook 2.1: практическое руководство (beta 4)
Этот формат был специально разработан компанией Micro$oft в 1987 году для переноса текста с разметкой из одной программы в другую. В таком качестве он используется и по сей день. RTF понимают практически все современные текстовые редакторы и издательские системы.
Полиграфичность. Выше среднего.
Масштабируемость. Почти абсолютная.
Кроссплатформенность. Очень высокая.
Конвертируемость. Очень высокая.
Гипертекст. Нет.
Возможность редактирования. Абсолютная.
RTF до сих пор широко используется в русскоязычных онлайн-библиотеках. Главным образом, именно из-за его хорошей совместимости с различным программным обеспечением.
Документ Micro$oft Word (.DOC)Формат DOC — это внутренний формат Micro$oft Word и предназначен для хранения текстовых документов, подготовленных в этой программе. Распространенность Micro$oft Office и Micro$oft Word как его части, обусловила широкое распространение формата DOC.
Полиграфичность. Высокая.
Масштабируемость. Высокая.
Кроссплатформенность. Ниже среднего.
Конвертируемость. Высокая.
Гипертекст. Присутствует.
Возможность редактирования. Абсолютная.
По скромному мнению автора, документы Word используют в качестве e-book только по одной причине — авторам книги (или сканнеристам ;)) ) просто-напросто лень конвертировать его в более удобочитаемый формат.
Документы HTML (.HTM; .CHM; .MHT)Язык HTML (HyperText Markup Language) используется для отображения информации в сети Интернет.
Полиграфичность. Высокая.
Масштабируемость. Очень высокая.
Кроссплатформенность. Практически абсолютная.
Конвертируемость. Практически абсолютная.
Гипертекст. Разумеется, есть.
Возможность редактирования. Абсолютная.
Хотя НTML позволяет неплохо оформить текстовый документ, он все же не слишком подходит для e-book. Далеко не всем нравится читать книги в браузере. При использовании же программы-ридера, HTML конвертируется в обычный текст и теряет все свои преимущества.
А вот формат CHM, первоначально предназначавшийся для подготовки файлов справки к программному обеспечению, — дело иное. Компактность и высокая интерактивность делают его весьма удобным для различных электронных руководств и справочников.
В частности, очень эффектно смотрятся в CHM компьютерные руководства издательства O'Reilly.
Однако, при всех этих достоинствах, у CHM есть и очень большой недостаток. Это формат справки и он жестко привязан к Windows. Решит Micro$oft поменять формат справки в следующей версии «форточек» и с накопленным объемом книг придется попрощаться.
* * *У всех вышеперечисленных форматов есть один существенный недостаток — они ИЗНАЧАЛЬНО НЕ ПРЕДНАЗНАЧАЛИСЬ для создания электронных книг. Созданные на их основе файлы даже не являются книгами — это просто текстовые документы.
Как ни странно, из этого же недостатка вытекает и достоинство — чтобы читать их не требуется специального программного обеспечения. Достаточно стандартных средств, встроенных в операционную систему.
Форматы, описанные далее, уже требуют установки специальных программных средств для их просмотра.
Adobe Acrobat (.PDF).Первоначально PDF разрабатывался для нужд полиграфии. В основном для платформенно-независимого переноса макетов. В последние годы интенсивно продвигается как формат для создания e-book.
Полиграфичность. Абсолютная. Для того и был разработан. Как следствие, PDF-файлы могут быть весьма увесистыми.
Масштабируемость. Низкая! На портативных устройствах читать PDF проблематично.
Кроссплатформенность. Cредняя.
Гипертекст. Есть.
Возможность редактирования. Низкая. К тому же, для этого нужно устанавливать громоздкий Adobe Acrobat.
Основной аргумент против массового применения PDF для изготовления e-book — это большой объем файла и неудобство чтения на портативных устройствах.
Впрочем, качественные книги и журналы, сформатированные на страницы размером более A5, трудновато читать даже на 21'' мониторах.
===============================
Вообще, формат PDF предназначен, в первую очередь, ДЛЯ ВЫВОДА НА ПЕЧАТЬ.
===============================
Существуют и другие форматы, аналогичные PDF. Например, формат Zinio, предназначенный специально для выпуска в электронном виде периодических изданий, в частности глянцевых журналов.
DeJaVU (.DJVU)Формат DJVU был создан компанией АТ&T специально для компактного представления информации в Internet. Подобно MP3 и Divx, он пришелся ко двору и произвел маленькую революцию в деле свободного распространения контента.
Полиграфичность. Высокая.
Масштабируемость. Весьма средняя. Зависит от того, насколько хорошо программа-просмотрщик поддерживает anti-aliasing. [1.4]
Кроссплатформенность. Средняя.
Конвертируемость. Ниже среднего.
Гипертекст. Есть подобие.
Возможность редактирования. Средняя.
Формально, файлы созданные с использованием DJVU трудно называть книгами. Это, по существу, растровый многостраничный графический файл. При его создании специальные алгоритмы отделяют текст от фона и иллюстраций, после чего они сжимаются с различным разрешением. Что и обеспечивает чрезвычайно высокое сжатие картинки (примерно 1:500) при более чем приемлемом качестве изображения. Эти свойства делают его идеальным для множества сканированных компьютерных (и не только) руководств и пособий, которыми сейчас завалены варезные сайты (такие книги еще называют «освобожденными» ;)) ). Ведь, если книга содержит примеры исходников программ, формулы, схемы или сложные таблицы, то даже незначительные ошибки при OCR могут непоправимо испортить ее. A DJVU позволяет представить книгу «как есть».
Причем интересы читателей, привыкших парой щелчков копировать нужный кусок текста в буфер, тоже учтены. Последние версии формата DJVU могут содержат чисто текстовый слой.
Справедливости ради, следует заметить, что DJVU, более чем хорошо справляющийся с текстами и штриховыми иллюстрациями, пасует перед изданиями, содержащими цветные фото и рисунки — иллюстрированными энциклопедиями и глянцевыми журналами. Выглядят такие издания в DJVU весьма непрезентабельно.
Закрытые специализированные форматыСуществует довольно много форматов электронных книг, которые были созданы для одного конкретного устройства или программы.
К ним можно отнести Rocket e-book (.rb), Micro$oft Reader (.lit), PalmDoc, MobiPocket (.prc) Jinke Book Wolf (.wol) и т.д. Плюс, некоторые программы для чтения норовят сконвертировать текст в свой собственный, ни с чем не совместимый формат (IceBook Professional на PC, iSilo и Weasel на Palm и прочие). Правда, при близком рассмотрении оказывается, что это все те же HTML, RTF или txt (некоторое исключение составляет формат ExeBook, который конвертирует текст книги в исполняемый файл, содержащий набор растровых картинок), как правило, упакованные для компактности, и снабженные служебной областью, где могут храниться, например, закладки. Также (и чаще, чем хотелось бы) может быть добавлена DRM.
Полиграфичность. Зависит от конкретного формата. Средняя или выше среднего.
Масштабируемость. Средняя или выше среднего.
Кроссплатформенность. Низкая. Обычно такие форматы создаются для одного конкретного устройства или программы. Просмотр на PC или, соответственно, КПК нередко возможен только с помощью программ, написанных энтузиастами.
Конвертируемость. Низкая. Обычно только через софт, опять же написанный энтузиастами.
Гипертекст. Чаще всего есть.
Возможность редактирования. Низкая или вообще никакая.
И, наконец…
Специализированные открытые форматы на основе XML
Что такое XML, подробно описано ниже. Сейчас нас интересуют лишь сравнительные характеристики формата.
Полиграфичность. Высокая. Правда, всецело зависит от программы-ридера.
Масштабируемость. Почти абсолютная.
Кроссплатформенность. Практически абсолютная.
Конвертируемость. Практически абсолютная.
Гипертекст. Есть.
Возможность редактирования. Как правило, абсолютная.
Как видим, язык XML имеет наилучшее сочетание качеств, необходимых для e-book. Поэтому попытки делать e-book на его основе уже предпринимались неоднократно и небезуспешно.
В отличие от txt, RTF, DOC, HTML, PDF, и т.д. которые однозначно ориентированы на отображение или хранение текстовых данных, форматы на основе XML позволяют структурировать книгу.