KnigaRead.com/
KnigaRead.com » Компьютеры и Интернет » Программирование » IvanStorogev? KpNemo - Как почистить сканы книг и сделать книгу

IvanStorogev? KpNemo - Как почистить сканы книг и сделать книгу

На нашем сайте KnigaRead.com Вы можете абсолютно бесплатно читать книгу онлайн IvanStorogev? KpNemo, "Как почистить сканы книг и сделать книгу" бесплатно, без регистрации.
Перейти на страницу:

2. Тут на сцену выходит инструмент. Знакомьтесь – ScanKromsator от многоуважаемого bolega. Да, знаю, сейчас понабегут кромсаторы, начнут бурчать, мол народу это не надо, народ этого не понимает, руки прочь от их Кромсатора, мол чтоб Кромсатором пользоваться, три года учиться надо. Ну да и фиг с ними, пускай ворчат. Но в одном они правы: ScanKromsator – мощный инструмент, со многими полезными и не очевидными для новичка функциями. Сам я в нём тоже, мягко говоря не силён, но не бойтесь, это не должно нам помешать. Хоть программа и бесплатна, но не забываем перед каждым её запуском говорить спасибо.

a) Запускаем программу и загружаем в неё наши файлы:

b) Выбираем путь для вывода результатов (закладка Files), тут же можно назначить способ нумерации выходных файлов, и что Очень Важно, назначить выходное разрешение 600 dpi:

c) Находим левее кнопки с наdpiсью Process кнопочку с ножницами (Draft kromsate), появляется окно диалога:

Ставим галочки на Split pages и safe top/bottom, ну и жмём кнопку OK. Теперь можно идти попить чай.

d) Через 10 минут:

Обратите внимание на синенькие полосочки: это резаки, за их пределами все будет безжалостно отрезано, а данная страница будет разрезана на две (центральные резаки). Посмотрите на то, что рядом с названиями страниц появились зелёные галочки!

e)Расставляем опции. Для этого пройдемся по закладочкам (в окне слева).

Первая Pages.

На ней выставляем способ центрирования. По умолчанию стоит "автомат", это значит поместить изображение в верхний левый угол. Но, как правило (это у меня так) горизонтальное выравнивание ставится по центру (Page h.align) C, вертикальное в низ (Page v.align) B.

Despeckle – это убирание мелкого мусора. Deskew – выравнивание наклона страницы, если страница получится криво выровненной, для нее можно включить метод Art.

Опять важно, чтобы опция была применена ко всем страницам – при выборе опции удерживаем Ctrl. Аналогично при выборе остальных опций, которые применяются ко всем страницам сразу.

На закладке Book выставляем размеры выходных страниц, оставляем Page width и height в Auto. Тут я немного не понимаю, как это работает при изменении dpi, но экспериментально я ставлю H.Gap value в 250(300) pixels.

В закладке Files, как было сказано выше, ставим выходное dpi 600, это архи важно. От этого зависит весь окончательный результат.

Во вкладке Options, можно оставить как есть. Или выбрать для Despeckle метод Fine, это уникально-интеллектуальный метод очистки. Например, он не вычищает точки над i и j.

Options 2 пропускаем.

Вкладка Convert – выставляем порог для преобразования из градаций серого в черно-белый. Я обычно выбираю между 170 и 200, надо попробовать, что лучше в конкретном случае. Не забываем удерживать Ctrl при выборе опции, предназначенной для всех страниц.

Ну, и наконец последняя, но очень важная вкладка Quality:

В Enhance image я ничего не понимаю, знатоки фотошопа и так поймут, что делать, лично я делаю, как на иллюстрации. Хотя хотелось бы услышать про оптимальный набор этих параметров.

И опять очень важно, если у вас исходник – это разворот книги, то жмём на Gray enhance, и появляется диалог Gray image enhance, в нём ставим cleaner passes в 1. По этой опции происходит выравнивание освещённости в центре разворота. Незаменимая штука.

f) Тут опять придется попотеть, но к счастью не много. Надо пройтись по всем страницам, с целью проверки правильности расстановки резаков. Если Вы увидите, что автоматически для какой либо страницы резаки установились не правильно, то их надо поправить. Для этого надо снять зелёную галочку, еще раз повторяю снять зелёную галочку, перед вносимыми изменениями. Иначе они будут проигнорированы. Передвигаем резаки, возможно меняем способ центрирования для данной страницы, возвращаем зеленую галку и идем дальше, к следующей странице.

g) Уфф! (Кстати, знаете ли Вы, чтобы все не делать заново, задание можно сохранить).

e) Жмем большую кнопку Process. Тут появляются предупреждения, в здравом ли мы уме, что меняем разрешение, но нам уже всё равно, мы всё уже сделали.

Всё, идём играть в футбол, или спать. Дело сделано, пусть компьютер теперь думает.

На моём компьютере (Pentium M 1400 MHz), этот, блин, процесс занимает порядка полуторы минуты на разворот (если не менять разрешение, то около 15 сек, но мы всё же будем удваивать разрешение).

Часа через три, в указанной ранее папке, нас ждёт результат, смотрим его внимательно, иногда могут быть несколько неправильно выровненных страниц. Их переделываем отдельно.

Особо дотошные, могут почистить остатки в ручную, так называемая тонкая очистка. Лично я это не делаю, за исключением убирания библиотечных штампов, и записей на полях типа: «а это батенька архиважно». Как правило, и так все замечательно.

В итоге получились примерно такие результаты: исходный скан (градации серого 300 dpi), результаты после кромсатора 600 dpi, и тоже 300 dpi. Бумажный исходник – макулатурная бумага.

Не заметить разницу сложно. И это с использованием всего около 10% возможностей этой замечательной бесплатной программы.

Раньше, когда я встречал, мол книга сделана в 600 dpi, я пожимал плечами и шёл дальше, мол, у богатых свои причуды. Но, оказывается, всё гораздо проще: 600 dpi – это ж после обработки! Ну раз так, то грешно теперь портить свой труд, когда можно получить заметно лучший результат, без особых мышечных усилий. Если Вы скачаете эту книгу и результат Вас удовлетворит, то смело можете повторить этот процесс.

Мне кажется, сделать данную работу со много меньшими затратами человеческого ресурса, вряд ли возможно. Естественно возможны и другие рецепты. Есть BookRestorer, есть RasterID, некоторые пропускают сканы для сглаживания текста через CPCTool. Пусть кто-нибудь расскажет и покажет. Но еще раз спасибо bolega за его программу, её и одной достаточно для многого.

Что делать дальше? А что Вам хочется. Можете распознать, можете собрать pdf, но для научно-технической литературы принято жать в djvu. Да, в этом, я тоже не эксперт. В djvu жму самым позорным способом в DjVuEditorPro 4.1.

Асы кромсания, не поленитесь, может тут, надо что-нибудь добавить или поправить. Но только если это принесет заметный глазу эффект, без титанических усилий.

Примечание автора статьи: Если читать мой СканКромсатор для Думмис:) с КпНемо, то там надо исправить:

1. Закладка Book при 600 dpi H.Gap value обычно хорошо получается при 200.

2. Закладка Options Deskew method – interpolate. 3. Закладка Convert – MiddleDark.

А в целом надо слушаться старших, т.е. bolega .:)

Примечание читателя (Alexx_S):

– 1.Последняя версия 5,52beta.

2.Если во время кромсания отрезаются номера страниц, то можно на закладке Options2 увеличить чувствительность текста (text sensitivity).

3. Для порога преобразования существуют предопределенные значения, в большинстве случаев их хватает, лично я чаще всего использую Middle Dark.

4. Для того, чтобы переделать отдельную страницу надо нажать на панели инструментов кнопку:

– process current file – разворот

– process left page – левая страница

– process right page – правая страница

5. Окно просмотра результата. После его закрытия повторный вызов осуществляется командой меню Result-›View All.

Кроме того, окно просмотра результа является также редактором постобработки, обладающим уникальными инструментами, главный из них – чистка мусора.

Для того, чтобы наиболее эффективно его использовать надо сделать следующее:

1. Правый клик, включаем опции AutoSave, AutoClear.

2. ClearOptions настраиваем как на рисунке:

В результате:

1. Весь мусор, размер которого меньше 15 пикселей, подсвечивается красным.

2. Прямоугольное выделение удаляет весь подсвеченный мусор, не трогая все остальное.

Выделение с клавишей Shift – стирает область.

3. Результат чистки сохраняется при переходе к след/пред. файлу.

Комментарий bolega:

Статья замечательная!

Несколько замечаний.

1. Настоятельно не рекомендуется использовать версию 5.51beta. Там немало багов. Берите 5.52, или еще лучше 5.93.

2. В окошке Gray enhance есть неприметная опция Protect black pixels. По умолчанию она включена. Ее нужно отключать! Тогда убирание теней будет намного лучше (эта опция устарела и пришла из старых версий кромсатора).

Если на скане имеется полутоновые иллюстрации, то при выравнивании освещенности они могут сильно пострадать. Чтобы этого не произошло, нужно выделить такие иллюстрации мышкой и в контекстном меню выбрать команду Exclude region. К таким регионам в процессе обработки не будут применяться операции enhance и despeckle. Защита от последнего пригодится и в других случаях, например, для ч/б сканов, содержащих картинки из мелких точек и штрихов.

3. Если нужно убрать тень и мусор от разворота, но при этом не разрезать разворот на две части, то нужно убрать опцию Split, но оставить оба внутренних резака. В этом случае область между ними будет просто очищаться.

Перейти на страницу:
Прокомментировать
Подтвердите что вы не робот:*