KnigaRead.com/
KnigaRead.com » Компьютеры и Интернет » Программы » Б. Леонтьев - Секреты сканирования на ПК

Б. Леонтьев - Секреты сканирования на ПК

На нашем сайте KnigaRead.com Вы можете абсолютно бесплатно читать книгу онлайн Б. Леонтьев, "Секреты сканирования на ПК" бесплатно, без регистрации.
Перейти на страницу:

В диалоговом окне Открыть файл с блоками в разделе Применить к активизируйте один из переключателей:

• Всем страницам (если вы хотите наложить шаблон на все страницы пакета).

• Выделенным страницам (если вы хотите наложить шаблон только на выделенные страницы).

Нажмите на кнопку Открыть.

Глава 32.

Распознавание

Задача распознавания состоит в том с тем, чтобы преобразовать отсканированное изображение в текст, сохранив при этом оформление страницы. Прежде чем приступить к распознаванию текста, необходимо установить основные параметры распознавания: язык распознавания, тип печати распознанного текста и тип страницы.

Важно: Перед запуском распознавания проверьте установленные опции: язык распознавания, тип печати распознаваемого текста и тип страницы.

Вы имеете возможность:

• Распознать блок или несколько блоков, выделенных на изображении.

• Распознать открытую страницу или все страницы, выделенные в диалоговом окне Пакет.

• Распознать все нераспознанные страницы пакета.

• Распознать все страницы в фоновом режиме. В этом режиме возможно распознавание с одновременным редактированием уже распознанных страниц.

• Распознать страницы в режиме распознавание с обучением. Данный режим используется в основном для распознавания текстов, использующих декоративные шрифты, или распознавания большого объема (более 100 страниц) документов плохого качества печати.

• Распознать страницы одного пакета на нескольких компьютерах одновременно.

Запуск распознавания

Нажмите на кнопку 2-Распознать на панели Scan and Read. Из меню Процесс выберите необходимую команду:

Распознать — чтобы распознать открытую страницу или все страницы, выделенные в диалоговом окне Пакет;

Распознать все — чтобы распознать все нераспознанные страницы пакета;

Распознать Блок — чтобы распознать блок или несколько блоков, выделенных на изображении;

Запустить фоновое распознавание — чтобы запустить распознавание в фоновом режиме.

Кнопка 2-Распознать запускает распознавание открытого изображения. Для того, чтобы изменить режим кнопки, нажмите на стрелку справа от нее и из открывшегося меню выберите необходимую команду.

Важно: В процессе распознавания уже распознанной страницы перераспознаются только отредактированные и добавленные блоки.

Язык распознавания

FineReader поддерживает распознавание как одноязычных, так и многоязычных (например, английско-французских) документов.

Для того, чтобы указать язык распознаваемого текста, выберите соответствующую строку в списке на панели Распознавание.

В случае, если вы хотите распознать документ, написанный на нескольких языках:

В списке языков на панели Стандартная выберите команду Выбор нескольких языков… в раскрывшемся диалоговом окне Язык распознаваемого текста укажите несколько языков. Для этого активизируйте опции с соответствующими названиями языков.

Важно: В случае, если вы часто используете какую-либо комбинацию языков, то создайте новую группу, содержащую эти языки (возможно только в версии FineReader Office).

Важно: Увеличение количества подключенных к распознаванию одного документа языков может привести к ухудшению качества распознавания. Не рекомендуется подключать более 2-3 языков.

Перед запуском распознавания проверьте подключенные на закладке Форматирование шрифты: они должны содержать все символы языка распознавания. В противном случае распознанный текст будет неправильно отображен в диалоговом окне Текст (в словах на месте некоторых букв стоят значки "?").

В случае, если необходимый язык отсутствует в списке, то возможны следующие варианты:

• Данный язык не поддерживается системой FineReader.

• Язык исключен из списка языков отображаемых на панели Стандартная. В этом случае в списке языков на панели Стандартная выберите команду Выбор из полного списка языков и в раскрывшемся диалоговом окне Язык распознаваемого текста укажите необходимый язык.

• Язык не был установлен (была выбрана минимальная установка) или был отключен при выборочной установке. Для того, чтобы доустановить языки распознавания, запустите программу инсталляции FineReader в режиме покомпонентной установки (Установка дистрибутива по выбору), дезактивируйте все опции, за исключением опции Языки распознавания, и просто нажмите на кнопку Состав. В раскрывшемся списке языков укажите требуемые языки.

Важно: В процессе установке проверьте, что вы указали ту же папку, в которую вы ранее установили ABBYY FineReader.

Как подключить язык к списку отображаемых языков

В диалоговом окне Редактор языков (доступ: Сервис к Редактор языков) выберите язык, который вы хотите подключить, и дезактивируйте опцию Показывать в списке языков.

Важно: Вы имеете возможность установить язык распознавания на отдельный блок. Для этого нажмите правой кнопкой мыши на блоке, для которого вы хотите установить язык распознавания, отличный от языка распознавания для всего текста, и из меню выберите команду Свойства. В раскрывшемся диалоговом окне Свойства на закладке Блок в поле Язык распознавания выберите язык распознавания выделенного блока.

Тип печати входного текста

Для большинства текстов тип печати определяется автоматически. Этому соответствует значение Авто (доступ: раздел Тип печати, меню Сервис к Опции, закладка Распознавание).

В процессе распознавания текстов, напечатанных на матричном принтере в черновом режиме или на пишущей машинке, можно добиться более высокого качества распознавания, установив правильный Тип печати: для текстов, набранных на пишущей машинке — значение Пишущая машинка. для текстов, напечатанных на матричном принтере — значение Матричный принтер.

Как поменять тип печати

На закладке Распознавание диалогового окна Опции (доступ: Сервис к Опции) из раздела Тип печати выберите нужную опцию.

Важно: После распознавания текстов, набранных на пишущей машинке или матричном принтере, не забудьте снова выбрать значение Авто при возвращении к типографскому тексту.

Другие опции распознавания

Показывать или не показывать изображение при распознавании

Распознавание группы страниц происходит быстрее, если обрабатываемое изображение не отображается.

На закладке Общие (доступ: Сервис к Общие) дезактивируйте опцию Показывать изображение при распознавании.

Инвертировать блок

Для того, чтобы распознать инвертированные участки изображений (текстовый блок, ячейки таблицы или всю таблицу целиком) нажмите правой кнопкой мыши на инвертированном блоке и из меню выберите команду Свойства. В раскрывшемся диалоговом окне Свойства блока активизируйте опцию Инвертированный.

Распознавание в фоновом режиме

В случае, если вы хотите одновременно с распознаванием редактировать распознанные страницы, вы имеете возможность запустить распознавание в фоновом режиме: из меню Процесс выберите команду Запустить фоновое распознавание.

В строке состояния появится значок. В случае, если для диалогового окна Пакет вами выбран режим показа свойства страниц (доступ: Вид к Вид со свойствами), то напротив распознаваемой страницы в колонке Открыта появится специальный значок. В этом режиме распозна вание автоматически возобновляется, как только в пакете появляются нераспознанные страницы.

Как остановить распознавание в фоновом режиме

Из меню Процесс выберите команду Остановить фоновое распознавание.

Важно: В программе abbyy finereader в режиме Распознавание в фоновом режиме используются опции, установленные в программе до запуска фонового распознавания.

Глава 33.

Как обучить FineReader

Распознавание с обучением

• В программе ABBYY FineReader тексты хорошего и среднего качества, а также шрифты обычного начертания распознаются без предварительного обучения. Поэтому OCR-система может работать в режиме Распознавание с обучением, который позволяет вводить тексты разного качества, набранные практически любыми шрифтами. В режиме Распознавание с обучением вы можете: распознавания текстов, использующих декоративные шрифты; распознавания текстов, в котором встречаются специальные символы (например, отдельные математические символы); распознавания большого объема (более 100 страниц) текста плохого качества.

Перейти на страницу:
Прокомментировать
Подтвердите что вы не робот:*