ABBYY Recognition Server представляет собой высокопроизводительное серверное решение для автоматизации процессов оптического распознавания и конвертирования документов в/из формата PDF в промышленных масштабах. Благодаря серверной архитектуре это приложение особенно эффективно для задач, связанных с обработкой средних и больших объёмов документов.
Архитектура ABBYY Recognition Server позволяет обеспечить не только скорость и высокое качество обработки массивов изображений, но и централизацию управления процессами, масштабируемость, гибкость, надежность потоковой обработки и интегрируемость с другими приложениями.
ABBYY Recognition Server состоит из 4 частей:
Высокое качество распознавания и восстановления оформления документа
Поддерживает до 187 языков распознавания печатного текста, включая языки на основе латинского, греческого, армянского и кириллического алфавитов.
Распознавание многоязычных документов.
Режим быстрого распознавания увеличивает скорость обработки изображений хорошего качества в 2-2,5 раза.
Модуль FineReader XIX обеспечивает распознавания текстов, напечатанных в период с 1600 по 1937 на английском, французском, итальянском и испанском языках. FineReader XIX поддерживает такие специальные шрифты, как Fraktur, Schwabacher и большинство готических шрифтов.
Поддержано распознавание различных типов текста: типографская печать, печатная машинка, матричный принтер, MICR (E13B), OCR-A, OCR-B.
Преобразование PDF-файлов
При обработке PDF-файлов Recognition Server определяет наличие текстового слоя и его целостность. Подобный подход обеспечивает значительно более быстрое и качественное преобразование PDF-файлов.
Осуществляется преобразование изображений в файлы формата PDF с возможностью полнотекстового поиска, поддерживает создание PDF-файлов с тэгами.
Поддержана возможность сохранения в создаваемых PDF-файлах различных метаданных: закладок, гиперссылок, кросс-ссылок и т.п
Поддержаны алгоритмы шифрования и другие средства разграничения доступа: сохранение результатов распознавания в виде PDF-файла, защищённого паролем.
Распознавание штрих-кодов
Поддерживает распознавание наиболее популярных 1D" и 2D штрих-кодов (см. в разделе «Спецификация»).
Автоматически идентифицирует и распознаёт штрих-коды, расположенные на документе под любым углом по отношению к горизонтали.
Конвертация документов
Экспорт распознанного текста в различные форматы (полный перечень форматов см. в разделе «Спецификация»).
Распознанный документ может быть одновременно сохранен в нескольких различных форматах.
Контроль качества распознавания
Доступна установка порога качества распознавания изображений, основанная на допустимом количестве неуверенно распознанных символов на страницу.
Обработка заданий
Настройка процесса обработки
Предусмотрена детальная настройка процесса обработки документов, в течение которого задания отправляются от одного ресурса к другому (входящая папка -> станция обработки -> исходящая папка).
Изменение настроек обработки по умолчанию
Возможнос помощью XML-описания - файла формата XML, который содержит параметры обработки документа или набора документов (расположен во входящей папке вместе с изображениями, которые надо обработать).
Анализ результатов обработки
Возможнос помощью XML-результата - файла формата XML, который содержит информацию о процессе обработки, параметрах, статистические данные и результаты обработки задания (расположен рядом с результатами в исходящей папке, если задание выполнено успешно, и в папке исключений в ином случае).
Возможно планирование обработки заданий, то есть настройка очерёдности обработки заданий, включая назначение приоритетов, времени (день, месяц, час), количества вызовов для обработки (например, раз в день).
Доступно выставление приоритетов выполнения заданий,в соответствии сприоритетамиформируется очередь заданий.
Отказоустойчивость
Предусмотрены следующие возможности, с помощью которых ведётся автоматический контроль работы ABBYY Recognition Server без вмешательства человека:
Многопроцессорная работа
Интерфейс консоли управления использует Microsoft® Management Console (MMC) в качестве сервиса для визуализации управления приложением.
Доступна настройка параметров процессов обработки, приоритетов выполнения заданий и порога качества распознавания. Возможно изменение очерёдности выполнения заданий.
Реализована возможность вести журнал событий и контролировать работу сервера (например, получать уведомления в случае непредвиденных ситуаций).
Интеграция с другими приложениями
PDF
Форматы сохранения документов:
Rich Text Format (*.RTF)
Microsoft Word XML (*.XML) (толькодля Microsoft Office Word 2003)
XML со схемой представления данных (*. XML ).
Adobe® Acrobat® (*.PDF)
HTML. Поддержаны различные кодовые страницы Windows, DOS, Mac, ISO и кодовые страницы Unicode ( UTF-8).
Microsoft PowerPoint (*.PPT)
Формат с разделением запятыми (*. CSV ). Поддержаны различные кодовые страницы Windows, DOS, Mac, ISO и кодовые страницы ( UTF-16, UTF-8).
Обычный текст (*.TXT ). Поддержаны различные кодовые страницы Windows, DOS, Mac, ISO и кодовые страницы Unicode ( UTF-16, UTF-8).
Microsoft Excel (*.XLS)
DBF. Поддержаны различные кодовые страницы Windows, DOS, Mac, ISO .
Языки распознавания
Поддержано до 187 языков распознавания печатного текста (OCR):
Двумерные: PDF 417.
Системные требования
Менеджер сервера(Server manager)
Операционнаясистема Microsoft® Windows® Server 2003, Windows XP, Windows 2000.
Оперативная память: 128 Мб.
Пространство на жёстком диске: 15 Мб для установки, плюс 100 Мб для работы программы.
Необходимо иметь права на чтение и запись для следующих разделов системного реестра: