Работа со штампом
Работа со штампом
Поиск и распознавание штампа (индексация)
Отсканированный документ может быть помещен в систему документооборота. Для поиска этого документа формируется карточка с атрибутами, полностью его описывающими (шифр, наименование и т.д.). Всю эту информацию можно взять из штампа документа. Уникальной особенностью RasterID является поиск графического изображения штампа (титульного блока) на отсканированном документе, разбиение его на отдельные ячейки и распознавание текста в этих ячейках.
Для обучения программы тому или иному типу титульного блока достаточно обвести такой титульный блок прямоугольником -- RasterID распознаёт структуру штампа, создает список полей, которые могут быть поименованы и использованы как имена полей базы данных.
Распознавание текста (Abbyy Finereader)
В состав RasterID 3.6 включен дополнительный модуль распознавания текста FineReader 9 от компании ABBYY. Модуль распознавания текста FineReader 9 способен распознавать как печатный текст (типографский, машинописный), так и текст, написанный печатными буквами от руки на разных языках.
Опции FineReader позволяют настроить его под конкретную задачу. Его настройки позволяют указать:
- язык распознаваемого текста: один из сорока вариантов, включая комбинацию «русско-английский»);
- тип печати текста: например, если текст напечатан на пишущей машинке или на матричном принтере, следует выбрать соответствующий вариант;
- предпочтительный вид символов: прописные, строчные или цифры;
- FineReader предоставляет дополнительные возможности по поиску штампа и распознаванию полей. В некоторых случаях это может улучшить качество распознавания;
- возможно использование пользовательских OCR-символов из указанной библиотеки при распознавании текстов.
FineReader выполняет распознавание с хорошим качеством без дополнительного обучения (при условии, что параметры заданы верно, например, язык).
Распознанный текст со всего растрового изображения или с его фрагмента можно записать во внешний файл в формате *.txt
Передача распознанных данных из штампа
Графический фрагмент штампа и распознанный текст можно передать во внешнюю базу данных или систему документооборота с помощью Приемника данных. В RasterID уже реализованы наиболее распространенные приемники данных, такие как MS Excel, MS Access, TDMS, ODBC (для системы документооборота), текстовый файл с разделителями. При необходимости пользователь может самостоятельно создавать и подключать приемники данных к своим системам.