Пакетное сканирование документов


Captiva. Программа пакетного сканирования | ocnova.ru

Предназначен для  потокового и ручного сканирования документов.

Объем обрабатываемых документов: до большого объема.

Результат работы хранится в форматах: PDF, PDF/A, XML, RTF, DOC, TXT, HTM

Captiva в процессе сканирования документа

Этап сканирования

Программа для сканирования текстов документов предоставляет возможность, как сканировать документы через станции сканирования, так и использовать документы из локальной сети, а также из электронной почты.

Документы могут поступать с разных станций сканирования разными пакетами.

Поддерживается разделение документов в потоке по пустым листам, листам с разделительным штрих-кодом, по фиксированному количеству страниц в документе, по ключевому слову, фразе  и другое (в зависимости от указанных инструкций в сканере).

 

На этапе сканирования можно осуществлять:

  • Потоковое сканирование, разделение и сборка документов;
  • Ручной импорт файлов в пакет;
  • Отложенная передача пакетов для обработки;
  • Контроль и своевременная корректировка качества сканирования;
  • Обработка и улучшение изображений: поворот, исправление искажений, удаление части изображения, настройка яркости, настройка контрастности и т.д.;
  • Аннотирование изображений;
  • Автоматическое именование документов и папок: по значению штрих-кода, автоматически;
  • Интеграция с информационной системой предприятия.

 

Программа для сканирования текстов документов позволяет сканировать посредствам интерфейсов TWAIN и  ISIS и может работать как в рамках локальной сети, так и удаленно.

 

Результат выполнения этапа: отсканированный документ в формате PDF, PDF/A и др.

 

Этап распознавания

На данном этапе предоставляются возможности:

  • Поддерживается конвертация изображений из форматов JPG, TIF, BMP, PDA, PDF, DOC,XLS и др.
  • Считывание штрих-кодов (одно и двухмерных).
  • Поддержание распознавания различных типов текста: OCR, ICR.
  • Поддержка алгоритмов шифрования.
  • Установка порога качества распознавания изображений.

 

Результат  выполнения этапа: отсканированный документ в формате XML, RTF, DOC, TXT, HTM, PDF, PDF/A и др.

 

Этап верификации

Этап верификации включает:

  • Проверка на неуверенно распознанные символы
  • Проверку полученной от сканирования информации на ожидаемые типы данных.
  • Проверку полученной от сканирования информации на присутствие значений.
  • Редактирование распознанного текста.
  • Формирование учетной карточки документа.
  • Заполнение атрибутов карточки отсканированного документа
    • Автоматически
    • Вручную

На этом этапе, в случае обнаружения ошибок при сканировании и всех неточностей, информация помечается специальными маркеровками для дальнейшего исправления на этапе Коррекции.

При неудовлетворительных результатах распознавания, оператор станции верификации может отправить страницу на повторную обработку.

 

Результат  выполнения этапа: отсканированный документ в формате XML, RTF, DOC, TXT, HTM, PDF, PDF/A и др.

 

Этап коррекции

Оператор обрабатывает информацию, полученную на стадии верификации данных, вносит изменения в результирующую запись вручную.

После корректировки и устранения ошибок, страница будет отправлена на дальнейшую обработку или проэкспортирована

 

Этап экспорта

Документы экспортируются в нужном формате, отправляются по почте, отправляются в СЭД,  публикуются в локальном/ сетевом ресурсе или на корпоративном портале в соответствии с заданными правилами маршрутизации.

 

Результат выполнения этапа: размещение/отправка итогового документа на требуемом ресурсе.

 

 

Средства интеграции с  другими приложениями:
  • Программный интерфейс веб-сервиса (Web Service API):XML-файлы.

    использует SOAP и HTTP;

    работа с удалёнными приложениями;

    кросс-платформенность;

    идеально для предприятий, использующих SOA (сервисно-ориентированную архитектуру).

  • ASCII text файлы.
  • Экспорт данных через интерфейс ODBC.
  • В наличии компоненты для бесшовной интеграции с такими системами как: Documentum, SAP r/3, FileNet, SharePoint, OpenText и др.

 

Технические требования для программы сканирования:
  • ОС:  Windows 2003 и выше
  • СУБД: Microsoft SQL Server

 

Более подробную информацию о продукте можно узнать:EMC DOCUMENTUM – Leverage information to transform your business.

См. похожие статьи по теме:

 

Описание технологии распознавания текста ABBYY Recognition Server

Описание технологии распознавания текста ABBYY FlexiCapture

 

 

 

Дорогие читатели, если Вы нашли ошибку в тексте, пожалуйста, сообщите мне об этом, выделив ошибку и нажав комбинацию Shift + Enter или же нажмите сюда, чтобы сообщить нам.

GD Star Ratingloading...

Captiva. Программа пакетного сканирования, 4.5 out of 5 based on 4 ratings

ocnova.ru

Блог UNIT6.ru: Вышла [email protected] beta3

Мы выпустили четвертую по счету версию [email protected], которая предоставляет людям новый способ сканирования документов. По сети, без драйверов, без каких-либо программ и удаленных рабочих столов — для работы со сканером теперь достаточно только браузера, сканировать документы теперь можно даже с телефонов и планшетов.

Первая версия, alfa — была экспериментальной, ею могли воспользоваться только «гики». Вторая, beta1 — не у всех устанавливалась. Третья, beta2 — у всех устанавливалась, но еще не у всех работала. И если до сих пор это была программа, написанная за несколько вечеров, то в новую версию, beta3, мы вложили гораздо больше усилий, чтобы это был полноценный продукт, который бы естественным способом решал большинство задач пользователей сетевого сканирования.

Вот, что из этого получилось:

Полностью самостоятельная работа с TWAIN-устройствами

Раньше мы использовали CmdTwain — консольную утилиту, которая умела сканировать и возвращала нам итоговый файл в нужном формате. Но, к сожалению, она работала не со всеми сканерами. И самое обидное — не было возможности выяснить, почему это происходит и можно ли что-то с этим сделать. По нашим оценкам, если бы не эта обидная вещь, количество реальных пользователей программы на сегодняшний день могло бы быть уже не 200-300, а 500-600.

Мы изучили 700-страничный мануал по TWAIN, и даже больше. В нашей реализации сканирования была решена часть проблем, которые возникали с CmdTwain на наших сканерах. Конечно, у нас нет нескольких сотен сканеров, на которых можно было бы проверить процедуру сканирования и сказать, что наша программа совместима с 99% сканеров; и это — основная причина, почему мы все еще называем этот релиз beta. Но, мы надеемся, что у всех все заработает, а если вдруг и не заработает — мы точно сможем отладить и разобраться в ситуации, почему так происходит, поэтому обязательно напишите нам — стала ли работа со сканером надежнее, или нет.

Но, мы уже сейчас знаем, что даже в таком варианте мы работаем с некоторыми специфичными сканерами немного лучше, чем, например, стандартная программа сканирования в Windows 8.1. У нас такие сканеры работаю корректно — наверное, мелочь, но приятно.

Возможность выбора источника сканирования

Благодаря самостоятельности по работе с TWAIN, если на компьютере есть несколько сканеров, мы теперь предлагаем пользователям выбрать, с какого сканера необходимо сканировать. Кстати говоря, это действительно повышает совместимость со сканерами по сравнению с CmdTwain, потому что некоторые очень умные сканеры существуют в двух экземплярах, но реально работает только один — из-за этого иногда CmdTwain раньше и не могла сканировать. И если вдруг в списке несколько сканеров и один из них не работает — необходимо выбирать другой. По опыту рекомендуем выбирать те сканеры, которые WIA, если такие есть.

Поддержка разных размеров

Благодаря все той же самостоятельности с TWAIN, мы можем определить, какие форматы поддерживаются сканером и предложить пользователям выбор из доступных размеров для сканирования — от A0-A6 до нестандартных размеров.

Проверка работоспособности сервера при установке

Если при установке веб-сервера сканирования будет обнаружена несовместимость, мы предупредим пользователя об этом и сформируем сообщение, которое нужно отправить разработчикам, чтобы мы смогли помочь разобраться с ситуацией. Хотя, на самом деле, самой популярной причиной не запуска веб-сервера остается конфликт со скайпом, поэтому мы заодно предлагаем попробовать сменить порт.

Работа на другом порту

Если 80 порт занят скайпом или другой программой, то [email protected] можно установить на любой другой порт — для этого есть конфигуратор, который есть в меню Пуск, и который сам отобразится во время установки, если есть проблема с портами.

Пакетное сканирование

Достаточно часто приходится сканировать многостраничные документы. Раньше, в том числе в стандартных программах сканирования, нужно было ходить от компьютера к сканеру. А в случае с веб-сканированием — это еще сложнее, потому что компьютер и сканер могут быть в разных углах кабинета. Теперь же можно переключиться в пакетный режим, задать количество страниц для сканирования, паузу между страницами, чтобы успевать вкладывать новый листок, и идти сканировать. Первый лист также начинает сканироваться с этой паузой, чтобы успеть подойти к сканеру и положить первый лист. Теперь достаточно один раз дойти до сканера и вернуться за компьютер, чтобы получить отсканированный документ.

Сохранение в PDF

Еще одной часто запрашиваемой функцией было сохранение в PDF. Это действительно полезная вещь, когда нужно сканировать несколько страниц, поэтому в разделе пакетного сканирования есть возможность сохранения в PDF. По-умолчанию сканы загружаются отдельными файлами.

Сохранение последних параметров сканирования

Мы заметили, что переход от стандартных программ сканирования на веб-интерфейс к сканеру не только улучшает жизнь пользователей, но и лишает их некоторых приятных фишек, которые в стандартных программах были самим собой разумеющимся. Одна из таких функций — продолжение нумерации файлов при возобновлении сканирования серии страниц через некоторое время. Когда программа работает на том же компьютере, программа может посмотреть в каталог с картинками и увеличить номер последней картинки на единицу. А в нашем веб-интерфейсе теперь есть сохранение порядкового номера по названию серии. Теперь больше не нужно вспоминать самому, сколько же страниц вчера было отсканировано по Договору №9, или сколько чеков мы отсканировали в этом месяце в серии «Чеки за январь».

Мы по-прежнему стараемся отвечать на все вопросы и предложения по этой программе, заданные по почте или в комментариях на странице — пишите, вместе мы сможем сделать отличный и удобный инструмент!

blog.unit6.ru

Статья "Ввод сканированных документов в электронный архив предприятия" из журнала CADmaster №1(16) 2003 (январь-март)

Давно известно, что при создании систем электронного архива и документооборота недостаточно регистрировать только те документы, которые изначально разрабатываются в электронном виде: несмотря на бурное развитие информационных технологий, на бумаге и сейчас хранятся огромные объемы технической, инженерной и технологической документации.

CADmaster уже не раз и достаточно подробно рассказывал о принципах работы с такими документами, позволяющих не отказываться от наработанного за многие годы, а использовать его, к примеру, в новых САПР-проектах. Всё просто: сканируем документы, повышаем их качество при помощи, скажем, программы Spotlight, а затем вводим эти документы в систему электронного архива и документооборота. Такой документ можно использовать в дальнейших разработках, вносить необходимые изменения, добавлять в архив новые версии и т. д. Не будем подробно останавливаться на всех тонкостях — кроме, пожалуй, одного момента…

Рассмотрим детальнее процесс ввода отсканированного документа в систему электронного архива (документооборота). Стандартная процедура здесь выглядит так: заполни поля электронной карточки сканированного документа, укажи файл изображения и нажми соответствующую кнопку. Но теперь представьте, что в вашем бумажном архиве сотни тысяч, а то и миллионы единиц хранения. Обычная технология регистрации документа, предоставляемая стандартной системой архива, сразу оказывается чрезвычайно громоздкой, требует невероятных временных затрат.

Единственный выход — автоматизировать процесс регистрации сканированного документа в электронном архиве. Например, в автоматическом режиме распознавать поля углового штампа, которые по сути являются полями учетной карточки документа, и регистрировать распознанную информацию в электронном архиве. При этом было бы совсем неплохо заодно и поднять качество сканированных изображений.

RasterID 2.0 предназначен именно для таких задач.

Теоретически для решения проблемы автоматизированного ввода нужно не так уж и много:

  • система архива и документооборота должна поддерживать запись информации о файле документа в виде ссылки на «внешний» ресурс;
  • необходим экспорт в систему документооборота всей информации о документах — либо напрямую при помощи дополнительных механизмов системы архива, других внешних приложений, СУБД или ODBC, либо через промежуточный формат *.xls, *.dbf и т. д.

Итак, распознаём в автоматическом режиме необходимые записи штампа (при помощи модуля распознавания текста) и экспортируем эту информацию в базу данных или систему документооборота.

Вот только… не всё так очевидно. Основная проблема в том, что надписи в штампах выполнены, мягко говоря, «не по ГОСТу». Значит, и вероятность безошибочного распознавания подобных надписей не так высока, как хотелось бы. Что делать? «Революционность» RasterID 2.0 — в механизмах решения подобных проблем. Но об этом чуть позже. А сейчас — о возможностях программы.

Сканирование

В RasterID 2.0 реализован механизм работы с любым сканирующим оборудованием.

Модуль WiseScan — это всё, что необходимо для удобного, быстрого и интеллектуального сканирования на всех моделях сканеров Contex. Доступны автоопределение размера сканируемого оригинала, режим предварительного сканирования, точная настройка параметров цветного и монохромного сканирования, пакетное сканирование, автоименование документов по заданной маске (с возможностью включения информации из распознанных полей).

К отсканированным изображениям можно применять предварительно заданную последовательность действий, включающую возможность распознавания штампа, проверки информации и ее экспорта во внешнюю базу данных.

«Виртуальный сканер» — при работе с некоторыми сканерами или инженерными системами (Xerox, KIP, Oce и др.) есть возможность «виртуального» сканирования. Требуется только указать папку, в которой сохраняются сканированные изображения, и составить сценарий обработки, после чего RasterID с установленной вами периодичностью обращается к данной папке и применяет указанную последовательность действий ко всем появляющимся там файлам.

RasterID также обеспечивает прямую поддержку сканеров с TWAIN-интерфейсом.

Повышение качества изображений

Думаю, если вы хоть раз видели отсканированную «синьку», вас не придется убеждать, что качество таких изображений далеко от идеального. Пакет RasterID 2.0 предоставляет различные возможности повышения качества сканированных документов: он позволяет удалять «мусор», заливать «дырки», сглаживать растровые линии, устранять возникающие при сканировании перекосы, обрезать пустые поля и т. д. С помощью операций коррекции изображений по четырем точкам рамки устраняются искажения и корректируется размер самого изображения. Эти и многие другие инструменты могут применяться в автоматическом (пакетном) режиме: или параллельно с процессом сканирования, или к указанному набору ранее отсканированных изображений.

Работа с цветными изображениями

Нужно ли работать с цветными изображениями в архиве технической документации? Опыт показывает, что да. К примеру, монохромное сканирование материалов невысокого качества (тех же традиционных российских «синек») не приносит желаемого результата: в подобных случаях лучше отсканировать изображение в режиме Gray Scale (256 градаций серого), а затем произвести обработку, повышающую качество. После обработки вы можете сохранить изображение как монохромное или оставить его как есть (Gray Scale).

Кроме того, все чаще появляются цветные чертежи, полученные при печати проектов, выполненных в САПР. Эти документы удобнее сканировать и нагляднее представлять в цвете!

RasterID располагает множеством средств обработки цветных изображений, среди которых инструменты коррекции яркости/контрастности, уровней, палитры, гамма-коррекции, фильтры размытия, контурной резкости, усреднения. Полноцветное изображение может быть приведено к индексированной палитре или преобразовано в градации серого. Есть возможность разделять цветное (серое) изображение на монохромные слои при помощи специальных процедур: бинаризации, уменьшения количества цветов, разделения по цветам.

Если все перечисленные возможности будут предоставлены людям квалифицированным и хорошо обученным, получение изображений отличного качества гарантировано.

Распознавание штампа. Индексация

Остановимся на функциях поиска штампа на чертеже, распознавания надписей в его полях и экспорта полученной информации.

Программу нужно «обучить» распознаванию штампа. Процедура проста: достаточно обвести штамп прямоугольником и, если необходимо, отредактировать распознанную топологию. Далее следует указать те поля, которые содержат необходимую информацию, задать им имена и сохранить темплет (шаблон). Темплеты нужно создать для всех различных по топологии штампов.

Рис. 1. Обучение штампу. При помощи соответствующих программных инструментов указано положение штампа, три поля (децимальный номер, название изделия, материал по ГОСТ), измерены высота текста и угол наклона, подключен дополнительный модуль OCR

При распознавании указанные поля углового штампа записываются в ячейки таблиц приемников данных. Кроме того, и это очень важно, в одно из полей может передаваться графический фрагмент (картинка) углового штампа, что в дальнейшем значительно упрощает проверку достоверности распознанных данных.

О распознавании надписей: пакет RasterID может работать как с внутренним OCR-модулем, так и с OCR-модулем FineReader Pro 5.0. Разумеется, процесс распознавания нуждается в контроле.

Приемники данных

RasterID является открытой системой: при помощи стандартных способов программирования может быть создан модуль экспорта, обеспечивающий прямую передачу распознанных данных из полей углового штампа в архивную систему пользователя.

C RasterID поставляются модули экспорта данных в MS Excel, MS Access, текстовый файл с разделителями; поддерживается передача данных при помощи механизма ODBC. Большинство современных СУБД имеет встроенные механизмы экспорта и импорта, позволяющие «пакетно» импортировать файлы перечисленных стандартных форматов в формат таблиц СУБД (например, Data Transformation Services Wizard, поставляемый с MS SQL Server).

Промежуточный формат также может быть экспортирован при помощи механизмов самой системы архива или других внешних приложений.

Поскольку одним из полей приемника данных является ссылка на файл документа, необходимо, чтобы архивная система работала по ссылке с файлами документов, хранящимися на «внешнем» ресурсе.

Контроль качества распознавания

Не будем строить иллюзий и утверждать, что «распознать можно всё». Качество распознавания в первую очередь зависит от подлинника: распознать печатный текст проще, чем написанный пусть даже строго по ГОСТу, но от руки. А если текст, мягко говоря, «не по ГОСТу» или само изображение — крайне низкого качества? Для таких ситуаций в новой версии пакета предусмотрены встроенные механизмы контроля качества распознавания.

Способ контроля зависит от приемника, в который были экспортированы данные. При экспорте данных в MS Excel для контроля передается фрагмент растра, содержащий штамп. В MS Access используют специальный модуль проверки качества. Если штамп распознается из программы напрямую, для контроля служит диалог Редактирование распознанных данных: он появляется после того как команда Распознать штамп завершила распознавание.

В любом случае контролировать распознавание удается достаточно эффективно.

Пакетная обработка

Все упомянутые выше возможности RasterID могут применяться в автоматическом (пакетном) режиме: программа предлагает мощный и простой в использовании механизм создания командных файлов.

Метод Drag and Drop позволяет сформировать код командного файла, просто перетаскивая мышкой нужные команды.

Рис. 2. Формирование командного файла с использованием Мастера командных файлов

Затем в Мастере пакетных заданий указываются каталог, папки или отдельные файлы отсканированных изображений, назначается соответствующий командный файл и… можно идти отдыхать: остальное RasterID сделает сам.

Рис. 3. Работа с командными файлами с использованием Мастера пакетных заданий

Распознаваемое и нераспознаваемое. Что делать?

Поговорим о вещах банальных, но неизбежных. Что делать, если, как уже сказано, текст в угловом штампе выполнен явно «не по ГОСТу»? Можно ли повысить вероятность безошибочного распознавания, к примеру, децимального номера документа? Или расширить функционал RasterID в других случаях? На этих вопросах стоит остановиться подробнее.

Компонент CSRaster

Самые «продвинутые» читатели, думаю, давно знакомы с технологией ActiveX. Для тех же, у кого это знакомство еще впереди, приведем неоспоримый факт: существуют компоненты ActiveX, которые могут инсталлироваться в любую среду объектно-ориентированного программирования — например VB, Visual C++, Delphi.

В дистрибутив пакета RasrerID входят ActiveX-компонент CSRaster и Руководство разработчика.

Зачем он нужен

Революционность подобного решения в том, что ActiveX-компонент располагает всеми свойствами, методами и функциями, необходимыми для создания любых приложений на основе функционала RasterID. Другими словами, если вам недостаточно тех функций, которые предоставляет стандартная версия пакета RasterID, и при этом вы имеете навыки программирования, вам по силам самому создать требуемый функционал.

В качестве примера покажем, как работают внешние механизмы контроля качества распознавания штампа, созданные автором при помощи программирования в среде Delphi.

Решения с использованием компонента CSRaster

Условие задачи просто, но актуально для большинства предприятий: необходимо создать часть электронного архива на основе 600 000 сканированных документов. Все документы имеют угловой штамп и сделанные вручную надписи. Ключевым полем является децимальный номер документа. Условия хранения и состояние исходных документов, мягко говоря, плохие.

Требуется максимально повысить вероятность правильного распознавания децимального номера при автоматическом вводе информации в СУБД.

Использование экспорта в ODBC без проверки результатов распознавания недопустимо: велика вероятность внесения неверной информации. С другой стороны, «вручную» проверять все 600 000 записей не слишком-то продуктивно…

Итак, возможное решение.

Используем механизмы среды программирования для инсталляции ActiveX-компонента.

Применяя указанные в Руководстве разработчика свойства и методы, несложно создать приложение с необходимым функционалом. Из всего функционала требуется выбрать только то, что необходимо для решения конкретной задачи — распознавания штампов и создания файла, содержащего результаты распознавания. На этой стадии совсем не важно, какой именно приемник данных выбрать: можно использовать MS Excel, а можно, например, ODBC. В первом случае при дальнейшем решении задачи будет использован механизм экспорта/импорта в СУБД MS SQL Server (Data Transformation Services Wizard). Каким путем идти зависит, наверное, от более конкретно сформулированной задачи и еще от технологии обработки, выбирать которую только вам.

Следующий шаг — написание «недостающего» функционала. Не будем подробно рассматривать строки кода на Паскале. Опишем только логику. Создаваемое приложение должно распознать поля углового штампа и проверить качество распознавания. Я применил следующую схему: задаются критерии (алгоритмы) проверки, включающие правила нахождения символов в различных позициях полей штампа. Почему именно так? Во-первых, эта логика наиболее приемлема при проверке правильности распознавания децимальных номеров, которые по сути являются ключевым полем в описании документа. Во-вторых, существует вполне определенная логика составления децимального номера документа, порядка расположения в нем символов. В-третьих, язык Transact SQL позволяет описывать эту логику в тексте запроса.

Помимо запроса, содержащего логику нахождения того или иного символа в той или иной позиции, «дописываемый» функционал конечно же должен содержать средства вывода запроса (тех записей, которые не удовлетворяют описанному алгоритму проверки). Плюс к тому необходимо создать средство сравнения информации, хранящейся в поле СУБД (результат распознавания), и реальной информации, которая содержится на растровом изображении. Здесь, конечно, сравнение придется проводить «вручную». Также необходимо средство редактирования выявленных в полях СУБД «несоответствий».

А теперь вернемся к условию задачи. Мы получили средство распознавания углового штампа 600000 растровых изображений. Кроме того, созданная программа позволяет выводить и редактировать все записи о неверных результатах распознавания. Полностью избежать «ручной» работы не удалось, но, поскольку число «неправильных» результатов гораздо меньше общего количества документов, можно утверждать, что эта работа сведена к минимуму.

Конечно, это всего лишь один пример (правда, достаточно неплохо работающий). Возможно, перед вами будут стоять совсем другие задачи, связанные с распознаванием угловых штампов, пакетной обработкой растровых изображений, созданием электронных архивов. Наш пример доказывает, что при использовании пакета RasterID эти проблемы могут быть решены. Вид приложения, созданного в среде Delphi с использованием компонента CSRaster и описанного выше, приведен на рис. 4.

Рис. 4. Приложение, использующее компонент CSRaster, создаваемое в среде объектно-ориентированного программирования Delphi

www.cadmaster.ru

Организация электронного архива документов.Потоковое сканирование

Рассмотрим модель бизнес процесса потокового сканирования текста для организации электронного архива документов

Назначение:

предназначено для автоматизации перевода бумажных документов в электронный вид, создание электронного документооборота и электронного архива документов.

Функции потокового сканирования включают:

–        Предварительное формирование штрих-кодов

–        Формирование сканированного образа документа

–        Формирование электронной учётной карточки, содержащей электронный образ отсканированного документа

–        Передачу корректно отсканированного электронного образа документа в БД

Возможно осуществление потокового сканирования в пакетном режиме.

При этом  каждый пакет документов для сканирования может идентифицироваться по:

–        Количеству указанных страниц

–        Пустым страницам-разделителям

–        Штрих-кодам

 

Возможный вариант идентификации пакета сканирования определяется настройками сканирования.

Преимущества использования потокового сканирования для организации электронного архива документов:

–        Снижение трудозатрат на ввод информации в базы данных

–        Возможность замены бумажного документооборота и бумажных архивов электронной системой документооборота

–        Повышение эффективности управления документами

–        Снижение временных затрат на поиск документов

Электронный архив документов. Жизненный цикл сканированных документов

Документы в процессе сканирования проходят определенные этапы, совокупность которых мы обозначим как жизненный цикл сканированных документов (ЖЦ сканирования).

 

Основной процесс сканирования включает общие этапы:

Этапы ЖЦ сканирования включают:

  1. Сканирование документов
  2. Распознавание информации
  3. Верификация данных
  4. Коррекция данных
  5. Экспорт данных

Роли пользователям выделяются в соответствии с их участием в ЖЦ сканирования.

Подробнее по этапам.

 

Этап 1. Сканирование документов

Этап «Сканирование» может также интерпретироваться как «Импорт документов», т.к. системы потокового сканирования могут осуществлять считывание изображений не только со станций сканирования, но и из локальных, сетевых ресурсов, а также осуществлять считывание из электронной почты. 

 

Но в рамках данной статьи мы рассматриваем конкретно потоковое сканирование, и как следствие, 1 этап – сканирование документов. Под системой потокового сканирования подразумеваются программные комплексы, предназначенные для потоковой обработки данных.

 

Поточные сканеры в большинстве своем оснащены системой автоматической подачи документов, что позволяет достигнуть скорости оцифровки до 200 изображений в минуту на один сканер.

 

Для выделения отдельных документов из потока в начале сканируемого документа должна быть нанесена штамп-метка/маркер/штрих-код, либо документы потока должны быть разделены чистыми листами.

 

Если же при этом требуется определение типа и вида документа, то метка должна сопровождаться кодом сканирования, на основании которого будет проводиться сопоставление бумажного  и электронного документов.

 

Если документ является многостраничным, метка и код сканирования наносятся только на первый лист документа, и в дальнейшем при вводе массива документов они служат признаком конца текущего документа и началом нового.

 

Место нанесения метки и кода сканирования может находиться в любой свободной от текста части документа. При отсутствии на лицевой стороне документа свободного места их можно нанести с обратной стороны листа.

Итого, мы можем выделить следующие подэтапы для первого этапа:

–        Формирование штамп-метки/маркера/штрих-кода специализированной программой

  • Одномерные штрих-коды
  • Двухмерные штрих -коды

–        Распечатка штамп-метки/маркера/штрих-кода

–        Подготовка комплекта документов для сканирования, нанесение штамп-метки/маркера/штрих-кода

–        Сканирование пакетов документов:

  • Исправление перекосов, искажений, удаление частей изображений и  др.
  • Сборка документов по типам, видам
  • Корректировка качества сканирования

Сканирование документов можно осуществлять в рамках локальной сети, удаленно по средствам http, а также с использованием интерфейсов TWAIN, WIA и ISIS.

 

Результат выполнения этапа: отсканированный документ в формате PDF, TIFF, JPEG, JPEG2000, BMP, PNG, PCX, DCX, DjVu, JBIG2.

Этап 2. Распознавание информации

 

На этапе распознавания используются программные OCR компоненты.

 

Системы, поддерживающие распознавание текста, позволяют:

  • Осуществлять распознавание печатного текста на разных языках, таких как: латинский, греческий, тайский, армянский, японский, корейский, китайский и др. Перечень поддерживаемых языков зависит от возможностей конкретной программы.
  • Осуществлять распознавание документов, содержащих текст сразу на разных языках. При этом, система сама распознает какой текст к какому языку относится.
  • Распознавать текст различного типа: типографская печать, печатная машинка, матричный принтер, MICR (E13B), OCR-A, OCR-B.
  • Распознавать штрих коды.

 

В качестве настроек обычно можно указывать максимальное количество неуверенно распознанных символов на страницы для дальнейшей корректировки содержания на этапе Верификации.

 

Результат  выполнения этапа: отсканированный документ в формате Microsoft Word, HTML, PDF и др.

Высокое качество распознавания и восстановления оформления документа:
  • Поддержка 191 языка распознавания печатного текста, включая языки на основе латинского, греческого, тайского, армянского и кириллического алфавитов, а также японский, корейский, китайский и тайский языки.
  • Распознавание многоязычных документов.
  • Режим быстрого распознавания увеличивает скорость обработки изображений хорошего качества в 2-2,5 раза.
  • Поддержано распознавание различных типов текста: типографская печать, печатная машинка, матричный принтер, MICR (E13B), OCR-A, OCR-B.
Распознавание штрих-кодов:
  • Поддержано распознавание наиболее популярных одномерных и двумерных штрих-кодов.
  • Автоматически идентифицируются и распознаются штрих-коды, расположенные на странице под любым углом к горизонтали.
Контроль качества распознавания:
  • Установка порога качества распознавания изображений, основанная на допустимом количестве неуверенно распознанных символов на страницу.
Преобразование PDF-файлов
  • Определение текстового слоя и его целостность дляообеспечения более быстрого и качественного преобразования PDF-файлов.
  • В создаваемых PDF-файлах сохраняются метаданные документа (название, автор, тема, ключевые слова) и восстанавливаются гиперссылки внутри документа.
  • Поддержаны алгоритмы шифрования и другие средства разграничения доступа: сохранение результатов распознавания в PDF-файл, защищённый паролем.
Этап 3. Верификация данных

Этап верификации включает:

  • Проверка на неуверенно распознанные символы
  • Проверку полученной от сканирования информации на ожидаемые типы данных
  • Проверку полученной от сканирования информации на присутствие значений
  • Редактирование распознанного текста
  • Формирование учетной карточки документа
  • Заполнение атрибутов карточки отсканированного документа
    • Автоматически
    • Вручную

 

На этом этапе, в случае обнаружения ошибок при сканировании и всех неточностей, информация помечается специальными маркеровками для дальнейшего исправления на этапе Коррекции. При необходимости, этап Верификации можно проводить повторно.

 

Станция верификации позволяет оператору проверять, правильно ли была проанализирована страница, создавать и редактировать блоки, проверять неуверенно распознанные символы, а также редактировать распознанный текст.

 

После верификации и устранения ошибок, страница будет отправлена на дальнейшую обработку или проэкспортирована. При неудовлетворительных результатах распознавания, оператор станции верификации может отправить страницу на повторную обработку.

 

Результат  выполнения этапа:  заполненная учетная карточка документа и отсканированный документ в формате Microsoft Word, HTML, PDF и др.

 

Этап 4. Коррекция данных

 

Оператор обрабатывает информацию, полученную на стадии верификации данных, вносит изменения в результирующую запись вручную (ввод с клавиатуры, выбор из списка заранее заданных ответов). В некоторых случаях может объединяться с предыдущим этапом верификации данных.

 

Результат  выполнения этапа:  заполненная отредактированная учетная карточка документа и отсканированный документ в формате Microsoft Word, HTML, PDF и др.

Этап 5. Экспорт данных

 

Оцифрованные структурированные данные выгружаются в необходимом формате для дальнейшего анализа результатов сканирования.

 

При этом экспорт данных может осуществляться:

  • В локальную или сетевую папку
  • В корпоративный портал
  • В систему электронного документооборота/электронный архив

 

Также может осуществляться рассылка данных по электронной почте.

 

Результат выполнения этапа: размещение/отправка итогового документа на требуемом ресурсе.

 

————Автор: Рожкова ЕленаИспользуемые ресурсы:Приложение «Потоковое сканирование»ABBYY

Назначение: предназначено для автоматизации перевода бумажных документов в электронный вид, создание электронного документооборота и электронного архива документов.

Функции потокового сканирования включают:

–Предварительное формирование штрих-кодов

–Формирование сканированного образа документа

–Формирование электронной учётной карточки, содержащей электронный образ отсканированного документа

–Передачукорректно отсканированного электронногообраза документа в БД

Возможно осуществление потокового сканирования в пакетном режиме. При этомкаждый пакет документов для сканирования может идентифицироваться по:

–Количеству указанных страниц

–Пустым страницам-разделителям

–Штрих-кодам

Возможный вариант идентификации пакета сканирования определяется настройками сканирования.

Преимущества использования потокового сканирования:

–Снижение трудозатрат на ввод информации в базы данных

–Возможность замены бумажного документооборота и бумажных архивов электронной системой документооборота

–Повышение эффективности управления документами

–Снижение временных затрат на поиск документов

Жизненный цикл сканированных документов

Документы в процессе сканирования проходят определенные этапы, совокупность которых мы обозначим как жизненный цикл сканированных документов (ЖЦ сканирования).

Основной процесс сканирования включает общие этапы:

Этапы ЖЦ сканирования включают:

1.Сканирование документов

2.Распознавание информации

3.Верификация данных

4.Коррекция данных

5.Экспорт данных

Роли пользователям выделяются в соответствии с их участием в ЖЦ сканирования.

Подробнее по этапам.

Этап 1. Сканирование документов

Этап «Сканирование» может также интерпретироваться как «Импорт документов», т.к. системы потокового сканирования могут осуществлять считывание изображений не только со станций сканирования, но и из локальных, сетевых ресурсов, а также осуществлять считывание из электронной почты.Но в рамках данной статьи мы рассматриваем конкретно потоковое сканирование, и как следствие, 1 этап – сканирование документов. Под системой потокового сканирования подразумеваются программные комплексы, предназначенные для потоковой обработки данных.

Поточные сканеры в большинстве своем оснащены системой автоматической подачи документов, что позволяет достигнуть скорости оцифровки до 200 изображений в минуту на один сканер.

Для выделения отдельных документов из потока в начале сканируемого документа должна быть нанесена штамп-метка/маркер/штрих-код, либо документы потока должны быть разделены чистыми листами. Если же при этом требуется определение типа и вида документа, то метка должна сопровождаться кодом сканирования, на основании которого будет проводиться сопоставление бумажногои электронного документов. Если документ является многостраничным, метка и код сканирования наносятся только на первый лист документа, и в дальнейшем при вводе массива документов они служат признаком конца текущего документа и началом нового.

Место нанесения метки и кода сканирования может находиться в любой свободной от текста части документа. При отсутствии на лицевой стороне документа свободного места их можно нанести с обратной стороны листа.

Итого, мы можем выделить следующие подэтапы для первого этапа:

–Формирование штамп-метки/маркера/штрих-кода специализированной программой

oОдномерные штрих-коды

oДвухмерные штрих -коды

–Распечатка штамп-метки/маркера/штрих-кода

–Подготовка комплекта документов для сканирования, нанесение штамп-метки/маркера/штрих-кода

–Сканирование пакетов документов:

oИсправление перекосов, искажений, удаление частей изображений идр.

oСборка документов по типам, видам

oКорректировка качества сканирования

Сканирование документов можно осуществлять в рамках локальной сети, удаленно по средствам http, а также с использованием интерфейсов TWAIN, WIA и ISIS.

Результат выполнения этапа: отсканированный документ в формате PDF, TIFF, JPEG, JPEG2000, BMP, PNG, PCX, DCX, DjVu, JBIG2.

Этап 2. Распознавание информации

На этапе распознавания используются программные OCR компоненты.

Системы, поддерживающие распознавание текста, позволяют:

oОсуществлять распознавание печатного текста на разных языках, таких как: латинский, греческий, тайский, армянский, японский, корейский, китайский и др. Перечень поддерживаемых языков зависит от возможностей конкретной программы.

oОсуществлять распознавание документов, содержащих текст сразу на разных языках. При этом, система сама распознает какой текст к какому языку относится.

oРаспознавать текст различного типа: типографская печать, печатная машинка, матричный принтер, MICR (E13B), OCR-A, OCR-B.

oРаспознавать штрих коды.

В качестве настроек обычно можно указывать максимальное количество неуверенно распознанных символов на страницы для дальнейшей корректировки содержания на этапе Верификации.

Результатвыполнения этапа: отсканированный документ в формате Microsoft Word, HTML, PDF и др.

Высокое качество распознавания и восстановления оформления документа:

  • Поддержка 191 языка распознавания печатного текста, включая языки на основе латинского, греческого, тайского, армянского и кириллического алфавитов, а также японский, корейский, китайский и тайский языки.
  • Распознавание многоязычных документов.
  • Режим быстрого распознавания увеличивает скорость обработки изображений хорошего качества в 2-2,5 раза.
  • Поддержано распознавание различных типов текста: типографская печать, печатная машинка, матричный принтер, MICR (E13B), OCR-A, OCR-B.

Распознавание штрих-кодов:

  • Поддержано распознавание наиболее популярных одномерных и двумерных штрих-кодов.
  • Автоматически идентифицируются и распознаются штрих-коды, расположенные на странице под любым углом к горизонтали.

Контроль качества распознавания:

  • Установка порога качества распознавания изображений, основанная на допустимом количестве неуверенно распознанных символов на страницу.

Преобразование PDF-файлов

  • Определение текстового слоя и его целостность дляообеспечения более быстрого и качественного преобразования PDF-файлов.
  • В создаваемых PDF-файлах сохраняются метаданные документа (название, автор, тема, ключевые слова) и восстанавливаются гиперссылки внутри документа.
  • Поддержаны алгоритмы шифрования и другие средства разграничения доступа: сохранение результатов распознавания в PDF-файл, защищённый паролем.

Этап 3. Верификация данных

Этап верификации включает:

oПроверка на неуверенно распознанные символы

oПроверку полученной от сканирования информации на ожидаемые типы данных

oПроверку полученной от сканирования информации на присутствие значений

oРедактирование распознанного текста

oФормирование учетной карточки документа

oЗаполнение атрибутов карточки отсканированного документа

§Автоматически

§Вручную

На этом этапе, в случае обнаружения ошибок при сканировании и всех неточностей, информация помечается специальными маркеровками для дальнейшего исправления на этапе Коррекции. При необходимости, этап Верификации можно проводить повторно.

Станция верификации позволяет оператору проверять, правильно ли была проанализирована страница, создавать и редактировать блоки, проверять неуверенно распознанные символы, а также редактировать распознанный текст.

После верификации и устранения ошибок, страница будет отправлена на дальнейшую обработку или проэкспортирована. При неудовлетворительных результатах распознавания, оператор станции верификации может отправить страницу на повторную обработку.

Результатвыполнения этапа: заполненная учетная карточка документа и отсканированный документ в формате Microsoft Word, HTML, PDF и др.

Этап 4. Коррекция данных

Оператор обрабатывает информацию, полученную на стадии верификации данных, вносит изменения в результирующую запись вручную (ввод с клавиатуры, выбор из списка заранее заданных ответов). В некоторых случаях может объединяться с предыдущим этапом верификации данных.

Результатвыполнения этапа: заполненная отредактированная учетная карточка документа и отсканированный документ в формате Microsoft Word, HTML, PDF и др.

Этап 5. Экспорт данных

Оцифрованные структурированные данные выгружаются в необходимом формате для дальнейшего анализа результатов сканирования. При этом экспорт данных может осуществляться:

oВ локальную или сетевую папку

oВ корпоративный портал

oВ систему электронного документооборота/электронный архив

Также может осуществляться рассылка данных по электронной почте.

Результат выполнения этапа: размещение/отправка итогового документа на требуемом ресурсе.

Используемые ресурсы:

http://www.kancler.by/modules/scan/

www.abbyy.ru

Рожкова Елена

Дорогие читатели, если Вы нашли ошибку в тексте, пожалуйста, сообщите мне об этом, выделив ошибку и нажав комбинацию Shift + Enter или же нажмите сюда, чтобы сообщить нам.

GD Star Ratingloading...

Организация электронного архива документов.Потоковое сканирование, 5.0 out of 5 based on 1 rating

ocnova.ru

Ввод сканированных документов в электронный архив предприятия

Статья - Ввод сканированных документов в электронный архив предприятия

Давно известно, что при создании систем электронного архива и документооборота недостаточно регистрировать только те документы, которые изначально разрабатываются в электронном виде: несмотря на бурное развитие информационных технологий, на бумаге и сейчас хранятся огромные объемы технической, инженерной и технологической документации.

CADmaster уже не раз и достаточно подробно рассказывал о принципах работы с такими документами, позволяющих не отказываться от наработанного за многие годы, а использовать его, к примеру, в новых САПР-проектах. Всё просто: сканируем документы, повышаем их качество при помощи, скажем, программы Spotlight, а затем вводим эти документы в систему электронного архива и документооборота. Такой документ можно использовать в дальнейших разработках, вносить необходимые изменения, добавлять в архив новые версии и т. д. Не будем подробно останавливаться на всех тонкостях — кроме, пожалуй, одного момента…

Рассмотрим детальнее процесс ввода отсканированного документа в систему электронного архива (документооборота). Стандартная процедура здесь выглядит так: заполни поля электронной карточки сканированного документа, укажи файл изображения и нажми соответствующую кнопку. Но теперь представьте, что в вашем бумажном архиве сотни тысяч, а то и миллионы единиц хранения. Обычная технология регистрации документа, предоставляемая стандартной системой архива, сразу оказывается чрезвычайно громоздкой, требует невероятных временных затрат.

Единственный выход — автоматизировать процесс регистрации сканированного документа в электронном архиве. Например, в автоматическом режиме распознавать поля углового штампа, которые по сути являются полями учетной карточки документа, и регистрировать распознанную информацию в электронном архиве. При этом было бы совсем неплохо заодно и поднять качество сканированных изображений.

RasterID 2.0 предназначен именно для таких задач.

Теоретически для решения проблемы автоматизированного ввода нужно не так уж и много:

  • система архива и документооборота должна поддерживать запись информации о файле документа в виде ссылки на «внешний» ресурс;
  • необходим экспорт в систему документооборота всей информации о документах — либо напрямую при помощи дополнительных механизмов системы архива, других внешних приложений, СУБД или ODBC, либо через промежуточный формат *.xls, *.dbf и т. д.

Итак, распознаём в автоматическом режиме необходимые записи штампа (при помощи модуля распознавания текста) и экспортируем эту информацию в базу данных или систему документооборота.

Вот только… не всё так очевидно. Основная проблема в том, что надписи в штампах выполнены, мягко говоря, «не по ГОСТу». Значит, и вероятность безошибочного распознавания подобных надписей не так высока, как хотелось бы. Что делать? «Революционность» RasterID 2.0 — в механизмах решения подобных проблем. Но об этом чуть позже. А сейчас — о возможностях программы.

Сканирование

В RasterID 2.0 реализован механизм работы с любым сканирующим оборудованием.

Модуль WiseScan — это всё, что необходимо для удобного, быстрого и интеллектуального сканирования на всех моделях сканеров Contex. Доступны автоопределение размера сканируемого оригинала, режим предварительного сканирования, точная настройка параметров цветного и монохромного сканирования, пакетное сканирование, автоименование документов по заданной маске (с возможностью включения информации из распознанных полей).

К отсканированным изображениям можно применять предварительно заданную последовательность действий, включающую возможность распознавания штампа, проверки информации и ее экспорта во внешнюю базу данных.

«Виртуальный сканер» — при работе с некоторыми сканерами или инженерными системами (Xerox, KIP, Oce и др.) есть возможность «виртуального» сканирования. Требуется только указать папку, в которой сохраняются сканированные изображения, и составить сценарий обработки, после чего RasterID с установленной вами периодичностью обращается к данной папке и применяет указанную последовательность действий ко всем появляющимся там файлам.

RasterID также обеспечивает прямую поддержку сканеров с TWAIN-интерфейсом.

Повышение качества изображений

Думаю, если вы хоть раз видели отсканированную «синьку», вас не придется убеждать, что качество таких изображений далеко от идеального. Пакет RasterID 2.0 предоставляет различные возможности повышения качества сканированных документов: он позволяет удалять «мусор», заливать «дырки», сглаживать растровые линии, устранять возникающие при сканировании перекосы, обрезать пустые поля и т. д. С помощью операций коррекции изображений по четырем точкам рамки устраняются искажения и корректируется размер самого изображения. Эти и многие другие инструменты могут применяться в автоматическом (пакетном) режиме: или параллельно с процессом сканирования, или к указанному набору ранее отсканированных изображений.

Работа с цветными изображениями

Нужно ли работать с цветными изображениями в архиве технической документации? Опыт показывает, что да. К примеру, монохромное сканирование материалов невысокого качества (тех же традиционных российских «синек») не приносит желаемого результата: в подобных случаях лучше отсканировать изображение в режиме Gray Scale (256 градаций серого), а затем произвести обработку, повышающую качество. После обработки вы можете сохранить изображение как монохромное или оставить его как есть (Gray Scale).

Кроме того, все чаще появляются цветные чертежи, полученные при печати проектов, выполненных в САПР. Эти документы удобнее сканировать и нагляднее представлять в цвете!

RasterID располагает множеством средств обработки цветных изображений, среди которых инструменты коррекции яркости/контрастности, уровней, палитры, гамма-коррекции, фильтры размытия, контурной резкости, усреднения. Полноцветное изображение может быть приведено к индексированной палитре или преобразовано в градации серого. Есть возможность разделять цветное (серое) изображение на монохромные слои при помощи специальных процедур: бинаризации, уменьшения количества цветов, разделения по цветам.

Если все перечисленные возможности будут предоставлены людям квалифицированным и хорошо обученным, получение изображений отличного качества гарантировано.

Распознавание штампа. Индексация

Остановимся на функциях поиска штампа на чертеже, распознавания надписей в его полях и экспорта полученной информации.

Программу нужно «обучить» распознаванию штампа. Процедура проста: достаточно обвести штамп прямоугольником и, если необходимо, отредактировать распознанную топологию. Далее следует указать те поля, которые содержат необходимую информацию, задать им имена и сохранить темплет (шаблон). Темплеты нужно создать для всех различных по топологии штампов.

Рис. 1. Обучение штампу. При помощи соответствующих программных инструментов указано положение штампа, три поля (децимальный номер, название изделия, материал по ГОСТ), измерены высота текста и угол наклона, подключен дополнительный модуль OCR

При распознавании указанные поля углового штампа записываются в ячейки таблиц приемников данных. Кроме того, и это очень важно, в одно из полей может передаваться графический фрагмент (картинка) углового штампа, что в дальнейшем значительно упрощает проверку достоверности распознанных данных.

О распознавании надписей: пакет RasterID может работать как с внутренним OCR-модулем, так и с OCR-модулем FineReader Pro 5.0. Разумеется, процесс распознавания нуждается в контроле.

Приемники данных

RasterID является открытой системой: при помощи стандартных способов программирования может быть создан модуль экспорта, обеспечивающий прямую передачу распознанных данных из полей углового штампа в архивную систему пользователя.

C RasterID поставляются модули экспорта данных в MS Excel, MS Access, текстовый файл с разделителями; поддерживается передача данных при помощи механизма ODBC. Большинство современных СУБД имеет встроенные механизмы экспорта и импорта, позволяющие «пакетно» импортировать файлы перечисленных стандартных форматов в формат таблиц СУБД (например, Data Transformation Services Wizard, поставляемый с MS SQL Server).

Промежуточный формат также может быть экспортирован при помощи механизмов самой системы архива или других внешних приложений.

Поскольку одним из полей приемника данных является ссылка на файл документа, необходимо, чтобы архивная система работала по ссылке с файлами документов, хранящимися на «внешнем» ресурсе.

Контроль качества распознавания

Не будем строить иллюзий и утверждать, что «распознать можно всё». Качество распознавания в первую очередь зависит от подлинника: распознать печатный текст проще, чем написанный пусть даже строго по ГОСТу, но от руки. А если текст, мягко говоря, «не по ГОСТу» или само изображение — крайне низкого качества? Для таких ситуаций в новой версии пакета предусмотрены встроенные механизмы контроля качества распознавания.

Способ контроля зависит от приемника, в который были экспортированы данные. При экспорте данных в MS Excel для контроля передается фрагмент растра, содержащий штамп. В MS Access используют специальный модуль проверки качества. Если штамп распознается из программы напрямую, для контроля служит диалог Редактирование распознанных данных: он появляется после того как команда Распознать штамп завершила распознавание.

В любом случае контролировать распознавание удается достаточно эффективно.

Пакетная обработка

Все упомянутые выше возможности RasterID могут применяться в автоматическом (пакетном) режиме: программа предлагает мощный и простой в использовании механизм создания командных файлов.

Метод Drag and Drop позволяет сформировать код командного файла, просто перетаскивая мышкой нужные команды.

Рис. 2. Формирование командного файла с использованием Мастера командных файлов

Затем в Мастере пакетных заданий указываются каталог, папки или отдельные файлы отсканированных изображений, назначается соответствующий командный файл и… можно идти отдыхать: остальное RasterID сделает сам.

Рис. 3. Работа с командными файлами с использованием Мастера пакетных заданий

Распознаваемое и нераспознаваемое. Что делать?

Поговорим о вещах банальных, но неизбежных. Что делать, если, как уже сказано, текст в угловом штампе выполнен явно «не по ГОСТу»? Можно ли повысить вероятность безошибочного распознавания, к примеру, децимального номера документа? Или расширить функционал RasterID в других случаях? На этих вопросах стоит остановиться подробнее.

Компонент CSRaster

Самые «продвинутые» читатели, думаю, давно знакомы с технологией ActiveX. Для тех же, у кого это знакомство еще впереди, приведем неоспоримый факт: существуют компоненты ActiveX, которые могут инсталлироваться в любую среду объектно-ориентированного программирования — например VB, Visual C++, Delphi.

В дистрибутив пакета RasrerID входят ActiveX-компонент CSRaster и Руководство разработчика.

Зачем он нужен

Революционность подобного решения в том, что ActiveX-компонент располагает всеми свойствами, методами и функциями, необходимыми для создания любых приложений на основе функционала RasterID. Другими словами, если вам недостаточно тех функций, которые предоставляет стандартная версия пакета RasterID, и при этом вы имеете навыки программирования, вам по силам самому создать требуемый функционал.

В качестве примера покажем, как работают внешние механизмы контроля качества распознавания штампа, созданные автором при помощи программирования в среде Delphi.

Решения с использованием компонента CSRaster

Условие задачи просто, но актуально для большинства предприятий: необходимо создать часть электронного архива на основе 600 000 сканированных документов. Все документы имеют угловой штамп и сделанные вручную надписи. Ключевым полем является децимальный номер документа. Условия хранения и состояние исходных документов, мягко говоря, плохие.

Требуется максимально повысить вероятность правильного распознавания децимального номера при автоматическом вводе информации в СУБД.

Использование экспорта в ODBC без проверки результатов распознавания недопустимо: велика вероятность внесения неверной информации. С другой стороны, «вручную» проверять все 600 000 записей не слишком-то продуктивно…

Итак, возможное решение.

Используем механизмы среды программирования для инсталляции ActiveX-компонента.

Применяя указанные в Руководстве разработчика свойства и методы, несложно создать приложение с необходимым функционалом. Из всего функционала требуется выбрать только то, что необходимо для решения конкретной задачи — распознавания штампов и создания файла, содержащего результаты распознавания. На этой стадии совсем не важно, какой именно приемник данных выбрать: можно использовать MS Excel, а можно, например, ODBC. В первом случае при дальнейшем решении задачи будет использован механизм экспорта/импорта в СУБД MS SQL Server (Data Transformation Services Wizard). Каким путем идти зависит, наверное, от более конкретно сформулированной задачи и еще от технологии обработки, выбирать которую только вам.

Следующий шаг — написание «недостающего» функционала. Не будем подробно рассматривать строки кода на Паскале. Опишем только логику. Создаваемое приложение должно распознать поля углового штампа и проверить качество распознавания. Я применил следующую схему: задаются критерии (алгоритмы) проверки, включающие правила нахождения символов в различных позициях полей штампа. Почему именно так? Во-первых, эта логика наиболее приемлема при проверке правильности распознавания децимальных номеров, которые по сути являются ключевым полем в описании документа. Во-вторых, существует вполне определенная логика составления децимального номера документа, порядка расположения в нем символов. В-третьих, язык Transact SQL позволяет описывать эту логику в тексте запроса.

Помимо запроса, содержащего логику нахождения того или иного символа в той или иной позиции, «дописываемый» функционал конечно же должен содержать средства вывода запроса (тех записей, которые не удовлетворяют описанному алгоритму проверки). Плюс к тому необходимо создать средство сравнения информации, хранящейся в поле СУБД (результат распознавания), и реальной информации, которая содержится на растровом изображении. Здесь, конечно, сравнение придется проводить «вручную». Также необходимо средство редактирования выявленных в полях СУБД «несоответствий».

А теперь вернемся к условию задачи. Мы получили средство распознавания углового штампа 600000 растровых изображений. Кроме того, созданная программа позволяет выводить и редактировать все записи о неверных результатах распознавания. Полностью избежать «ручной» работы не удалось, но, поскольку число «неправильных» результатов гораздо меньше общего количества документов, можно утверждать, что эта работа сведена к минимуму.

Конечно, это всего лишь один пример (правда, достаточно неплохо работающий). Возможно, перед вами будут стоять совсем другие задачи, связанные с распознаванием угловых штампов, пакетной обработкой растровых изображений, созданием электронных архивов. Наш пример доказывает, что при использовании пакета RasterID эти проблемы могут быть решены. Вид приложения, созданного в среде Delphi с использованием компонента CSRaster и описанного выше, приведен на рис. 4.

Рис. 4. Приложение, использующее компонент CSRaster, создаваемое в среде объектно-ориентированного программирования Delphi
  • CSoft Development Поддержка

  • Подписка на новости по электронной почте

development.csoft.ru

%PDF-1.7 % 1 0 obj >/Lang(ru-RU)/MarkInfo>/StructTreeRoot 582 0 R /AcroForm>/Metadata 2921 0 R >> endobj 5 0 obj >/Font>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 95 0 R /Group>/Tabs/S/StructParents 0>> endobj 6 0 obj >/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 119 0 R /Group>/Tabs/S/StructParents 1>> endobj 7 0 obj >/ExtGState>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 122 0 R /Group>/Tabs/S/StructParents 2>> endobj 8 0 obj >/ExtGState>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/Annots[ 126 0 R 127 0 R 128 0 R 129 0 R 130 0 R 131 0 R 132 0 R 133 0 R 134 0 R 135 0 R 136 0 R 137 0 R 138 0 R 139 0 R 140 0 R 141 0 R 142 0 R 143 0 R 144 0 R 145 0 R 146 0 R 147 0 R 148 0 R 149 0 R 150 0 R 151 0 R 152 0 R 153 0 R ]/MediaBox[ 0 0 595.32 841.92]/Contents 154 0 R /Group>/Tabs/S/StructParents 3>> endobj 9 0 obj >/ExtGState>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/Annots[ 155 0 R 156 0 R 157 0 R 158 0 R ]/MediaBox[ 0 0 595.32 841.92]/Contents 159 0 R /Group>/Tabs/S/StructParents 33>> endobj 10 0 obj >/ExtGState>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 160 0 R /Group>/Tabs/S/StructParents 37>> endobj 11 0 obj >/ExtGState>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 172 0 R /Group>/Tabs/S/StructParents 38>> endobj 12 0 obj >/ExtGState>/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/Annots[ 175 0 R 176 0 R 177 0 R ]/MediaBox[ 0 0 595.32 841.92]/Contents 178 0 R /Group>/Tabs/S/StructParents 39>> endobj 13 0 obj >/ExtGState>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 180 0 R /Group>/Tabs/S/StructParents 43>> endobj 14 0 obj >/ExtGState>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/Annots[ 181 0 R 182 0 R 183 0 R 184 0 R 185 0 R ]/MediaBox[ 0 0 595.32 841.92]/Contents 186 0 R /Group>/Tabs/S/StructParents 44>> endobj 15 0 obj >/ExtGState>/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 190 0 R /Group>/Tabs/S/StructParents 50>> endobj 16 0 obj >/ExtGState>/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/Annots[ 201 0 R ]/MediaBox[ 0 0 595.32 841.92]/Contents 202 0 R /Group>/Tabs/S/StructParents 51>> endobj 17 0 obj >/ExtGState>/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 210 0 R /Group>/Tabs/S/StructParents 53>> endobj 18 0 obj >/ExtGState>/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 217 0 R /Group>/Tabs/S/StructParents 56>> endobj 19 0 obj >/ExtGState>/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 222 0 R /Group>/Tabs/S/StructParents 57>> endobj 20 0 obj >/ExtGState>/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 225 0 R /Group>/Tabs/S/StructParents 59>> endobj 21 0 obj >/ExtGState>/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 230 0 R /Group>/Tabs/S/StructParents 60>> endobj 22 0 obj >/ExtGState>/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/Annots[ 233 0 R ]/MediaBox[ 0 0 595.32 841.92]/Contents 234 0 R /Group>/Tabs/S/StructParents 62>> endobj 23 0 obj >/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 239 0 R /Group>/Tabs/S/StructParents 64>> endobj 24 0 obj >/ExtGState>/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/Annots[ 244 0 R 245 0 R ]/MediaBox[ 0 0 595.32 841.92]/Contents 246 0 R /Group>/Tabs/S/StructParents 66>> endobj 25 0 obj >/ExtGState>/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 255 0 R /Group>/Tabs/S/StructParents 69>> endobj 26 0 obj >/ExtGState>/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/Annots[ 258 0 R ]/MediaBox[ 0 0 595.32 841.92]/Contents 259 0 R /Group>/Tabs/S/StructParents 71>> endobj 27 0 obj >/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/Annots[ 262 0 R 263 0 R 264 0 R 265 0 R 266 0 R 267 0 R 268 0 R 269 0 R 270 0 R 271 0 R 272 0 R ]/MediaBox[ 0 0 595.32 841.92]/Contents 273 0 R /Group>/Tabs/S/StructParents 73>> endobj 28 0 obj >/ExtGState>/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/Annots[ 284 0 R 285 0 R 286 0 R ]/MediaBox[ 0 0 595.32 841.92]/Contents 287 0 R /Group>/Tabs/S/StructParents 85>> endobj 29 0 obj >/ExtGState>/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 291 0 R /Group>/Tabs/S/StructParents 89>> endobj 30 0 obj >/ExtGState>/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 301 0 R /Group>/Tabs/S/StructParents 90>> endobj 31 0 obj >/ExtGState>/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 310 0 R /Group>/Tabs/S/StructParents 91>> endobj 32 0 obj >/ExtGState>/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 313 0 R /Group>/Tabs/S/StructParents 94>> endobj 33 0 obj >/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 318 0 R /Group>/Tabs/S/StructParents 95>> endobj 34 0 obj >/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/Annots[ 324 0 R 325 0 R ]/MediaBox[ 0 0 595.32 841.92]/Contents 326 0 R /Group>/Tabs/S/StructParents 97>> endobj 35 0 obj >/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 328 0 R /Group>/Tabs/S/StructParents 100>> endobj 36 0 obj >/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 329 0 R /Group>/Tabs/S/StructParents 101>> endobj 37 0 obj >/ExtGState>/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 344 0 R /Group>/Tabs/S/StructParents 102>> endobj 38 0 obj >/ExtGState>/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/Annots[ 347 0 R ]/MediaBox[ 0 0 595.32 841.92]/Contents 348 0 R /Group>/Tabs/S/StructParents 103>> endobj 39 0 obj >/ExtGState>/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/Annots[ 353 0 R ]/MediaBox[ 0 0 595.32 841.92]/Contents 354 0 R /Group>/Tabs/S/StructParents 105>> endobj 40 0 obj >/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/Annots[ 359 0 R 360 0 R 361 0 R 362 0 R 363 0 R ]/MediaBox[ 0 0 595.32 841.92]/Contents 364 0 R /Group>/Tabs/S/StructParents 107>> endobj 41 0 obj >/ExtGState>/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 371 0 R /Group>/Tabs/S/StructParents 113>> endobj 42 0 obj >/ExtGState>/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/Annots[ 374 0 R ]/MediaBox[ 0 0 595.32 841.92]/Contents 375 0 R /Group>/Tabs/S/StructParents 117>> endobj 43 0 obj >/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 404 0 R /Group>/Tabs/S/StructParents 119>> endobj 44 0 obj >/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/Annots[ 413 0 R 414 0 R 415 0 R 416 0 R ]/MediaBox[ 0 0 595.32 841.92]/Contents 417 0 R /Group>/Tabs/S/StructParents 129>> endobj 45 0 obj >/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 423 0 R /Group>/Tabs/S/StructParents 134>> endobj 46 0 obj >/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/Annots[ 426 0 R ]/MediaBox[ 0 0 595.32 841.92]/Contents 427 0 R /Group>/Tabs/S/StructParents 137>> endobj 47 0 obj >/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 442 0 R /Group>/Tabs/S/StructParents 139>> endobj 48 0 obj >/ExtGState>/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 465 0 R /Group>/Tabs/S/StructParents 140>> endobj 49 0 obj >/ExtGState>/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 490 0 R /Group>/Tabs/S/StructParents 141>> endobj 50 0 obj >/ExtGState>/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 514 0 R /Group>/Tabs/S/StructParents 142>> endobj 51 0 obj >/XObject>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 534 0 R /Group>/Tabs/S/StructParents 143>> endobj 52 0 obj >/ExtGState>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI]>>/MediaBox[ 0 0 595.32 841.92]/Contents 535 0 R /Group>/Tabs/S/StructParents 144>> endobj 54 0 obj >stream xz*FiVl[nNUL.Ks1˪⯂[email protected]#oۘ=cl\b*:rjdli MLjdZp?~K|S7mCbQ&kX#.lH fڦmmRKnfԺً>c`]@lޡES.̊D3&QiYFB흈Tm*_mЎ3U}[email protected]

landocs.ru

OCR-сканеры: Android-приложения для сканирования документов

Чтобы отправить бумажный документ по электронной почте, вовсе необязательно использовать ПК в связке со сканером — достаточно воспользоваться камерой смартфона и сделать снимок. Если же необходимо внести коррективы — в таком случает не обойтись без программ, которые не только помогут оцифровать документ, но и обладают дополнительными возможностями. Такие мобильные сканеры на порядок проще и удобнее в использовании.

Мобильных сканеров в Play Store не так уж и мало. Но интерес вызывают те из них, которые имеют функцию оптического распознавания текста (OCR). Некоторые читатели могут возразить, что есть бесплатная возможность выполнить OCR в том же Google Drive. И будут правы… отчасти. Google и вправду предлагает замечательную функцию распознавания текста, преобразовывая PDF-файлы и изображения в текстовые документы, но здесь есть свои ограничения. К тому же, результат не всегда желаемый, а манипуляций приходится делать гораздо больше. В этой статье мы рассмотрим несколько достойных кандидатов на роль мобильного сканера с OCR-функцией.

 

Первым и, пожалуй, наиболее известным инструментом для распознавания текста можно считать приложение от компании ABBYY. Для мобильных платформ программа получила название ABBYY TextGrabber + Translator и объединила функции OCR и переводчика.

Интерфейс приложения содержит всего лишь две основные кнопки на экране, отвечающие за добавление изображения из галереи и создание снимка с помощью стоковой камеры устройства с поддержкой только одиночного режима сканирования. В приложении доступно более 60 языков, в том числе и украинский. Весь процесс распознавания занимает не больше минуты. Что касается распознанного текста – здесь не все однозначно, конечный результат очень сильно зависит от качества полученного изображения. К сожалению, никаких инструментов, кроме кадрирования, в приложении нет. Ко всему прочему, TextGrabber не содержит встроенных средств для исправления перспективы, настройки яркости и контраста. Лучше дела обстоят со скриншотами, которые программа распознает значительно уверенней, но также не идеально. Распознанный текст не сохраняет никакого форматирования оригинального документа. Его можно отредактировать, скопировать в буфер, передать в другие приложения, в том числе и социальные сети, отправить по SMS или электронной почте. Не очень приятным моментом при этом является то, что программа автоматически добавляет к тексту подпись «Captured by ABBYY TextGrabber». Ранее распознанные тексты сохраняются в приложении, их можно просмотреть в «Истории».

Бонусом в программе идет вторая часть функциональной нагрузки — Translator. Это перевод распознанного текста на более чем 40 языков мира благодаря интеграции с сервисом Google Translate. Такую возможность можно использовать, например, для перевода вывесок, надписей и небольших фрагментов текста. Для более объемной информации — польза весьма сомнительная. Работает переводчик при выполнении двух условий: хороший результат распознавания и подключение к интернету.

В результате ABBYY TextGrabber + Translator несколько разочаровал. Приложение имеет отличную скорость и стабильность работы, однако ему крайне не хватает дополнительных функций предобработки изображений, что, несомненно, улучшило бы конечный результат. ABBYY TextGrabber представлен только в платной версии. На текущий момент цена программы в Google Play неоправданно высокая и составляет 159 грн.

 

Самое популярное по количеству загрузок приложение-сканер. Это не просто утилита для сканирования изображений, а настоящий программный комплекс со множеством функций. CamScanner выгодно отличается наличием встроенной камеры, которая позволяет распознавать визитные карточки, текстовые документы и QR-коды в одиночном и пакетном режимах. Любопытной особенностью интерфейса камеры является опция, которая демонстрирует уровень наклона устройства.

Программа автоматически определяет границы документа, исправляет перспективу, но последнее слово за редактированием оставляет за пользователем, в распоряжении которого — полноценный редактор изображений с готовыми шаблонами и ручной регулировкой яркости, контрастности и детализации. Результат сканирования сохраняется в PDF-файл. Для каждого документа можно установить более детальные настройки. В приложении предусмотрена система тегов, с помощью которой можно легко сортировать отсканированные документы, если таковых накопилось немалое количество.

Основные функции программы доступны в бесплатной версии CamScanner. Ограничения коснулись загрузки в Evernote и OneDrive и возможности экспортировать распознанный текст, в сохраненных PDF-файлах присутствует водяной знак. Лицензионный ключ, стоимостью ~24 грн. (с учетом скидки), позволяет оценить возможности OCR. Как оказалось, среди языков распознавания отсутствует украинский и русский. Соответственно, на текущий момент практической пользы от OCR-функции для большинства украиноязычных и русскоязычных пользователей в приложении нет. На примере документа с английским текстом можно отметить, что процесс распознавания CamScanner – наиболее быстрый из всех рассматриваемых в данной статье программ с очень хорошим результатом и сохранением абзацев.

Стоить заметить, что некоторые функции приложения становятся доступны только после регистрации в сервисе. К таковым относится синхронизация с облачными хранилищами, включая собственное «облако» от CamScanner, и социальные функции, которые позволяют оставлять комментарии, открывать доступ к документам другим пользователям сервиса или делиться с ними ссылками. Среди дополнительных функций в программе есть резервное копирование и восстановление данных на SD-карте, установка пароля на просмотр защищенных документов, экспорт с возможностью загрузки в облако или печати с помощью виртуального принтера Google. В результате CamScanner — отличный инструмент для сканирования различных документов. К сожалению, удачно реализованная функция OCR не содержит ни украинского, ни русского языка, что может стать ключевым моментом при выборе OCR-сканера.

 

Mobile Document Scanner (MDScan) — программа, пришедшая из Nokia Ovi Store, которая по праву может считаться ветераном среди мобильных инструментов для оцифровки изображений. Приложение имеет собственный интерфейс камеры, поддерживает как одиночный, так и многостраничный режимы сканирования. Главной особенностью программы являются шаблоны предобработки и постобработки изображений. MDScan автоматически очищает документ, удаляя лишние элементы и фон. Возможность ручной коррекции яркости/контрастности здесь отсутствует, но и с готовыми шаблонами можно добиться вполне приличного результата. В автоматическом режиме программа не умеет корректно определять границы текста, а вручную это реализовано не очень удобно. Из инструментов постобработки в MDScan есть кисть для рисования и добавление подписи.

Оцифрованные страницы можно объединять, разъединять, передавать в другое приложение или отправлять на печать, а сам документ можно сохранить в ZIP и PDF-файл. Все вышеперечисленное доступно пользователю в бесплатной версии приложения. Правда, придется смириться с рекламой, водяным знаком на документах и ограничением на сканирование не более 4 страниц в пакетном режиме.

Что касается OCR-функции, то такая возможность появилась в последней версии MDScan и активируется после покупки программы (~16 грн.). Надо признать, на текущий момент распознавание текста выглядит очень сырым. Во-первых, найти эту функцию и воспользоваться ею оказалось не так просто. А во-вторых, сам процесс длится настолько долго, что не каждый пользователь дождется результата. Хотя сам результат, при условии хорошей читаемости текста, может оказаться вполне годным. Единственное, что хотелось бы отметить – это умение программы корректно выделять абзацы.

 

Основной задачей этого приложения является преобразование изображения в текст с последующим его редактированием. По своим возможностям программа очень похожа на ABBYY Text Grabber + Translator. Здесь также отсутствует пакетный режим сканирования, нет инструмента для исправления перспективы, но есть интеграция с сервисом Google Translate для перевода распознанного текста на другой язык. Однако, в отличие от приложения ABBYY, OCR Instantly все же предоставляет возможность вручную корректировать снимки с помощью функции Enhance. В данном случае это всего пара ползунков, отвечающих за настройку экспозиции и уменьшение шума.

OCR работает быстро и выдает неплохие результаты. Языковые пакеты, в том числе украинский и русский, загружаются в настройках. Программа хорошо распознает текст как со снимка, сделанного камерой устройства, так и со скриншота. Распознанный текст размещается под изображением с сохранением всех абзацев. Его можно скопировать в буфер обмена или передать в другое установленное на устройстве приложение через системное меню «Поделиться».

OCR Instantly имеет и платную версию (~75 грн.), которая отличается отсутствием рекламы, расширенным OCR, возможностью выбора нескольких языков распознавания и полноэкранным редактированием текста. Кроме того, в Pro-версии приложения можно найти несколько интересных дополнений. Например, черный и белый списки символов (на случай если есть проблема с распознаванием определенного символа) или инструмент Dewarp — для выравнивания строк текста. И, разумеется, платный OCR Instantly позволяет сохранять результаты распознавания в TXT, JPG и PDF файл.

 

Scanbot можно назвать по-настоящему мобильным сканером. Приложение выполнено в концепции Material Design, выглядит современно и не перегружено лишними функциями. Основное предназначение программы — сканирование различных видов документов с последующим сохранением в PDF или JPG файл. Главным преимуществом Scanbot перед конкурентами является собственный интеллектуальный интерфейс камеры. Достаточно навести камеру на объект, как программа тут же обнаруживает текстовый документ, QR или штрих-код, определяет его границы, корректирует перспективу и оптимизирует качество изображения. Все это происходит в автоматическом режиме. Если результат не устраивает, можно внести изменения вручную. Кроме того, независимо от источника добавления изображения — камеры или галереи, Scanbot поддерживает как одиночный, так и пакетный режимы сканирования. Еще одно достоинство приложения — работа с облачными хранилищами с поддержкой автоматической загрузки отсканированных документов в выбранное «облако». Результат сканирования также сохраняется на SD-карте.

OCR-функция присутствует в платной версии Scanbot Pro (~87 грн.) и доступна после установки языкового модуля, в котором содержатся украинский и русский языки. Процесс распознавания происходит очень долго, причем в автоматическом режиме. Соответственно, возможности выбрать язык вручную приложение не дает. Из-за этого текст документа может быть определен неправильно, и тогда на выходе получим бессмысленный набор символов. Хотя, в целом, результаты разнятся и могут быть как непригодными для восприятия, так и вполне хорошими. В Pro-версии также содержатся инструменты для редактирования отсканированного документа: создание подписи, заметки и маркер для выделения текста. Приятным бонусом идут темы оформления программы. К недостаткам Scanbot можно отнести длительный процесс создания многостраничного PDF-файла, отсутствие возможности добавлять или удалять отдельные страницы в документе, а также неудобная реализация сохранения отсканированного документа в файл.

 

Итоги

Подводя итоги, хочется обратить внимание на то, что все рассмотренные приложения в полной мере раскрывают свои функциональные возможности (в частности, OCR) в платных версиях. Это говорит о том, что весь этот софт является узкоспециализированным и нацелен в большинстве своем на тех пользователей, которые будут использовать его в своей профессиональной или учебной деятельности. Исключение — OCR Instantly, в котором OCR-функция представлена в бесплатной версии.

Что касается качества распознавания, то многое, разумеется, зависит от камеры мобильного устройства, условий, при которых делается снимок, и наличия в приложении инструментов для обработки этих снимков. Все программы показывают приблизительно одинаковый результат. Чуть хуже проявил себя ABBYY TextGrabber + Translator – в данном случае основной проблемой приложения является недостаточная функциональность и отсутствие каких-либо инструментов обработки изображения. В компании ABBYY нам сообщили, что позиционируют TextGrabber + Translator как базовое решение, но в этом году собираются выпустить для Android приложение FineScanner, в котором будет больше функций. CamScanner и вовсе не имеет украинского и русского языков распознавания, однако в целом оставил положительное впечатление. Scanbot и Mobile Document Scanner отметились долгоиграющим процессом распознавания. Не последнюю роль в выборе OCR-сканера играет их стоимость, которая сильно варьируется от символической до необоснованно высокой.

itc.ua


Смотрите также