Система поточного сканирования документов разрабатывается на базе платформы Microsoft SharePoint Server 2007, интегрирована с Microsoft Project Server 2007.
Система рассчитана на объем от 1 млн. документов в месяц.

Рисунок 1 - Схема алгоритма обработки документов
Данная схема допускает:
- различные варианты рабочего процесса;
- переопределение концепции процесса обработки в сторону «поточности» (пакетная обработка с контролем результатов пост-фактум) либо «интерактивности» (контролируемый оператором процесс подокументного ввода);
- различное распределение ролей между сервером и рабочим местом оператора от полностью настольного решения до полностью автоматизированного.
Пример внедрения в компании «МегаФон»
Ситуация
Постоянный рост количества абонентов компании «МегаФон» увеличивал нагрузку на операторов, обрабатывающих формы входящей документации, поступающей из клиентских точек обслуживания и продаж. Увеличение объема ручной обработки входящих документов приводило к необходимости привлечения дополнительных ресурсов для проверки данных, снижению качества и в конечном итоге потере целостности информации.
В связи с этим компания «МегаФон» решила использовать программное обеспечение для автоматизации процесса поточной обработки и хранения абонентской документации. Для хранения информации решено было внедрить Microsoft Office Sharepoint Server 2007 (MOSS), который предоставляет широкие возможности по структурированию и удобный интерфейс поиска документов. Целесообразность использования MOSS также была обусловлена тем, что в Компании широко используется корпоративный портал. Обеспечение единой точки входа пользователей, интеграция поточного сканирования с корпоративным порталом и обеспечение единообразного интерфейса стало дополнительным плюсом в работе пользователей.
В качестве системы распознавания и обработки данных было принято решение использовать Kofax Ascent Capture, имеющий специализированный коннектор для выгрузки информации в библиотеки документов MOSS 2007 (Рисунок 2). Кроме того, преимуществом системы Kofax является возможность работы со штрих-кодами, что позволяет исключить машинопечатный и рукопечатный текст для снижения процента некорректно распознанных данных.

Рисунок 2 – Схема взаимодействия системы распознавания и обработки данных Kofax и MOSS
Для реализации данного проекта была привлечена компания «Интеллектуальные системы», являющаяся сертифицированным партнером компании Microsoft.
Реализация проекта
Для реализации проекта компанией «МегаФон» были подготовлены шаблоны различного вида печатных форм документов. На первом этапе была проведена работа по анализу рационального способа распознования текста: непосредственно текст или через штрих-код. В результате анализа качества предоставляемых для сканирования документов было принято решение о штрих-кодировании информации с целью повышения качества распознаваемых данных.
На следующем этапе реализации проекта специалистами компании «Интеллектуальные системы» совместно с ответственными сотрудниками компании «МегаФон» был определен набор данных, которые должны быть преобразованы в штрих-коды, подобраны типы и размеры штрих-кодов.
Следующим шагом стала настройка шаблонов и процесса обработки отсканированных в Kofax Ascent Capture, состоящего из нескольких этапов:
- Классификация введенных копий по видам (формам) документов в соответствии с заданными признаками. Извлечение текстовой информации из графических отсканированных образов.
- Сопоставление распознанной формы с данными в БД прикладного назначения.
- Публикация введенной формы с данными в привязке к графическим образам в архивной базе документов (MOSS 2007).
Большое внимание было уделено производительности системы. Обрабатываемые объемы информации требовали оптимизации представления информации на формах для обеспечения приемлемого времени отклика системы на запросы пользователей. Для решения задачи был реализован эффективный механизм, позволяющий специальным образом структурировать документы, распределяя их по различным БД в зависимости от текущих условий.
Освоение системы пользователями не заняло много времени, поскольку работа с системой осуществляется через привычный веб-интерфейс, а для работы с документами используются продукты семейства Microsoft Office 2007.
Преимущества системы
В результате реализации системы были автоматизированы процессы поточного сканирования, распознавания, структурирования и хранения абонентской документации, снижен объем ручной работы по сверке данных, уменьшилось количество некорректно введенной инфрмации.
Сотрудники компании получили инструмент для поиска абонентской документации по различным атрибутам.
Обеспечены гибкие возможности настройки прав доступа сотрудников компании к конфиденциальной информации в системе.








