Гнучкі форми і їх обробка

Форма - це документ, що складається з однієї або декількох сторінок і призначений для заповнення людиною від руки або будь-яким друкованим способом. Для зручності заповнення та обробки на формі розмічаються поля для введення даних, поряд з полями розташовуються пояснюють заголовки.

Форми, все бланки яких мають однакове розташування і кількість полів, називають жорсткими формами. Для обробки жорстких форм застосовують системи потокового введення документів, в яких виконується розпізнавання даних форми і передача цих даних в зовнішні додатки (бази даних, системи документообігу, системи архівування). Розпізнавання і вилучення даних з форм стає можливим завдяки застосуванню визначення документа - опису розташування полів форми із зазначенням типів даних, що містяться в полях, і правил перевірки результатів розпізнавання. Даний опис стосується до всіх жорстких форм одного типу. Визначення документа чітко вказує системі потокового введення форм розташування і тип даних форми, усуваючи тим самим необхідність пошуку даних і помилки інтерпретації.

Однак, серед безлічі документів, що вимагають автоматизованого введення, є велика кількість форм, що містять схожі дані, але мають нестрогую структуру організації цих даних всередині форми.

Яскравим прикладом гнучких форм є різноманітні платіжні документи. Поля для введення даних на таких формах згідно чітко зазначених у, але їх розташування і розміри зазвичай не фіксовані. Причому на різних документах можливе різне розташування полів відносно один одного. Також важливою особливістю таких форм є непостійне кількість полів. Наприклад, на частині документів може бути відсутнім поле для введення підпису, а на інших присутніми додаткові елементи оформлення, такі як лінії, відступи або картинки.

Через те, що наявність і розташування полів на формах заздалегідь невідомо, стає неможливим створення шаблону. Це призводить до того, що хоча форми і можуть бути розпізнані (тобто переведені в електронний вигляд, а їх текст можна редагувати), автоматично витягти дані з них неможливо. Система потокового введення не може самостійно знайти потрібну інформацію.

ABBYY FlexiLayout Studio дозволяє створити опис структури документів і задати алгоритм пошуку розпізнаються полів гнучких форм на основі додаткової інформації, наприклад, про розташування поля щодо інших полів або про характер даних, які можуть бути в полі і т.п. а також налаштувати гнучке опис на реальних зображеннях.

Гнучке опис FlexiLayout, створене в програмі ABBYY FlexiLayout Studio, потім передається в систему введення форм (ABBYY FlexiCapture), де на його основі створюється визначення документа. Технологія ABBYY FlexiCapture надає широкі можливості з автоматизованого вводу форм різних видів. Використовуючи цю технологію розпізнавання форм, ви можете автоматизувати процес введення практично будь-яких документів, як стандартних, так і гнучких форм.