Програма для розпізнавання тексту cuneiform, яка не дружить зі сканерами

Програма для розпізнавання тексту CuneiForm, яка не дружить зі сканерами

Нещодавно зайнявся пошуком безкоштовних додатків для розпізнавання відсканованого тексту, або як їх ще називають програми OCR. Бажання платити за популярного монстра ABBYY FineReader, зовсім не було, але як виявилося, пропонують дуже мало варіантів програм такого плану для безкоштовного використання. Перший-ліпший варіант виявився FreeOCR. мабуть, одна з найпопулярніших програм для Windows, але в своєму нинішньому вигляді не дружить з українською мовою. Один з Новомосковсктелей блогу, запропонував спробувати праці вітчизняних розробників CuneiForm.

Програма для розпізнавання тексту cuneiform, яка не дружить зі сканерами

Процедура установки стандартна, перелік з кількох стандартних питань, де саме пам'ятне це ліцензійне угоди і вибір папки, куди будуть інстальована програма. Кілька секунд очікування і все готово до роботи. Нічого зайвого не встановлюється і додатково програмні компоненти теж не доведеться завантажувати і встановлювати.

Запустивши програму, отримуємо стандартний для OCR інтерфейс, меню з декількох пунктів, великі кнопки для доступу до основних функцій і основне вікно розбите на дві частини для зображення і готового тексту які розпізнали.

Найперша кнопка в панелі інструментів, де намальована чарівна паличка, це майстер, запустивши які пройдемо всі етапи, починаючи від сканування і закінчуючи готовим текстом придатним для редагування, які дбайливо буде пропонувати вибрати потрібні налаштування. Вийдуть такий собі напівавтоматичний режим, справах тільки загальні налаштування, не вникаючи в нюанси.

Можна піти по більш складному шляху, пройшовшись ручками по кожному пункту окремо, зате зможете зробити купу додаткових правок і тонких налаштувань, які дозволять отримати більш якісний кінцевий результат.

За допомогою кнопки, де намальований сканер, можемо відсканувати потрібний документ або завантажити готову картинку. Після чого отримаємо панель з інструментами за допомогою, якої можемо підкоригувати зображення, повернути його і вибрати область для розпізнавання.

Кнопочка з циркулем, дозволяє зробити розмітку сторінки, виділяючи колонки, зображення і блоки з текстом. Всі блоки, які будуть знайдені, можна редагувати, пересуваючи їх і змінюючи розміри за допомогою миші. Поводите курсором близько синіх ліній і побачите, як він мінятимуть свою форму, далі, думаю, самі розберетеся.

Програма для розпізнавання тексту cuneiform, яка не дружить зі сканерами

Іонкой з окулярами, розпізнаємо безпосередньо текст, в підготовлених областях. Після того як текст буде готовий, клацніть по будь-букві і побачите ту ділянку малюнка картинки, на якому вона була знайдена.

Залежно від того на якому етапі будете перебувати панель інструментів буде міняти свій вміст, пропонуючи потрібні на конкретному етапі інструменти.

Тепер перейдемо до сумного на Windows 7 відмовився працювати зі сканером, програма його бачила, сканер навіть починав гудіти, і на моніторі бігла пунктирна лінія свідчить що йде передача даних, а в кінці викидала помилку. Всі танці з бубном і читання форумів не дало позитивних результатів. У тому числі редагування файлу «Face.INI», де за рекомендацією було виправлено «TWAIN_TransferMode = memory-buffered» на TWAIN_TransferMode = memory-native ». У підсумку довелося робити обхідний маневр, сканувати текст стандартними засобами Windows, а в CuneiForm підсовувати готову картинку.

Ще погано, що не підтримуються pdf фали самою програмою. Доводиться вдаватися до обхідних маневрів, використовувати сторонні програми щоб з pdf документів робити картинки, а потім задіяти OCR. Але знову через низький дозволу картинок, якість розпізнавання тексту дуже низька, тому потім доводиться багато чого виправляти руками.

Мало не забув, перший запуск на Windows Vista і 7 краще робити від імені адміністратора, інакше програма впаде в транс на кілька хвилин, не подаючи ознак життя.

Програма дійсно працює з усіма основними мовами, їх близько 20 штуку включаючи російською, англійською, українською, німецькою, французькою, іспанською, італійською та змішаному російсько-англійському.

У нинішньому вигляді не можу рекомендувати для використання звичайним користувачам. Хто ризикнув спробувати CuneiForm, морально підготуватися, що з першого разу хороших результатів не вийде, і вирішення виниклих проблем доведеться шукати самим.

Працює в 32-х і 64-х бітових операційних системах. Інтерфейс повністю російською мовою, і схоже інших варіантів не пропонується.

Остання версія на момент написання CuneiForm V12

Розмір програми: архів 33,3Мб

Сумісність: Windows Vista і 7, Windows Xp