Adobe acrobat pro розпізнавання тексту в відсканованих документах

Можна використовувати Acrobat для розпізнавання тексту в раніше відсканованих документах, які вже були перетворені в формат PDF. Додаток оптичного розпізнавання символів (OCR) дозволяє шукати, виправляти і копіювати текст у відсканованому документі PDF. Для оптичного розпізнавання символів в PDF вихідне дозвіл сканера має становити не менше 72 пікселів на дюйм.

Розпізнавання тексту в зісканували документах у форматі PDF: www.adobe.com/go/lrvid_025_acrx_en

Редагування зісканували документів в форматі PDF: www.adobe.com/go/learn_acr_edit_scans_ru

Примітка. Сканування при 300 пікселах на дюйм дає кращі результати для перетворення. При вирішенні 150 dpi точність OCR знижується.

Розпізнавання тексту в окремому документі

Відкрийте відсканований файл PDF.
Виберіть «Інструменти»> «Розпізнавання тексту»> «У цьому файлі».
У діалоговому вікні «Розпізнати текст» виберіть параметр в меню «Сторінки».
Якщо потрібно, клацніть «Змінити», щоб відкрити діалогове вікно «Загальні параметри розпізнавання тексту» і вкажіть необхідні настройки.

Розпізнавання тексту в кількох документах

В Acrobat виберіть «Інструменти»> «Розпізнавання тексту»> «У кількох файлах».
У діалоговому вікні «Розпізнавання тексту» натисніть «Додати файли» та виберіть команду «Додати файли» або «Додати відкриті файли». Потім виберіть файли або папки.
У діалоговому вікні «Параметри виводу» вкажіть папку і установки для імен файлів.
У діалоговому вікні «Загальні параметри розпізнавання тексту» виберіть необхідні настройки і натисніть кнопку «ОК».

Діалогове вікно «Загальні параметри розпізнавання тексту»

Мова тексту, що розпізнається Задає мову для системи оптичного розпізнавання символів з метою ідентифікації символів.

PDF на виході Визначає тип створюваного документа PDF. Для всіх параметрів потрібно, щоб дозвіл сканування було не менше 72 пікселів на дюйм або вище (рекомендується). У всіх форматах оптичне розпізнавання символів і розпізнавання шрифтів і макета сторінки застосовується до текстових зображень, після чого вони перетворюються в звичайний текст.

Зображення з пошуком Встановлює, що текст доступний для пошуку і виділення. Даний параметр зберігає вихідне зображення, при необхідності вирівнює сторінку і розміщує над ним невидимий шар тексту. Вибір параметра «Знизити дозвіл зображень» в цьому ж діалоговому вікні визначає, чи буде знижений дозвіл зображення і до якої міри.

Зображення з пошуком (точно) Встановлює, що текст доступний для пошуку і виділення. Даний параметр зберігає вихідне зображення і розміщує над ним невидимий шар тексту. Рекомендується у випадках, де необхідна максимальна ступінь відповідності вихідного зображення.

ClearScan Синтезує новий шрифт Type 3, максимально схожий на вихідний і зберігає фон сторінки, використовуючи копію з низьким дозволом.

Даунсамплінг Знижує кількість пікселів в кольорових зображеннях, зображеннях в градаціях сірого та монохромних зображеннях після завершення розпізнавання тексту. Виберіть ступінь зниження дозволу, яку потрібно застосувати. Більше значення задає вищий поріг, з якого починається обробка, і в підсумку в документах PDF дозвіл буде не нижче заданого в цьому полі.