Adobe acrobat pro розпізнавання тексту в відсканованих документах
Можна використовувати Acrobat для розпізнавання тексту в раніше відсканованих документах, які вже були перетворені в формат PDF. Додаток оптичного розпізнавання символів (OCR) дозволяє шукати, виправляти і копіювати текст у відсканованому документі PDF. Для оптичного розпізнавання символів в PDF вихідне дозвіл сканера має становити не менше 72 пікселів на дюйм.
Розпізнавання тексту в зісканували документах у форматі PDF: www.adobe.com/go/lrvid_025_acrx_en
Редагування зісканували документів в форматі PDF: www.adobe.com/go/learn_acr_edit_scans_ru
Примітка. Сканування при 300 пікселах на дюйм дає кращі результати для перетворення. При вирішенні 150 dpi точність OCR знижується.
Розпізнавання тексту в окремому документі
- Відкрийте відсканований файл PDF.
- Виберіть «Інструменти»> «Розпізнавання тексту»> «У цьому файлі».
- У діалоговому вікні «Розпізнати текст» виберіть параметр в меню «Сторінки».
- Якщо потрібно, клацніть «Змінити», щоб відкрити діалогове вікно «Загальні параметри розпізнавання тексту» і вкажіть необхідні настройки.
Розпізнавання тексту в кількох документах
- В Acrobat виберіть «Інструменти»> «Розпізнавання тексту»> «У кількох файлах».
- У діалоговому вікні «Розпізнавання тексту» натисніть «Додати файли» та виберіть команду «Додати файли» або «Додати відкриті файли». Потім виберіть файли або папки.
- У діалоговому вікні «Параметри виводу» вкажіть папку і установки для імен файлів.
- У діалоговому вікні «Загальні параметри розпізнавання тексту» виберіть необхідні настройки і натисніть кнопку «ОК».
Діалогове вікно «Загальні параметри розпізнавання тексту»
Мова тексту, що розпізнається Задає мову для системи оптичного розпізнавання символів з метою ідентифікації символів.
PDF на виході Визначає тип створюваного документа PDF. Для всіх параметрів потрібно, щоб дозвіл сканування було не менше 72 пікселів на дюйм або вище (рекомендується). У всіх форматах оптичне розпізнавання символів і розпізнавання шрифтів і макета сторінки застосовується до текстових зображень, після чого вони перетворюються в звичайний текст.
Зображення з пошуком Встановлює, що текст доступний для пошуку і виділення. Даний параметр зберігає вихідне зображення, при необхідності вирівнює сторінку і розміщує над ним невидимий шар тексту. Вибір параметра «Знизити дозвіл зображень» в цьому ж діалоговому вікні визначає, чи буде знижений дозвіл зображення і до якої міри.
Зображення з пошуком (точно) Встановлює, що текст доступний для пошуку і виділення. Даний параметр зберігає вихідне зображення і розміщує над ним невидимий шар тексту. Рекомендується у випадках, де необхідна максимальна ступінь відповідності вихідного зображення.
ClearScan Синтезує новий шрифт Type 3, максимально схожий на вихідний і зберігає фон сторінки, використовуючи копію з низьким дозволом.
Даунсамплінг Знижує кількість пікселів в кольорових зображеннях, зображеннях в градаціях сірого та монохромних зображеннях після завершення розпізнавання тексту. Виберіть ступінь зниження дозволу, яку потрібно застосувати. Більше значення задає вищий поріг, з якого починається обробка, і в підсумку в документах PDF дозвіл буде не нижче заданого в цьому полі.