Adobe acrobat xi створення індексів файлів pdf

Створення та управління індексом в PDF

Можна зменшити витрачається на пошук великого файлу PDF час шляхом вбудовування індексу слів документа. Acrobat здійснює пошук за індексом значно швидше, ніж пошук по документу. Вбудований індекс включається в поширювані копії файлів PDF. Пошук по файлів PDF з вбудованим індексом відбувається точно також, як якщо б індексу не було; ніяких додаткових кроків не потрібно.

Додавання індексу в файл PDF

  1. У документі, відкритому в програмі Acrobat, виберіть «Інструменти»> «Обробка документа»> «Керувати вбудованим індексом».
  2. У діалоговому вікні "Керування вбудованим покажчиком» клацніть «Інтеграція покажчик».
  3. Прочитайте повідомлення, що з'явилися і натисніть «ОК».

Примітка. В Outlook і Lotus Notes є можливість вбудовування індексу при перетворенні повідомлень електронної пошти або папок в PDF. Особливо це рекомендується для папок, що містять багато повідомлень електронної пошти.

Оновлення або видалення вбудованого індексу в документі PDF

  1. Виберіть «Інструменти»> «Обробка документа»> «Керувати вбудованим індексом».
  2. Клацніть або «Оновити покажчик», або «Видалити покажчик».

Про функції «Каталог» (Acrobat Pro)

Можна зробити певну групу документів PDF каталогом і створити загальний індекс для всіх вхідних в нього документів. Індекс дозволяє набагато швидше здійснювати процедуру пошуку певних даних в каталогізованих документах PDF.

Підготовка документів PDF до індексації (Acrobat Pro)

Спочатку необхідно створити папку, в якій будуть зберігатися індексовані файли PDF. Всі файли PDF повинні містити дані вмісту і електронних властивостей, таких як посилання, закладки та поля форм. Якщо індексовані файли містять скановані документи, переконайтеся, що текст цих документів розпізнаний і може бути використаний при пошуку. Для підвищення продуктивності пошуку розбийте довгі документи на невеликі документи розміром з одну главу. Для поліпшення пошуку до властивостей документа можна додати відповідні відомості.

Перед індексуванням колекції документів важливо встановити структуру документа на диску або томі мережевого сервера і перевірити імена міжплатформених файлів. Імена файлів можуть виявитися урізаними, а міжплатформений пошук внаслідок цього - скрутним. Щоб уникнути цієї проблеми, виконайте подальші вказівки.

Перейменуйте файли, папки і індекси відповідно до угоди про іменування файлів в MS-DOS (вісім-менш символів, за якими слід файлове розширення з трьох символів). Це тим більш необхідно зробити, якщо планується поставляти колекцію документів разом з індексом на компакт-диску формату ISO 9660.

Видаліть з імен файлів і папок символи розширеного набору, наприклад символи наголосів або неанглійських символи. (Шрифт, використовуваний функцією «Каталог», не підтримує коди символів з 133 по 159.)

Не використовуйте папки з глибоким рівнем вкладення або з довжиною шляху до файлу, що перевищує 256 символів, в індексах, які будуть використовуватися для Mac OS.

При використанні Mac OS на сервері OS / 2 LAN налаштуйте IBM® LAN Server Macintosh (LSM) так, щоб використовувалися імена файлів MS-DOS, або Індексуйте тільки томи FAT. (Тома HPFS [High Performance File System] можуть містити довгі неізвлекаемой імена файлів).

Якщо структура документа включає в себе папки, не призначені для індексування, їх можна виключити з процесу індексування.

Додавання метаданих до властивостей документа (Acrobat Pro)

(Windows) Вводити і переглядати відомості про властивості документа можна прямо з робочого столу. У Провіднику Windows клацніть правою кнопкою документ, виберіть пункт «Властивості» і перейдіть на вкладку «PDF». Будь-яка інформація, введена або змінена в цьому діалоговому вікні, буде також відображатися в описі властивостей документа при відкритті файлу.

При додаванні даних в якості документа дотримуйтеся наступних рекомендацій:

Використовуйте інформативний заголовок в поле «Тема». Файл документа повинно відображатися в діалоговому вікні «Результати пошуку».

Для інформації подібного роду завжди використовуйте один і той же поле. Наприклад, не рекомендується додавати важливий термін в поле «Тема» для одного документа і той же термін в поле «Ключові слова» для іншого документа.

Використовуйте однакові, узгоджені терміни для однакових даних. Наприклад, не рекомендується використовувати слово біологія для одних документів і термін наука про життя для інших.

Якщо ви використовуєте номери для позначення різних частин документа, додайте їх в якості ключових слів. Наприклад, додавання в ключові слова doc # = m234 може позначати певний документ з декількох сотень документів на задану тематику.

Для класифікації документів за типом використовуйте поля «Тема» і «Ключові слова» або окремо, або в поєднанні один з одним. Наприклад, для одного документа в поле «Тема» можна вказати звіт про стан. а в поле «Ключові слова» внести слова щомісячний або щотижневий.

Якщо у вас вже є досвід роботи з документами Adobe PDF. то при створенні індексу можна визначити користувальницькі поля, наприклад «Тип документа». «Номер документа» і «Ідентифікатор документа». Це робити рекомендується тільки досвідченим користувачам, і про це немає відомостей в "Повною довідці» Acrobat.

Створення індексу для колекції (Acrobat Pro)

При побудові нового індексу Acrobat створює файл з розширенням .pdx і нову допоміжну папку, в якій міститься один або декілька файлів з розширенням .idx. IDX-файли містять записи індексу. Всі ці файли повинні бути доступні користувачам, які хочуть здійснювати пошук за індексом.

Adobe acrobat xi створення індексів файлів pdf

Діалогові вікна в програмі Acrobat Pro. використовувані для створення індексу

  1. Виберіть «Інструменти»> «Обробка документа»> «Повнотекстовий індекс для каталогу» і натисніть «Новий індекс».

Примітка. Якщо панель «Обробка документа» недоступна, див. Інструкції по додаванню панелей в Області завдань

  • В поле «Тема індексу» введіть ім'я файлу індексу.
  • В поле «Опис індексу» введіть кілька слів, що описують тип індексу і його призначення.
  • Натисніть кнопку «Параметри» і виберіть додаткові параметри, які необхідно застосувати до індексу. Потім натисніть кнопку «ОК».
  • В області «Включити ці папки» натисніть кнопку «Додати», виберіть папку, яка містить деякі або всі файли PDF для індексування, і потім натисніть кнопку «ОК». Щоб додати інші папки, повторіть цей крок.

    Примітка. В процес індексування будуть включені всі папки обраної папки. Якщо не планується переміщати індекс або будь-які елементи колекції документів, до цього списку можна додавати папки, розташовані на різних серверах або дискових накопичувачах.

    Натисніть кнопку «Закрити» після закінчення процесу індексування.

    Натисніть кнопку «Зупинити» для скасування процесу індексування.

    Примітка. При зупинці процесу індексування відновити той же сеанс індексування можна, проте повторювати все попередні дії вже не потрібно. Ваш вибір і папки зберігаються. Можна виконати команду «Відкрити індекс», вибрати частково завершений індекс і виправити його.

    Якщо при використанні параметрів «Включити ці папки» і «Виключити ці папки» довгі імена шляхів виявляться усічені, наведіть курсор на символ трьох крапок (.) І почекайте, поки не з'явиться підказка, що відображає повний шлях до включеної або виключеною папці.

    Діалогове вікно «Параметри»

    Не вмикати числа При виборі цього параметра з індексу виключаються всі числа, що входять в текст документа. Виняток з індексу чисел може істотно скоротити розмір індексу і прискорити пошук.

    Додавати ідентифікатори до файлів Adobe PDF версії 1.0 Цей параметр встановлюється, якщо колекція документів містить файли PDF, створені в програмі Acrobat версії нижче 2.0, в яких ідентифікатори не додають автоматично. Ідентифікатори необхідні, коли довгі імена файлів в Mac OS скорочуються при їх перекладі в імена файлів DOS. Програма Acrobat 2.0 і пізніших версій автоматично додає ці ідентифікатори.

    Чи не попереджати про змінені документах в процесі пошуку Якщо цей параметр не вибрано, при пошуку в документах, що змінилися з моменту останнього побудови індексу, з'являється відповідне повідомлення.

    Замовні властивості Цей параметр використовується для включення в індекс призначених для користувача властивостей документа. Індексуються тільки призначені для користувача властивості документа, вже існуючі в індексованих документах PDF. Введіть властивість, зробіть вибір в меню «Тип» і потім натисніть кнопку «Додати». Ці властивості з'являються в якості параметрів пошуку в меню додаткових критеріїв пошуку вікна «Пошук в PDF» при пошуку в підсумковому індексі. Наприклад, якщо ввести для користувача властивість «Ім'я документа» і визначити його в меню «Тип» як строкове, то при пошуку в індексі можна здійснювати пошук за цим призначеному для користувача властивості, вибравши в меню «Використовувати додаткові критерії» параметр «Ім'я документа».

    Примітка. При створенні в додатку Microsoft Office користувальницьких полів, для яких в додатку PDFMaker встановлений параметр «Перетворення відомостей про документ», поля будуть перетворюватися для будь-яких створюваних PDF-файлів.

    Поля XMP Цей параметр використовується для включення користувальницьких полів XMP. Призначені для користувача поля XMP індексуються і відображаються в спливаючих меню додаткових критеріїв пошуку для включення в пошук по обраним індексам.

    Винятки Цей параметр використовується для виключення окремих слів (максимум 500) з результатів пошуку за індексом. Введіть слово, натисніть кнопку «Додати». При необхідності повторіть цю дію. Виняток слів може привести до зменшення розмірів індексу на 10 - 15%. Стоп-слово може містити до 128 символів і є чутливим до регістру.

    Примітка. Щоб користувачі марно не вводили пошукові запити, що містять ці слова, список Неіндексований слів наведено в файлі Readme каталогу.

    Теги структури Цей параметр використовується для забезпечення можливості пошуку по вузлах тегів в документах, що мають тегованих логічну структуру.

    Примітка. Параметри «Замовні властивості», «Винятки» і «Теги структури» застосовуються тільки до поточного індексу. Щоб застосувати ці параметри для всіх створюваних індексів, можна змінити настройки за замовчуванням для призначених для користувача полів, стоп-слів і тегів в панелі «Каталог» в діалоговому вікні «Параметри».