індексування документів

1. Індексування документів: визначення, основні процеси

Індексування ДОКУМЕНТІВ:
ВИЗНАЧЕННЯ, ОСНОВНІ
ПРОЦЕСИ

Індексування-процес вираження змісту документа і
(Або) запиту на інформаційно-пошуковому мовою (ІПМ) за допомогою
термінів індексірованія- класифікаційних індексів, предметних
рубрик (ПР), ключових слів, дескрипторів, кодів. Іншими словами,
індексування - процес перекладу змісту документів і запитів з
природної мови на ІПМ, в результаті чого створюється пошуковий образ
документа (ПОД) і пошуковий образ запиту (ПОЗ). Таким чином,
відбувається «згортання» інформації, що міститься в документі, і
виклад її на ІПМ у вигляді індексу, предметної рубрики або
дескриптора, ключового слова

Інформаційно-пошукова мова (ІПМ) це спеціально створений
штучна мова, призначений для вираження змісту
документів і (або) запитів з метою їх подальшого пошуку. ІПМ - це
основний елемент логіко-семантичного апарату інформаціоннопоісковой системи (ІПС)
Основні вимоги, що пред'являються до ІПМ:
· Однозначність;
· Достатня семантична сила
· Відкритість (можливість коригування мови)


Отже, в залежності від виду індексування, виділяються
предметізаціонние, класифікаційні та дескрипторного ІПМ. У їх
склад входить безліч ЛЕ і граматичні (парадигматичні та
синтагматические) відносини між ними. ЛЄ - позначення окремого
поняття, прийняте в ІПМ і неподільне в цій функції. ЛЕ можуть
являти собою прийняті в природній мові слова, стійкі
словосполучення, абревіатури, символи, дати, загальноприйняті скорочення,
лексично значущі компоненти складних слів, а також еквівалентні їм
кодові або символічні позначення штучної мови.
Граматичні відносини дозволяють організувати ЛЕ в систему.

індексування документів
online

індексування документів
Categories