Класифікація та кодування інформації

Класифікація та кодування інформації

Заснованим носієм інформації у зовнішньому середовищі є документ.

До засобів організації і ведення зовнішньої ІБ належать: системи класифікації і кодування техніко-економічної інформації, яка міститься в документах.

Системи класифікації - це сукупність правил розподілу об'єктів заданої множини на, підмножини. Вони повинні гарантувати охоплення всіх об'єктів класифікації в заданих межах; характеризуватися достатньою і економічно виправданою глибиною; забезпечувати вирішення комплексу задач автоматизованої інформаційної системи різних рівнів; бути гнучкими для можливого збільшення кількості класифікованих об'єктів, угруповань і ознак і внесення необхідних змін без порушення структури класифікації.

При класифікації найбільш широко використовуються ієрархічна і фасетна системи класифікації.

Ієрархічна - це така система класифікації, між класифікаційними угрупованнями якої існують відносини підпорядкування. Класифіковані об'єкти діляться за деяким обраним ознакою (основою розподілу) на значні угруповання, потім кожне угруповання розбивається на ряд наступних угруповань, які в свою чергу розпадаються на ін. Поступово конкретизуючи об'єкт класифікації. При побудові ієрархічної системи класифікації необхідно дотримуватися таких правил: розподіл кожної класифікаційної угруповання потрібно проводити тільки по одній основі; одержувані в результаті поділу угруповання не повинні повторюватися; класифікаційні угруповання об'єктів повинні характеризуватися високим ступенем однорідності ознак, прийнятих за основу поділу.

Основні переваги ієрархічної системи класифікації полягають в її великої інформаційної ємності, традиційності і звичності застосування (пристосованості) для обробки інформації, в можливості створення кодів для об'єктів класифікації. Недоліком цієї системи класифікації є слабка гнучкість структури, обумовлена ​​фіксованістю постійних ознак (основи поділу) і заздалегідь встановленим порядком їх проходження, яке не допускає включення нових об'єктів і класифікаційних угруповань.

Фасетная - це така система класифікації, при якій безліч, яке класифікується, утворює незалежні угруповання з різних аспектів класифікації. Вона не має жорсткої класифікаційної структури і наперед побудованих кінцевих угруповань. При такій системі безліч об'єктів з деяким набором, ознак (фасетів), значення яких відповідають їх конкретному вираженню, ділиться багаторазово і незалежно. Фасети найчастіше представлені у вигляді простого переліку. Основна перевага фасетной системи класифікації гнучкість структури. Фасетна система класифікації дозволяє не тільки утворювати нові класифікаційні угруповання з наявних фасетів, а й включати нові і виключати старі фасета. Недоліками фасетной системи класифікації є неповне використання ємності, обумовлене відсутністю на практиці багатьох з можливих з'єднань фасетів; не традиційні і незвичність в застосуванні.

Системи кодування - це сукупність правил позначення об'єктів класифікації і класифікаційних угруповань. Системи кодування повинні містити необхідну інформацію про об'єкти, здійснювати в межах заданої множини об'єктів класифікації однозначне визначення об'єкта; забезпечувати по можливості мінімальну довжину кодового позначення і достатній резерв незалежних кодових позначень для збереження можливості кодування нових обсягів без порушення структури класифікатора.

Класифікатор - це систематизоване зведення найменувань класифікаційних угруповань, об'єктів, ознак класифікації і їх кодових позначень. Код - це умовне цифрове позначення окремої позиції об'єкта класифікації, побудованого за певною системою.

Залежно від основи кодування розрізняють реєстраційні і класифікаційні системи кодування. У реєстраційній системі кодове позначення утворюється наскрізний послідовної реєстрацією позицій (елементів, об'єктів) або реєстрацією об'єктів в виділених межах. Реєстраційні системи кодування діляться на порядкову і серійно-порядкову.

Порядкова система застосовується для кодування простих, однозначних і стійких номенклатур. Вона передбачає кодування позицій (елементів, об'єктів) номенклатури строго послідовно, у міру збільшення чисел натурального ряду 1, 2, 3. Перевагою даної системи є простота будови; малозначність. Недолік полягає в тому, що система не передбачає групування об'єктів за однорідними ознаками, а це ускладнює автоматичне отримання результатів за однорідними ознаками.

Серійно-порядкова система кодування на відміну від порядкової виділяє для кожної групи ознак певну серію номерів з урахуванням можливого розширення номенклатури. У межах кожної серії об'єктів надаються номери по порядку. Перевага серійно-порядкової системи полягає в можливості присвоєння кодів новим об'єктам, без порушення прийнятої послідовності розташування. Недоліком цієї системи є те, що вона не забезпечує автоматичного отримання результатів по групах однорідних ознак.

При класифікаційної системі кодування елементи попередньо систематизуються за певними класифікаційними ознаками. Класифікаційні системи діляться на послідовну (десяткова, порозрядно) і паралельну (комбіновану).

Послідовна система застосовується для кодування номенклатур з багатьма ознаками, де кожен класифікаційний ознака має певну кількість розрядів в залежності від кількості позицій. Послідовна система забезпечує злагодженість кодів, чітке виділення класифікаційної ознаки, автоматичне отримання результатів декількох ступенів. Проте, не дивлячись на переваги цієї системи, вона має недоліки: багатозначність, громіздкість і складність будови.

Паралельна (комбінована) система застосовується для кодування багатозначних номенклатур, які одночасно характеризуються і соподчинением, і незалежністю окремих класифікаційних ознак. При паралельній системі найбільш повно використовуються окремі переваги різних систем кодування.

До недоліків паралельної системи кодування потрібно віднести її складність і багатозначність. Проте ця система має значну гнучкість і дає можливість застосовувати найбільш раціональні варіанти відповідно до конкретних умов.