Різниця між поняттями «інформація» і «дані»
Дані - це теж знання, проте знання абсолютно особливого роду. У першому наближенні дані -це результат мовної фіксації одиничного спостереження, експерименту, факту або ситуації [78]. Прикладами даних можуть бути:
а) «такого-то числа, такого-то року, в момент t в певній місцевості йшов дощ» (метеорологічне дане) ';
б) «ціна ділової деревини в такій-то день такого-то року, за відомостями такий-то біржі, становила стільки-то доларів за тонну» (торгова дане);
в) «дефіцит державного бюджету в такий-то країні становив в такому-то році стільки-то мільярдів доларів» (фінансове дане);
г) «в такий-то момент часу автоматична лабораторія, котра направляється до Юпітера, відхилилася від розрахункової траєкторії на стільки-то градусів, стільки-то тисяч кілометрів в такому-то напрямку» (дані зі сфери космічної технології).
З технологічної точки зору деякі фахівці поняття «дані», як правило, визначають як інформацію, яка зберігається в базах даних і обробляється прикладними програмами, або інформація, представлена у вигляді послідовності символів і призначена для обробки в ЕОМ [67], тобто дані включають тільки ту частину знань, які формалізовані в такій мірі, що над ними можуть здійснюватися процедури формалізованої обробки за допомогою різних технічних засобів.
Дані - це інформація, подана у формалізованому вигляді, придатному для автоматичної обробки при можливу участь людини [116]. Дані - це інформація, записана (закодована) на мові машини [66]. Дані - це окремі факти, що характеризують об'єкти, процеси і явища в предметній області, а також їх властивості [40].
Між інформацією та даними існує відмінність; Дані можуть розглядатися як ознаки або записані спостереження, які з якихось причин не використовуються, а тільки зберігаються. Отже, в даний момент часу вони не впливають на поведінку, на прийняття рішень. Однак дані перетворюються в інформацію, якщо такий вплив існує.
Наприклад, основний масив даних для ЕОМ складається з таких ознак, що не впливають на поведінку. Поки ці дані не організовані відповідним чином і не відображаються у вигляді вихідного результату, щоб керівник діяв відповідно до них, вони не є інформацією. Вони залишаються даними до тих пір, поки працівник не звернувся до них у зв'язку із здійсненням тих чи інших дій або в зв'язку з деяким рішенням, яке він зобов'язаний прийняти.
Дані перетворюються в інформацію, коли усвідомлюється їх значення. Можна також сказати, що в тому випадку, коли з'являється можливість використовувати дані для зменшення невизначеності про що-небудь, дані перетворюються в інформацію.
Цикли життя даних
Подібно речовині і енергії, дані можна збирати, обробляти, зберігати, змінювати їх форми. Однак у них є деякі особливості. Перш за все, дані можуть створюватися і зникати. Так, наприклад, дані про деяке вимерлому тваринному можуть зникнути, коли спалюється шматок вугілля з його відбитками. Дані можуть стиратися, втрачати точність і т.д. Дані можуть бути охарактеризовані циклом життя (рис. 1.9), в якому основне значення мають три аспекти - зародження, обробка, зберігання і пошук [56].
Відтворення і використання даних може здійснюватися в різні моменти їхнього життєвого циклу і тому на схемі не показані.
Мал. 1.9. Цикл «життя» даних
При обробці на ЕОМ дані трансформуються, умовно проходячи наступні етапи:
1) дані як результат вимірювань і спостережень:
2) дані на матеріальних носіях інформації (таблиці, протоколи, довідники);
3) моделі (структури) даних у вигляді діаграм, графіків, функцій;
4) дані в комп'ютері на мові опису даних;
5) бази даних на машинних носіях.
У сучасному трактуванні модель даних визначається як сукупність правил породження структур даних в базах даних, операцій над ними, а також обмежень цілісності, що визначає допустимі зв'язку і значення даних, послідовності їх зміни [76].
Таким чином, модель даних являє собою безліч структур даних, обмежень цілісності і операцій маніпулювання даними. Виходячи з цього, можна сформулювати наступне робоче визначення: модель даних - це сукупність структур даних та операцій їх обробки.
В даний час розрізняють 'три основних типи моделей даних: ієрархічна, мережева і реляційна. Ієрархічна модель даних організовує дані у вигляді дерева і є реалізацією логічних зв'язків: родовідових відносин або відносин «ціле - частина». Наприклад, структура вищого навчального закладу - це багаторівнева ієрархія (див. Рис. 1.10).
Мал. 1.10. Приклад ієрархічної структури
Ієрархічна (деревоподібна) БД складається з упорядкованого набору дерев; більш точно, з упорядкованого набору кількох примірників одного типу дерева. У цій моделі вихідні елементи породжують інші елементи, причому ці елементи в свою чергу породжують такі елементи. Кожен породжений елемент має тільки один породжує елемент. Організаційні структури, списки матеріалів, зміст у книгах, плани проектів, розклад зустрічей і багато інших сукупності даних можуть бути представлені в ієрархічному вигляді.
Основними недоліком даної моделі є: а) складність відображення зв'язку між об'єктами типу «багато до багатьох»; б) необхідність використання тієї ієрархії, яка була закладена в основу БД при проектуванні. Потреба в постійній реорганізації даних (а часто неможливість цієї реорганізації) призвели до створення більш загальної моделі - мережевий.
Мережевий підхід до організації даних є розширенням ієрархічного підходу. Дана модель відрізняється від ієрархічної тим, що кожен породжений елемент може мати більше одного породжує елементу. Приклад мережевий моделі даних наведено на рис 1.11.

Мал. 1.11. Приклад мережевої структури
Одним з недоліків розглянутих вище моделей даних є те, що в деяких випадках при ієрархічному і мережевому уявленні зростання бази даних може привести до порушення логічного представлення даних. Такі ситуації виникають при появі нових користувачів, нових додатків і видів запитів, при обліку інших логічних зв'язків між елементами даних. Ці недоліки дозволяє уникнути реляційна модель даних.
Реляційної вважається така база даних, в якій всі дані представлені для користувача у вигляді прямокутних таблиць значень даних, і всі операції над базою даних зводяться до маніпуляцій з таблицями.
Кожен стовпець має ім'я, яке зазвичай записується у верхній частині таблиці. Ці стовпці називаються полями таблиці. При проектуванні таблиць в рамках конкретної СУБД є можливість вибрати для кожного поля його тип, тобто визначити для нього набір правил по його відображенню, а також визначити ті операції, які можна, виконувати над даними, що зберігаються в цьому полі. Набори типів можуть відрізнятися у різних СУБД.
Ім'я поля має бути унікальним в таблиці, проте різні таблиці можуть мати поля з однаковими іменами. Будь-яка таблиця повинна мати, принаймні, одне поле; поля розташовані в таблиці відповідно до порядку проходження їхніх імен при її створенні. На відміну від полів, рядки не мають імен; порядок їх слідування в таблиці не визначений, а кількість логічно не обмежена. Рядки називаються записами таблиці.
Так як рядки в таблиці не впорядковані, неможливо вибрати рядок по її позиції - серед них не існує "першої", "другий", "останньої". Будь-яка таблиця має один або декілька стовпців, значення в яких однозначно ідентифікують кожен її рядок. Такий стовпець (або комбінація стовпців) називається первинним ключем. У таблиці Спортивна секція первинний ключ - це стовпець П.І.Б. (Рис. 1.12).
Такий вибір первинного ключа має істотний недолік: неможливо записати в секцію двох дітей з одним і тим же значенням поля П.І.Б. що на практиці зустрічається не так уже й рідко. Саме тому, часто вводять штучне поле для нумерації записів у таблиці. Таким полем, наприклад, може бути номер в журналі для кожної дитини, яка зможе забезпечити унікальність кожного запису в таблиці. Якщо таб.ліца задовольняє цій вимозі, вона називається ставленням (relation).

Мал. 1.12. Реляційна модель даних
Реляційні моделі даних зазвичай можуть підтримувати чотири типи зв'язків між таблицями:
1) Один до Одному (приклад: в одній таблиці зберігаються відомості про школярів, в іншій відомості про проходження школярами щеплень).
2) Один до Багатьом (приклад: в одній таблиці зберігаються відомості про вчителів, в іншій відомості про школярів, у яких ці вчителі є класними керівниками).
3) Багато до Одному (як приклад можна запропонувати попередній випадок, розглядаючи його з іншого боку, а саме з боку таблиці, в якій зберігаються відомості про школярів).
4) Багато до Багатьом (приклад: в одній таблиці зберігаються замовлення на поставку товарів, а в іншій - фірми, які виконують ці замовлення, причому для виконання одного замовлення можуть об'єднуватися кілька фірм /
Реляционное уявлення даних має цілий ряд переваг. Воно зрозуміло користувачеві, яка не є фахівцем в області програмування, дозволяє легко додавати нові опису об'єктів і їх характеристики, має велику гнучкість при обробці запитів.
1. Дайте визначення поняттю «дані».
2. Що називається циклом життя даних?
3. Які моделі даних ви знаєте?
4. Вкажіть переваги і недоліки кожної моделі даних.