Сучасні інформаційні сховища, автоматизований банк даних - інформаційні системи і
Сучасні інформаційні сховища
В даний час використання баз даних не дає бажаного результату від автоматизації діяльності організації. Причина проста: реалізовані функції значно відрізняються від функцій ведення бізнесу, так як дані, зібрані в базах, не адекватні інформації, необхідної особам, які приймають рішення. Рішенням даної проблеми стала реалізація технології автоматизованого банку даних та інформаційних сховищ [8, 9].
Автоматизований банк даних
Автоматизований банк даних (АБД) - це система інформаційних, математичних, програмних, мовних, організаційних і технічних засобів, які необхідні для інтегрованого нагромадження, зберігання, ведення, актуалізації, пошуку і видачі даних. АБД класифікують за ознаками:
1) за призначенням, АБД бувають:
- Спеціалізованими по окремих галузях науки і техніки;
- Банками даних для автоматизації задач організаційно-економічного управління;
- Банками даних для систем автоматизації наукових досліджень і виробничих випробувань;
- Банками даних для систем автоматизованого проектування.
2) з архітектури обчислювального середовища, АБД бувають централізованими і розподіленими.
3) з вигляду зберігається, розрізняють: банки даних, банки документів і банки знань.
4) за мовою, якою ви спілкуєтесь з БД розрізняють: системи з базовою мовою (відкриті системи) і власною мовою (закриті системи). У відкритих системах мовним засобом спілкування з БД є одна з мов програмування, наприклад Фортран, Паскаль і ін. В таких системах для спілкування з БД потрібний посередник, тобто програміст, який володіє відповідною мовою програмування. Закриті системи мають власну мову спілкування, яка набагато простіше, ніж мови програмування. Тому в таких системах не потрібний посередник-програміст для спілкування з БД. Самі користувачі за відповідної підготовки можуть працювати з БД.
Основними складовими компонентами АБД є база даних і система управління БД (СУБД) [8, 9].
База даних-це пойменована, структурована сукупність взаємопов'язаних даних, що характеризують окрему предметну область і перебувають під управлінням СУБД. БД являє собою інтегроване сховище даних, яке призначене для використання багатьма споживачами і забезпечення незалежності даних від прикладних програм. Зв'язок кінцевих користувачів і додатків з БД відбувається через СУБД, яка є інтерфейсом між користувачами і БД.
Під предметною областю розуміють один або більше об'єктів управління, інформація яких моделюється за допомогою БД і використовується для вирішення різних функціональних завдань. Всі дані, які зберігаються в БД, поділяють на фонд і архів даних. Такий поділ пов'язаний з різницею в технологічних режимах використання даних.
Фонд даних - це активні дані, з якими постійно працюють додатки, які зберігаються на вінчестері і знаходяться безпосередньо під управлінням СУБД.
Архіви - це копії файлів БД, які зберігаються на різних носіях. В архівах зберігаються неактивні дані, які вже відпрацювали, але які необхідно зберігати відповідно до законодавчих та нормативних актів досить тривалий час. В архівах також можуть зберігатися страхові копії файлів БД, які використовуються для відновлення БД у разі її руйнування через різні збої.
Особливістю БД є те, що вона складається з даних і їх опису. Опис даних називають метаданими. Метадані дозволяють реалізувати незалежність даних від прикладних програм. При файлової організації даних потрібно в кожній прикладній програмі повністю описати структури відповідних інформаційних файлів, незалежно від того, скільки полів обробляється в тій чи іншій програмі. При використанні БД в програмі потрібно описувати тільки поля, необхідні для обробки. Отже, метадані є незалежними від прикладних програм і являють собою самостійний об'єкт для зберігання.
У АБД існує ще таке поняття, як словник даних (СД). СД дуже важливий, особливо в умовах колективного використання даних, оскільки забезпечує вирішення проблеми достовірності, надмірності і контролю за раціональним зберіганням і використанням даних.
Словник даних (репозитарій) необхідний для збереження метаданих. Словник даних може містити відомості про джерело інформації "формати і взаємозв'язок між даними" відомості про частоту виникнення і характер використання даних, терміни коригування і осіб, відповідальних за це, і т. Ін. Отже, СД являє собою базу даних про дані як особливий вид ресурсу.
Одне з основних призначень СД - документування даних. Йому відводиться роль засобу централізованого ведення і управління даними на всіх етапах проектування системи, а також забезпечення ефективної взаємодії між усіма користувачами в розподіленої БД. У СД може бути занесена інформація про місце фізичного зберігання даних, а також відомості про обмеження секретного характеру, безпеки, доступу та інші питання, що характеризують фізичні параметри БД.
Пакет програм ведення СД може інтегруватися з СУБД або бути незалежним. На сучасному ринку програмних засобів є СУБД, які мають в своєму складі засоби автоматизованого ведення СД.
Словником даних користуються всі користувачі в обсязі, який дозволяють їх привілеї.
До складу АБД обов'язково входить такий компонент, як СУБД, являє собою комплекс програмних і мовних засобів загального і спеціального призначення, необхідних для створення БД, підтримки її в актуальному стані, маніпулювання даними та організації доступу до них різних користувачів або додатків в умовах діючої технології обробки даних.
Всі численні функції СУБД можна згрупувати наступним чином:
1. Управління даними. Завданнями управління даними є підготовка даних і їх контроль, занесення даних в базу, структуризація даних, забезпечення їх цілісності, секретності.
2. Доступ до даних. Пошук і селекція даних, перетворення даних в форму, зручну для подальшого використання.
3. Організація і ведення зв'язку з користувачем ведення діалогу, видача діагностичних повідомлень про помилки в роботі з БД і т.д.
До складу АБД, крім БД і СУБД, входять мовні, технічні та організаційні засоби. Розглянемо кожен з них.
Мова опису даних (МОД) застосовується на різних рівнях абстракції: зовнішньому, логічному і внутрішньому. Мови опису даних на логічному (концептуальному) і внутрішньому рівнях незалежні і різні. Однак в більшості промислових СУБД немає поділу на дві окремі мови опису логічної і фізичної організації даних, а існує єдина мова, яку ще називається мовою опису схем.
Якщо логічний і фізичний рівні розділені, то до складу СУБД повинен входити мова зберігання даних.
Мова опису даних на зовнішньому рівні - це мова, яка використовується для опису потреб користувачів і додатків, при створенні інфологічної моделі БД. Ця мова не має нічого спільного з мовами програмування. Наприклад, мовними засобами для інфологіческого моделювання є звичайна мова або її підмножина, а також мова графів і матриць.
Мова маніпулювання даними (ММД) - це мова, яка використовується для обробки даних, їх перетворень і написання програми. ММД може бути базовою або автономною. Базова мова (відкриті системи) - це одна з традиційних класичних мов програмування. Використання базових мов як ММД звужує коло осіб, які можуть безпосередньо звертатися до БД, оскільки для цього потрібне знання мови програмування. У такому випадку для спрощення спілкування кінцевих користувачів з БД в деяких СУБД передбачена мова ведення діалогу і мова запитів, простіше для освоєння порівняно з мовою програмування. Автономна ММД (закрита система) - це власна мова СУБД, яка дозволяє виконувати різні операції з даними.
В сучасних СУБД для спрощення процедур пошуку даних в БД передбачена мову запитів. Найбільш поширеними мовами запитів є дві мови SQL і QBE.
Мова запитів SQL (StructuredEnglish QueryLanguage) була створена фірмою ШМ в рамках роботи над проектом побудови системи керування базами даних на початку 70-х років. Американським національним інститутом стандартів (ANSI) ця мова покладена в основу стандарту мов реляційних баз даних, яка була прийнята і Міжнародною організацією стандартів (ISO). Ядром існуючого зараз стандарту SQL-86, який часто називають SQL-2 або SQL-92, є функції, які реалізовані практично у всіх відомих комерційних варіантах мови, а повний стандарт включає такі удосконалення, які ще деяким розробникам потрібно буде реалізувати.
Крім стандарту SQL-86, існує комерційний стандарт мови SQL, який розроблений консорціумом виробників баз даних SQL Access Group. Ця група створила такий варіант мови, який використовується більшістю систем і дозволяє "розуміти" один одного. Був розроблений стандартний інтерфейс мови CLI (CommonLanguagelnterface) для всіх основних варіантів мови SQL. Фірмою Microsoft цей інтерфейс був формалізований, і отримав назву ODBC (OpenDatabalseConnectiviti) - відкритий доступ до даних. ODBC - це драйвер, що забезпечує інтерфейс доступу до даних, які зберігаються, під керуванням різних СУБД. За допомогою ODBC вирішується проблема розуміння СУБД один за іншим.
Мова запитів QBE (QueryByExample) - це реалізація запитів за зразками у вигляді таблиць. Для визначення запиту до БД користувач повинен заповнити таблицю QBE, яка надається системою, і визначити в ній критерії пошуку, вибору і перетворення даних.
В інших мовних засобів можна віднести мову ведення словника даних.
До технічних засобів АБД належать процесори, пристрої введення і виведення даних, що запам'ятовують пристрої, модеми, канали зв'язку. У кожному конкретному випадку, в залежності від особливостей СУБД і особливостей об'єкта управління, проектується і різна конфігурація технічних засобів. У технічній документації на СУБД зазначається мінімальна конфігурація технічних засобів, яка необхідна для організації БД, а також подаються різні обмеження на склад і кількість технічних засобів.
Поряд з універсальними технічними засобами вводяться спеціальні машини баз даних, які безпосередньо призначені тільки для зберігання та ведення баз даних. Необхідність створення спеціальних машин БД, які реалізують на апаратному рівні функції СУБД, пов'язана з необхідністю звільнення обсягів пам'яті, мають відводитися для зберігання даних на тих ЕОМ, які будуть виконувати операції обробки даних.
Організаційні засоби АБД охоплюють персонал, пов'язаний зі створенням і веденням БД а також систему нормативно технологічної та інструктивно-методичної документації з організації та експлуатації БД.
Звичайно посадова особа (група осіб), яка забезпечує створення, ведення і підтримку БД в актуальному стані, називається адміністратором АБД. Основні функції адміністратора:
- Спільна робота з проектувальниками задач для визначення умов використання БД;
- Розробка опису БД і початкове завантаження її;
- Підтримка цілісності БД, організація захисту зберігання даних;
- Відновлення БД в разі виникнення помилок програмного забезпечення або збої пристроїв, які призводять до руйнування БД;
- Накопичення статистики по роботі з БД, реорганізація та реструктуризація БД з урахуванням змін потреб, забезпечення безпеки даних шляхом санкціонування доступу до них.
В умовах монопольного використання ПК функції адміністратора виконуються користувачем і частково програмістом, відповідальним за супровід тієї чи іншої системи. Користувач відповідає за завантаження БД і її підтримку в актуальному стані, програміст - за функції відновлення БД у випадках її руйнування. В умовах колективного використання ПЕОМ, об'єднаних в мережу, функції адміністратора виконуються спеціально призначеними адміністраторами.
Розвиток засобів обчислювальної техніки, створення запам'ятовуючих пристроїв прямого доступу створили передумови для вирішення проблем незалежності, неузгодженості та надмірності даних, а також сприяли створенню нової концепції організації інформаційного забезпечення (ПО) - концепції інтеграції даних, що отримала назву автоматизованого банку даних (АБД). Головні переваги організації СО у вигляді АБД наступні:
1. Багаторазовість використання даних: одні й ті ж дані можуть використовуватися для вирішення різних завдань.
2. Економія витрат на створення і ведення С: організація С у вигляді БД характеризується низькою вартістю на створення і меншими витратами на внесення змін в БД, оскільки зміни на фізичному рівні не завжди вимагають внесення змін до прикладних програм.
3. Зменшення надмірності даних. Необхідність вирішення нових завдань забезпечується за рахунок існуючих файлів в БД, а не шляхом створення нових файлів. Дублювання даних у БД потрібно лише для забезпечення оперативності пошуку даних і організації зв'язку між файлами БД. Таке дублювання не є надмірною і називається ненадлишковим дублюванням даних.
4. Швидкість обробки непередбачених запитів до системи. Для обробки таких запитів найчастіше не вимагається створення нової програми на мовах програмування, оскільки ці процедури виконуються за допомогою спеціальних мовних засобів (мови запитів і мови генерації звітів), які входять до складу СУБД.
5. Простота і зручність внесення змін за рахунок єдиної системи ведення БД, яка підтримується засобами СУБД.
6. Логічна і фізична незалежність даних від прикладних програм. Концепція автоматизованого банку даних побудована на інтеграції даних, які зберігаються окремо від прикладних програм. Тому немає необхідності повністю описувати логічну і фізичну структури файлів, які обробляються в додатку.