поняття даних
Поняття "інформація" (від лат. Informatio - відомості, роз'яснення, виклад) багатозначно і тому суворо визначено бути не може. У широкому сенсі інформація - це відображення реального (матеріального, предметного) світу, яке виражається у вигляді сигналів і знаків. Тобто це відомості про навколишній світ, які можуть сприймати пристрою. Інформація характеризується такими властивостями як достовірність, повнота, актуальність, корисність, зрозумілість.
Сучасні засоби передачі інформації використовують класичну схему Шеннона:

Обсяг інформації вимірюється в одиницях інформації. Найбільш надійним є BIT (Binary dIgiT), це пов'язано з каналом зв'язку. Інформація передається від джерела до приймача у вигляді повідомлення. Чим більше малоймовірним є подія, тим більша кількість інформації це повідомлення несе. Тобто колічествоінформаціі це міра зменшення невизначеності безлічі подій. Повідомлення інформативно, якщо воно зменшує невизначеність. Найменш інформативне повідомлення 0/1. Нехай С = 1. С2. С3. ..., Сn> безліч варіантів результату деякого події, тоді інформативне повідомлення це один з n варіантів результату. Log2 N служить для вимірювання кількості інформації. Якщо N ступінь двійки, то для визначення результату досить задати Log2 N довічних питань, інакше [Log2 N] +1.
1) Мінімальна кількість двійкових цифр, необхідне для того, щоб закодувати будь-яке число з діапазону 0, 1, ..., N, дорівнює [Log2 N] +1.
2) Нехай дано С = 1. С2. С3. С4>. Події з цієї множини мають різну ймовірність:
У першому випадку довжина 200 повідомлень = 100 * 1 + 50 * 2 + 25 * 3 + 25 * 3 = 350, тобто середня довжина повідомлення 1,75. У другому випадку це 2.
Міра невизначеності безлічі подій С = 1. С2. С3. ..., Сn> називається ентропією і обчислюється за формулою:
За змістом кількість інформації протилежно ентропії: I (C) = - H (C), H (C)<0
В першому випадку ,
Теорема Величина I (c) максимальна в разі, коли події рівноймовірно, і дорівнює Log2 N, якщо N ступінь двійки, і дорівнює [Log2 N] +1 в іншому випадку.
Що таке інформація?
Взагалі існує декілька поглядів на те, що прийнято вважати інформацією. Один погляд, і його, мабуть, дотримується велика частина фахівців і неспеціалістів зводиться до того, що існує як би два сорти інформації:
1) .Інформація технічна, яка передається по телеграфним лініях і відображається на екранах радіолокаторів. Кількість такої інформації може бути точно обчислено, і процеси, що відбуваються з такою інформацією, підкоряються фізичним законам.
2). Інформація семантична, тобто смислова. Це та сама інформація, яка міститься, наприклад, в літературному творі. Для такої інформації пропонуються різні кількісні оцінки і навіть будуються математичні теорії. Але загальна думка швидше зводиться до того, що оцінки тут досить умовні і приблизні і алгеброю гармонію все-таки не перевіриш.
Другий погляд полягає в тому, що інформація - це фізична величина, така ж, як, наприклад, енергія або швидкість. Певним чином і в певних умовах інформація так само описує як процеси, що відбуваються в природних фізичних системах, так і процеси в системах, штучно створених.
Як завжди, при наявності двох різко протилежних думок існує і третє, що примиряє. Прихильники третього підходу вважають, що інформація єдина, але ось кількісні оцінки повинні бути різними. Окремо потрібно вимірювати кількість інформації, причому кількість інформації - сувора оцінка, щодо якої можна розвивати сувору єдину теорію. Крім кількості інформації, слід вимірювати ще й цінність. А ось з цінністю інформації відбувається те ж саме, що і з поняттям семантичної інформації. З одного боку, начебто її можна обчислити, а з іншого боку, всі ці обчислення справедливі лише в обмеженій кількості випадків. І взагалі, хто може точно обчислити, скажімо, цінність великого наукового відкриття?
Бурхливий розвиток науки і промисловості в XX столітті, нестримне зростання обсягів інформації, що надходить привели до того, що людина опинилася не в змозі сприймати і переробляти все йому призначене. Виникла необхідність класифікувати надходження за темами, організовувати їх зберігання, доступ до них, зрозуміти закономірності руху інформації в різних виданнях і т.д. Дослідження, що дозволяють вирішити виниклі проблеми, стали називати інформатикою.
У загальному випадку передача інформації може бути записана таким чином:
Інформація - довільна послідовність символів, тобто будь-яке слово, кожен новий символ збільшує кількість інформації. Як же виміряти кількість інформації? Для цього, як втім, і для вимірювання довжини, маси і т.д. потрібен еталон. Яке ж слово взяти в якості еталону інформації? Перш, ніж вибрати це слово необхідно вибрати алфавіт - матеріал, з якого буде зроблено це слово. Зазвичай алфавіт беруть Двосимвольні. Наприклад, він може складатися з цифр 1 і 0. Еталоном вважається слово, що складається з одного символу такого алфавіту. Кількість інформації, що міститься в цьому слові, приймають за одиницю, названу 1 бітом 0. Маючи еталон кількості інформації можна порівняти будь-яке слово з еталоном. Простіше порівнювати ті слова, які записані в тому ж Двосимвольні алфавіті.
Отже, отримуємо, що кількість інформації - це міра зменшення невизначеності деякої ситуації.


За обсяг інформації приймається повідомлення мінімальної довжини.
Якщо N = 2 n. то для його запису необходімоn + 1 біт (інакше [log2 N] +1). Мінімальна кількість біт для запису будь-якого числа з діапазона0 - N.
Визначення: вимір інформації, засноване на підрахунку числа символів в повідомленні, називається обсягом інформації.
Визначення: кодування - це запис інформації за певними правилами.
1) Вивчення (етап перетворення з ПО в ІМ)
Результат: постановка задачі.
2) Проектування (етап перетворення з ІМ в область логічний. Даних)
Результат: проект (алгоритм + структура даних).
Матеріальний світ Інформаційна область Область логічних даних Область фізичних даних
Предметна область Інформаційна модель Сукупність логічних записів Сукупність фізичних записів
Об'єкти та їх властивості Опис предметної Логічна запис представляє Фізична запис являє собою
області на деякому собою сукупність взаємопов'язаних сукупність взаємопов'язаних даних,
мові елементів даних зберігаються певним чином
на фізичному носії
Об'єкт екземпляр моделі логічна запис фізична запис
Властивість атрибут елемент даних поле носітеся
Другий закон Hьютона
() F = m * a, F: = Massa * Uskor, Hа фізичному рівні ми
I --- маса повинні розташувати ці змінні
I --- сила тобто для запису отноше- тобто ми можемо на основі на деякому носії і вибрати спосіб
I --- прискорення ний між масою, силою цього закону передбачати подання їх зачение (систему
і прискоренням тут ви- зміна сили на основі кодування)
Другий закон Hьютона користування мож мову математики. знань про масу і прискоренні.
стверджує, що сила Властивості об'єкта замінені Тут F, Massa і Uskor -
пропорційна позначеннями атрибутів і це змінні, використовувані
масі і прискоренню задана інтерпретація цих в алгоритмі. Цей закон можна
позначень використовувати і в іншому вигляді.
Стан кульки - Інформаційне повідомлення: Послідовність символів на стан поля носія інформації:
він червоний кулька червоний логічному рівні: Red 00000011
Кодування інформації - це запис інформації за певними правилами. Передача інформації визначається наступними параметрами:
- Час передачі інформації
- Захист від перешкод
- Технічні зручності передачі інформації
- захист від несанкціонованого доступу
Дані - це застигла інформація, інформація після кодування.
Етапи перетворення інформації при вирішенні завдань на ЕОМ
Предметна область - це виділення з навколишнього світу об'єктів і їх властивостей, важливих для вирішення даного завдання. Предметна область описується мовою предметної області. Найбільш ефективним мовою предметної області є мова математики.
Інформаційна модель предметної області - це зображення предметної області з точки зору розв'язуваної задачі.
База даних - опис предметної області з точки зору вирішення декількох завдань.
При переході до предметної області властивості об'єктів переходять в атрибути.
Атрибут - елемент інформаційної моделі, що описує відповідні властивості об'єкта. Кожному атрибуту відповідає безліч допустимих значень. Атрибут - це неподільний елемент інформації.
Вхідні атрибути X: з їх допомогою середовище впливає на об'єкт, і він видає вихідні атрибути;
Вихідні атрибути Y;
Внутрішні атрибути C.
Ключовий атрибут - атрибут, однозначно ідентифікує об'єкт в сукупності.
Вектор Вектор вихідних
вхідних атрибутів (Y)
Вектор внутрішніх атрибутів
(С) - стан об'єкта в певний момент часу.
Виникає необхідність зв'язати значення цих атрибутів зі стійкими станами об'єктів. Так ми приходимо до поняття «дані»
Дані - це зображення інформації, опис стану деякого носія. Іноді дані називають «застигла інформація». Інформація - активна, дані - пасивні.
З кожним об'єктом пов'язаний спосіб перетворення, мова інтерпретації даних. Мова інтерпретації даних має свій алфавіт




Елемент даних - найпростіший неподільний елемент даних. СтрокаSназивается логічним рівнем представлення даних. кожен символ



Механізм подання даних у вигляді станів деякої сталої середовища.
Розглянемо середу, в якій кожен елемент може знаходиться в k стійких станах. Виберемо середу, в которойm таких елементів.
Числа, які можуть бути відображені в такому середовищі, знаходяться в інтервалі від 0 до N-1, де



Знайдемо таке k, при якому число необхідних станів середовища було б мінімальним. Для цього

Тому найбільш економна понеділок - середа з трьома стійкими станами.
У комп'ютері використовується середу з двома стійкими станами.
Число станів можна розуміти як число якихось деталей (наприклад зубчиків), які потрібно виготовити, щоб представити число. Зрозуміло, що навколишнє середовище тим надійніше, чим менше кількість деталей (менша ймовірність збою, ушкодження деталі)
П

Q (10) = 3 * 10 = 30 зубчиків.
Q (2): (1000<1024=

Q (3): (1000<2187=

Системи кодування з фіксованим числом розрядів
- телеграфний код М2 - 6 двійкових розрядів (64 значень)
- КОІ7 - 7 двійкових розрядів (128 значень)
- ДКОИ - 8 двійкових розрядів (вистачало 128 значень)
- ASCII- 8 двійкових розрядів (256 значень)
- UNICODE-16двоічних розрядів (

- USC2 - 16двоічних розрядів
- USC4 - 16двоічних розрядів
Системи кодування зі змінним числом розрядів
Код Хофмана - система зі змінним числом, при якій ні у яких двох кодів немає загального початку. Символи кодуються в залежності від частоти їх в заданій стрічці.

Наприклад. закодувати рядок
Сортуємо символи по частоті: e, d, n, q
Будуємо бінарне дерево, як показано на малюнку