Кодування текстової інформації
Щоб порахувати кількість інформації, для числа наприклад, потрібно уявити це число в двійковому коді і порахувати кількість нулів і одиниць.
Кодування текстової інформації.
На сьогоднішній день велика кількість користувачів за допомогою комп'ютера обробляє текстову інформацію. яка складається з: букв, цифр, знаків пунктуації та інших елементів.
Зазвичай для кодування одного символу, используеться 1 байт пам'яті тобто 8 біт. За теорією ймовірностей за допомогою простої формули, яка пов'язує кількість можливих подій (К) і кількість інформації (I), можна обчислити скільки неоднакових символів можна закодувати. К = 2 ^ I = 28 = 256.
Примітка
Для кодування текстової інформації зазвичай використовують алфавіт потужністю в 256 символів.
Принцип даного кодування полягає в тому, що кожному символу (букви, знаку) відповідаючи свій двійковий код від 00000000 до 11111111, так-же текстова інформація може бути представлена в десятковому коді від 0 до 255.
Потрібно запам'ятати, що на сьогоднішній день для кодування букв українського алфавіту використовують п'ять різних кодіровачних таблиць (ЯКІ - 8, СР1251, ср866, Мас, ISO), запам'ятайте, що тексти закодовані за допомогою однієї таблиці не будуть коректно відображатися в іншому кодуванні. Це можна побачити в об'єднаної таблиці кодування символів.
Для одного двійкового коду в різних таблицях відповідають різні символи:
Вирішуємо завдання.
Завдання №1.
Припустимо у нас є два тексти які містять однакову кількість символів. Один текст записаний російською мовою його алфавіт (32 символу), а другий допустимо на українському його алфавіт (16 символів). Чий текст несе більшу кількість інформації?
I = К * а (інформаційний обсяг тексту дорівнює добутку числа символів на інформаційний вага одного символу). Оскільки обидва тексти мають однакову кількість символів (К), то різниця залежить від інформативності одного символу алфавіту (а).
2 ^ а1 = 32, тобто а1 = 5 біт.
2 ^ 2 = 16, тобто 2 = 4 біт.
I1 = К * 5 біт, I2 = К * 4 біт.
Значить, текст, записаний російською мовою в 5/4 рази несе більше інформації.
Завдання №2.
Обсяг повідомлення, що містить 2048 символів, склав 1/512 частина Мбайта. Визначити потужність алфавіту.
I = 1/512 * 1024 * 1024 * 8 = 16384 біт. - перевели в біти інформаційний обсяг повідомлення.
а = I / К = 16384/1024 = 16 біт - доводиться на один символ алфавіту.
2 ^ 16 = 65536 символів - потужність використаного алфавіту.
Саме такий алфавіт використовується в кодуванні Unicode, який став міжнародним стандартом для представлення символьної інформації в комп'ютері.
На цьому дану статтю я закінчую, сподіваюся, ви повністю розібралися з темами: Кодування інформації. Кодування текстової інформації. Кодування інформації в комп'ютері.
Поділися інформацією з друзями в:
У цій статті ми поговоримо на такі теми, як: Кодування інформації, Кодування текстової інформації, Кодування інформації в комп'ютері.
Можливо вам буде цікаво:
У цій статті ми поговоримо на такі теми, як процеси і потоки, дискриптори процесу, поговоримо про сінзронізаціі потоків і торкнемося всіма улюблений диспетчер задач windows.
У даній статті, ми поговоримо на такі теми, як віртуальна пам'ять, і розглянемо основні методи розподілу віртуальної пам'яті в операційних системах.
сьогодні Новомосковскют
Отримай 1500 Gold безкоштовно в World of tanks при покупці антивіруса
Wargaming - і "Лабораторія Касперського" оголосили про початок спільної акції. Тепер при покупці ліцензійного програмного забезпечення Kaspersky Internet Security, Kaspersky CRYSTAL, а також Kaspersky ONE.
Безкоштовна trial версія Diablo III - вже доступна для скачування
Вже як три місяці ми насолоджуємося довгоочікуваним релізом Diablo III. Щасливі володарі ліцензії, так само отримали в комплекті ваучер, який дає можливість грати в Starter Edition версію.
GTA San Andreas - модифікована движком GTA 4 (скачати мод)
Шанувальники - легендарної серії ігор Grand Theft Auto вирішили розробити глобальний мод, GTA San Andreas буде поставлена на движок від GTA 4. Посилання для скачування мода ви знайдете в кінці цієї статті.
Як скачати музику з контакту на комп'ютер - програма VKSaver 3.1
У цій статті ми відповімо на питання: як скачати музику з контакту на комп'ютер абсолютно безкоштовно, а використовувати для цього ми будемо безкоштовну програму - VKSaver 3.1