Кодування - це
Набір символів (англ. Character set) - певна таблиця кодування кінцевого безлічі знаків. Така таблиця зіставляє кожному символу послідовність довжиною в один або кілька байтів.
Нерідко також замість терміна «набір символів» неправильно вживають термін «кодова сторінка», що означає насправді окремий випадок набору символів з однобайтном кодуванням.
В даний час в основному використовуються кодування трьох типів: сумісні з EBCDIC і засновані на Юникоде 16-бітові, з переважною перевагою перших. Подання Юникода сумісно з ASCII. Кодування на базі ДКОИ-8) використовуються тільки на деяких мейнфреймах. Спочатку в кожній операційній системі використовувався один набір символів. Тепер використовувані набори символів [5]. залежать від типу операційної системи лише за традицією і встановлюються відповідно до локалі.
У Вікіпедії та інших проектах Фонду Вікімедіа використовується Юнікод UTF-8.
Автоматичне розпізнавання кодувань
Використання безлічі кодувань в сучасному ПО створює багато незручностей не тільки програмістам. але і користувачам. Відповідно до однієї точки зору, впоратися з крокозябра можна, якщо програми будуть автоматично розпізнавати кодування вхідного тексту.
Для однобайтовим кодувань можна враховувати той факт, що частота використання різних букв сильно різниться (наприклад, в українському часто використовується «о», але рідко "ь"). Тому, знаючи мову тексту, можна легко вибрати кодування, в якій частота байтів краще відповідає частоті букв даного мови.
Альтернативна точка зору вважає подібні евристичні алгоритми визначення кодування тексту шкідливими, оскільки сучасні інформаційні технології мають у своєму розпорядженні засобами недвозначно зіставити тексту належну йому кодову сторінку (див. Наприклад, програм створення текстових даних, що порушують стандарти.
поширені кодування
- ISO 646
- EBCDIC
- ISO 8859.
- ISO 8859-1. ISO 8859-2. ISO 8859-3. ISO 8859-4. ISO 8859-5. ISO 8859-6, ISO 8859-7, ISO 8859-8, ISO 8859-9, ISO 8859-10, ISO 8859-11, ISO 8859-13, ISO 8859-14, ISO 8859-15
- CP850, CP852, CP866, CP869
- Кодування Microsoft Windows.
- Windows -1252 для західних мов
- Windows-1254 для турецької мови
- Windows-1255 для івриту
- Windows-тисяча двісті п'ятьдесят шість для арабської мови
- Windows-1257 для балтійських мов
- Windows-тисяча двісті п'ятьдесят вісім для в'єтнамської мови
- MacRoman, КОІ8 (KOI8-R, KOI8-U ...), ЯКІ-7
- Болгарська кодування
- ISCII
- VISCII
- Big5 (найбільш знаменитий варіант Microsoft CP950)
- GB2312
- GBK (Microsoft CP936)
- GB18030
- Shift JIS для японської мови (Microsoft CP932)
- EUC-KR для корейської мови (Microsoft CP949)
- ISO-2022 і EUC для китайської писемності
- Кодування UTF-16 набору символів Юнікод
Примітки
Дивитися що таке "Кодування" в інших словниках:
кодування - і, ж. Дія по знач. гл. кодувати. Кодування відомостей для машинної обробки інформації. МАС 2 ... Історичний словник галліцізмов української мови
кодування - ім. кол під синонімів: 4 • зашифрование (7) • зашифровка (8) • зашифровування (7) ... Словник синонімів
кодування - см. кодувати ... Тлумачний перекладознавчий словник
кодування - кодир овка, і ... український орфографічний словник
кодування - с'щ. кодіране, код, кодові таблиці ... Б'лгарскі синонімом речник
кодування - см. кодувати; і; ж. Кодує / вка відомостей для машинної обробки інформації ... Словник багатьох виразів
кодування шрифту - (Encoding) Впорядкований комплект знаків шрифту [впорядкована множина знаків певної системи письма] (див. Кодова сторінка). Кодування залежить від операційної системи, для якої призначений шрифт (MS Windows або Mac OS) і ... ... шрифтових термінологія
- Альтернативне кодування. Джессі Рассел. Ця книга буде виготовлена в відповідності з Вашим замовленням за технологією Print-on-Demand. High Quality Content by WIKIPEDIA articles! «Альтернатив? Вная кодує? Вка» - заснована на CP437 ... Детальніше Купити за 998 руб
- Контроль якості зварних з'єднань. Підручник. В. В. Овчинников. Розглянуто типові дефекти зварних з'єднань, їх вплив на працездатність зварних конструкцій. Описана міжнародна кодування дефектів в залежності отих виду і місця розташування в ... Детальніше Купити за 506 руб
- Час справжніх почуттів (збірник). Олександр Тараненко. Ця книга про молодість і ті почуття, які відчувають люди в цей час. Минають роки, століття, епохи. Світ змінюється. Але незалежно від цих змін кожен з нас, людей, обов'язково ... Детальніше Купити за 33.99 руб електронна книга