Основні конструкції xml - елементи xml, теги, атрибути, процесингові інструкції, секції cdata,

Основні конструкції xml - елементи xml, теги, атрибути, процесингові інструкції, секції cdata,
  • Деякі моменти, такі як теги XML, ми вже частково розглядали в попередній статті «Розмітка XML-документів». Тепер ми ще раз торкнемося цієї теми і розберемо її більш детально. Це зроблено спеціально, щоб вам було простіше уявити всю картину конструкцій XML.

    Елементи XML. Порожні і непусті елементи XML

    Як вже говорилося в попередній статті, теги в XML не просто розмічають текст, як це буває в HTML, а виділяють окремі елементи (об'єкти). У свою чергу елементи ієрархічно організують інформацію в документі, що в свою чергу і зробило їх основними структурними одиницями мови XML.

    У XML елементи можуть бути двох типів - порожні і непусті. Порожні елементи не містять в собі ніяких даних, таких як текст або інші конструкції. На відміну від порожніх елементів, непусті можуть містити в собі будь-які дані, такі як текст або інші елементи і конструкції мови XML. Щоб зрозуміти суть сказаного вище, давайте розглянемо приклади порожніх і непустих елементів XML.

    Порожній елемент XML

    Непорожній елемент XML

    Як ми бачимо з прикладу вище, головною відмінністю порожніх елементів від непустих є те, що вони складаються тільки з одного тега. Крім того варто також зауважити, що в XML все імена чутливі до регістру. Це означає, що імена myElement, MyElement, MYELEMENT і т.д. розрізняються між собою, а тому цей момент варто відразу запам'ятати, щоб уникнути помилок в майбутньому.
    Отже, з елементами ми розібралися. Тепер давайте перейдемо до наступного моменту, такого як логічна організація XML-документів.

    Логічна організація XML-документів. Деревоподібна структура XML даних

    Як ви пам'ятаєте, основною конструкцією мови XML є елементи, які можуть містити в собі інші вкладені конструкції і тим самим формувати ієрархічну структуру у вигляді дерева. В цьому випадку батьківський елемент буде коренем, а всі інші дочірні елементи будуть гілками і листям дерева XML.

    Щоб було простіше зрозуміти суть сказаного вище, давайте розглянемо наступне зображення з прикладом.

    Основні конструкції xml - елементи xml, теги, атрибути, процесингові інструкції, секції cdata,

    Як ми бачимо, організація XML-документа у вигляді дерева є досить простою структурою для обробки. При цьому виразна складність самого дерева досить велика. Саме деревоподібна уявлення є найбільш оптимальним способом опису об'єктів в XML.

    Атрибути XML. Правила запису атрибутів в XML

    У XML елементи можуть містити також і атрибути з присвоєними їм значеннями, які поміщаються в одинарні або подвійні лапки. Атрибут для елемента задається наступним чином:

    В даному випадку використовувався атрибут з ім'ям «attribute» і значенням «value». Тут варто відразу зауважити, що атрибут XML обов'язково повинен містити якесь значення і не може бути порожнім. В іншому випадку код буде некоректним з точки зору XML.

    Також варто звернути увагу на використання лапок. Значення атрибутів може полягати як в одинарні, так і в подвійні лапки. Крім того можливо також використання одних лапок усередині інших. Для демонстрації розглянемо такі приклади.

    Перш ніж приступити до розгляду інших конструкцій XML варто також зауважити, що при створенні атрибутів як значення не можуть використовуватися такі спеціальні символи, як амперсанд «» або кутові дужки «<>». Цим символом зарезервовані в якості керуючих ( «» - сутність, а «<» и «>»Відкривають і закривають тег елемента) і не можуть бути використані в« чистому вигляді ». Для їх використання потрібно вдаватися до заміни спецсимволов.

    Інструкції по обробці XML (процесингові інструкції). XML-декларація

    У мові XML є можливість включення в документі інструкцій, які несуть певну інформацію для додатків, які будуть обробляти той чи інший документ. Інструкції по обробці в XML створюються в такий спосіб.

    Варто зауважити, що в XML є особлива конструкція, яка дуже сильно схожа на інструкцію з обробки, але сама вона такою не є. Йдеться про XML-декларації, яка передає обробляє програмному забезпеченню деяку інформацію про властивості XML-документа, таких як кодування, версія мови відповідно до якого написаний даний документ і т.д.

    Оскільки ми розібралися з псевдоатрібутамі, то давайте розглянемо, що ж вони означають.

    • Encoding - відповідає за кодування XML документа. Зазвичай використовується кодування UTF8.
    • Version - версія мови XML, на якому написаний даний документ. Зазвичай це XML версії 1.0.

    Тут відразу варто звернути вашу увагу на 2 правила:

    Секції CDATA використовуються для того, щоб дати зрозуміти оброблювачу XML документа, що дана ділянка коду не варто сприймати як розмітку. Зазвичай це застосовується, наприклад, якщо потрібно відобразити якісь дані в початковому вигляді. Сама ж конструкція створюється наступним чином.

    При цьому в якості вмісту можуть бути будь-які символи, включаючи амперсанд «» і кутові дужки «<» и «>». Винятком тут є лише послідовність символів «]]>», яка не може бути використана в секції CDATA.

    Ну і на завершення статті давайте розглянемо приклад використання секцій CDATA.

    У звичайних умовах вміст секції CDATA було б сприйнято як частина розмітки. В даному ж випадку воно буде розцінюватися як звичайні символьні дані.

    На цьому все. Удачі вам і успіхів у вивченні XML.

    Помітили помилку? Виділіть її та натисніть Ctrl + Enter

    Версія для друку