Розплутування uri, url і urn

Інтернет включає три види технологій: формати даних, протоколи і покажчики, які пов'язують перші два елементи. Зв'язок між такими форматами даних, як XML і HTML, досить очевидна, також як і між протоколами HTTP і FTP. Але з покажчиками справа дещо складніша.

Для того щоб правильно використовувати URL в просторах імен і схемах XML, а також в розширюваному мовою перетворення стилів (Extensible Stylesheet Language Transformations - XSLT), потрібно знати деякі правила. Але сімейство специфікацій XML оперує такими поняттями, як URI і URN. Чим же вони відрізняються від URL? Це питання має досить довгу історію.

"Синтаксис імені, по якому документ або його частина (якір) можуть бути знайдені в будь-якій точці світу, - це, ймовірно, найбільш важливий аспект проектування і стандартизації у відкритих гіпертекстових системах".

У пропонованій статті обговорюються сучасний стан справ в технології присвоєння імен і стандартизації для інтернету, а також деякі питання історії і еволюції термінології. У висновку наводиться огляд перспектив в галузі присвоєння імен в сфері управління інформацією.

стандарт URI

  • ім'я схеми (http)
  • ім'я домену (www.cisco.com)
  • шлях (/en/US/partners/index.html)

Несуперечливий процес IETF управляє схемами. Офіційний реєстр схем URI Агентства по виділенню імен та унікальних параметрів протоколів Internet (Internet Assigned Numbers Authority - IANA) включає як загальновідомі схеми, такі як http. https і mailto. так і безліч інших, менш знайомих широкому колу користувачів.

URI-шлях виглядає як типовий шлях доступу до файлу. URI успадкували ліву косу риску (a / b / c) з традицій UNIX®, оскільки в кінці 1980-х років, коли вони розроблялися, в інтернеті переважала культура UNIX, а не PC. Тоді існувало кілька поширених уявлень для доступу до віддалених файлів. Одне з них - це Ange-ftp, розширення emacs для редагування віддалених файлів. Воно зводило воєдино імена хост-вузла і користувача з шляхом доступу до файлу, і в результаті виходила конструкція такого типу: /[email protected]:

mblack /. Синтаксис URI, розроблений для інтернету, використовував подвійну ліву косу риску для перехресного звернення до машин (це успадковано з діалекту Apollo Domain UNIX). Крім цього, він ввів в обіг синтаксис схем для того, щоб можна було уніфікувати угоди про присвоєння імен з будь-якої кількості різних протоколів. Ось кілька прикладів:

Міжнародні ідентифікатори ресурсів

Xml: base перекриває базовий URI

Лістинг 1. Розширена форма в RDF

Тепер перейдемо до URL і URN.

Остаточний стандарт URI RFC3986 пояснює відмінність між цими поняттями в секції 1.1.3 - "URI, URL і URN":

URI може далі розглядатися як покажчик, ім'я або і те, і інше. Термін "уніфікований покажчик інформаційних ресурсів" (URL) відноситься до підмножини URI, які, крім ідентифікації ресурсу, вказують спосіб його знаходження шляхом опису основних механізмів доступу до нього (тобто його "положення" в мережі). Термін "уніфіковане ім'я ресурсу" (URN) історично використовувався як для URI в межах схеми urn (запит RFC2141), які повинні залишатися унікальними в світовому масштабі і залишатися стабільними, навіть якщо ресурс припиняє існування або стає недоступним, так і для будь-яких інших URI зі властивостями імені. Окрема схема не обов'язково повинна розглядатися тільки як "ім'я" або "покажчик". Конкретні URI з будь-якої схеми можуть мати характеристики як імен, так і покажчиків, або обох цих понять. Часто це залежить від сталості і ретельності в розподілі ідентифікаторів повноважним органом з присвоєння імен, а не від якості схеми. У майбутніх специфікаціях і пов'язаних з ними документах повинен використовуватися загальний термін URI, а не вужчі поняття URL і URN (запит RFC3305).

Сталість на практиці

Творчі проблеми в управлінні інформацією

Незважаючи на протиріччя між постійністю і доступністю, хороший URI має обидва якості та функціонує і як постійне ім'я, і ​​як доступний ресурс. Таким чином, URL - це просто більш практичний URI.

Прихильники схеми urn: стверджують, що ця суперечність не можна усунути в рамках HTTP і DNS. Проблемні області, безумовно, існують, але з цими питаннями стикається будь-який Web-майстер, і поступово виробляються принципи управління інформацією, які допомагають справлятися з ними. Світ постійно змінюється, і щоб встигати за цими змінами, необхідно працювати.