IRI

IRI (англ. Internationalized Resource Identifier) — интернационализированный идентификатор ресурса. На английский манер произносится [айэра́й], по-русски чаще произносят [и́ри]. IRI — это короткая последовательность символов, идентифицирующая абстрактный или физический ресурс на любом языке мира. Идентификаторы IRI призваны в будущем заменить URI.

Содержание

Основы

IRI — это короткая строка, позволяющая идентифицировать какой-либо ресурс: документ, изображение, файл, службу, ящик электронной почты и т. д. Прежде всего, речь идёт, конечно, о ресурсах сети Интернет и Всемирной паутины. Идентификаторы IRI создавались как замена единообразным идентификаторам URI (англ. Uniform Resource Identifier). Дело в том, что идентификаторы URI имеют серьёзный недостаток — они могут содержать только латинские символы и знаки препинания из набора символов US-ASCII (в общей сложности около 60 символов). В результате, если мы захотим использовать в URI символы кириллицы, иероглифы или, скажем, специфические символы франузcкого языка и эсперанто, то нам придётся кодировать URI так, как в Википедии кодируются URL с симолами Юникода. Например, строка вида:

http://ru.wikipedia.org/wiki/Микрокредит

кодируется в URL как:

http://ru.wikipedia.org/wiki/%D0%9C%D0%B8%D0%BA%D1%80%D0%BE%D0%BA%D1%80%D0%B5%D0%B4%D0%B8%D1%82

Подробнее о кодировании см. URL.
В итоге URI во всех языках, кроме кроме основанных на базовой латинице, теряют свою читабельность для человека. И это входит в грубое противоречие с принципом интернационализма, провозглашаемого всеми ведущими организациями Интернета, включая W3C и ISOC. Идентификаторы IRI созданы специально для решения этой проблемы. IRI могут содержать любые символы Юникода (Unicode/ISO 10646) в чистом виде, без всякого кодирования. IRI не ущемляют права других языков и ведут к более высокой степени равноправия пользователей Интернета.

В остальном идентификаторы IRI пока почти идентичны URI. Существует возможность несложной конвертации (англ. mapping) между идентификаторами URI и IRI.

История

Разработка IRI началась примерно в ноябре 2001 года в Консорциуме Всемирной паутины. Первый вариант спецификации появился в апреле 2002 года. Стандарт был закреплён в запросе комментариев (англ. Request for Comments, RFC) 3987 в январе 2005 года. Работы по спецификации IRI продолжаются в Рабочей группе интернационализации (англ. Internationalization Working Group) Консорциума Всемирной паутины. Скоро Консорциум, возможно, примет IRI как основу для всех своих стандартов.

Применение

В настоящее время IRI уже применяются в следующих технологиях:

  • XML 1.0 (системные идентификаторы там — это IRI)
  • XLink (атрибут href — это IRI)
  • XML Schema (тип данных anyURI — это IRI)
  • HTML 4.0 (согласно Приложению B.2.1 разрешено применение не-ASCII символов в значениях (но не именах) атрибутов)

Очевидно, что IRI пока внедрены совершенно недостаточно, и работа по их популяризации только начинается. Но сама идея IRI очень благородна, а применение таких идентификаторов удобно. Пока трудно сказать, смогут ли IRI быстро получить такое же распространение, как URI. Но, возможно, через некоторое время, даже тэги XML можно будет писать на русском языке.

Существовало также предложение об использовании Юникода (в формате UTF-8) в системе доменных имён DNS (англ. Domain Name System). Тогда бы стали возможны даже адреса вида http://русская.википедия.орг. Пока перспективы этой инициативы не ясны.

Проблемы

Для однозначной идентификации адреса, например в ссылке, придется применять особые методы — например, дополнительное оформление для разных символов с одинаковым начертанием (например, символы А, В, Е, К, М, Н, О, Р, С, Т, Х в кириллице и латинице) — отличающиеся шрифты, цвета и т. п., либо владелец, скажем, домена «Microsoft.com» будет вынужден приобретать все домены, в которых содержатся такие символы в любой комбинации, которых в данном случае несколько: «М», «с» и два «о», во избежание действий злоумышленников, которые могут выдать такой «смешанный» домен за официальный сайт корпорации и получить конфиденциальную информацию от посетителей через формы.

Также необходимо будет регистрировать желаемые домены на всех языках мира, частично, по тем же причинам. В случае торговых марок проблему можно будет решить правовыми методами, а вот с такими сайтами как «а.ком» и «a.com» дело обстоит иначе. Самому посетителю будет сложно разобраться с такими адресами, если это, например, чьи-то домашние страницы. Это касается и таких адресов как «dom.ru» и «дом.ру».

Некоторые считают, что ограничение доменнного имени латинскими символами так же естественно, как для операторов в языках программирования. Проблема же названий файлов и разделов может успешно решаться браузерами: например, Opera 8.5 и Internet Explorer отображают адрес «http://ru.wikipedia.org/wiki/Микрокредит» именно так, кодируя его лишь для передачи запроса серверу.

См. также

Ссылки

 
Начальная страница  » 
А Б В Г Д Е Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ы Э Ю Я
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
0 1 2 3 4 5 6 7 8 9 Home