Ускоряющая клавиша n предназначена для пропусков при навигации по страницам. Пропуск для перехода на начало контента.

Данный документ является переводом. В случае каких-либо несоответствий и ошибок последняя версия документа на английском языке должна рассматриваться в качестве официальной. Первоначальное авторское право принадлежит W3C, как то указано ниже.

Переводчик: Alexandr Shlapak

s_gotoW3cHome Internationalization
 

Отметка текста без языка

Предполагаемая аудитория: шифровальщики XHTML / HTML (используя редакторы или скрипты), разработчики скриптов (PHP, JSP, и т.д.),, разработчики схем (DTDs, XML Schema, RelaxNG, и т.д.), и каждый, кто хочет узнать как использовать разметку контента с речевой информацией, тогда как ни один язык не применяется.

Вопрос

Как использовать речевую разметку в HTML или XML контенте когда не знаешь языка, или контент нелингвистический?

Вводная информация

Вы всегда должны определять нормальный язык текста в HTML или формате, что основан на XML, так чтобы такие приложения, как голосовые браузеры, таблицы стилей, и подобные могли обработать этот текст. В форматах, основанных на XML вам обычно придется использовать атрибут xml:lang , и в XHTML/HTML атрибут lang и/или атрибут xml:lang. (Смотрите Назначение языка в XHTML и HTML для более подробной информации о language тэгах в HTML.)

Вы можете изменить, те начальные установки языка для части документа, который написан на другом языке, например некоторые Французские цитаты в Английском документе, путем использования одного и того же атрибута (ов) возле соответствующего бита текста

Предположим, что вы имеете некий текст, который не является лингвистическим, такой как типы образцов, номера, иллюстрации двоичных данных и т.д. Как бы вы сообщили, что он нелингвистический? А как насчет ситуации, куда вы распаковали текст из базы данных, и он пришел без лингвистической информации?

Ответ

Есть два варианта, относительно этих вопросов. В этой статье используются примеры из xml:lang, что является рекомендуемым методом назначения языка в форматах, основанных на XML.

Когда текст нелингвистический

Используйте subtag zxx, когда известно , что текст нелингвистический.

Это применяется для такого текста, как типы образцов, номера, иллюстрации двоичных данных и т.д. zxx определенный в Language Subtag Реестре, как 'нелингвистический контент'.

Например:

<p>Here is a list of part numbers: <span xml:lang="zxx" lang="zxx">9RUI34 8XOS12 3TYY85</span>.</p>

Когда язык не определен

Если формат XML, который вы используете, поддерживает это, то используйте xml:lang="", в противном случае используйте xml:lang="und".

Эти значения показывают, что по той или иной причине, мы не можем определить, какая соответствующая языковая информация, или есть ли текст нелингвистическим. Например, можно использовать xml:lang="" если текст базы данных включен в документ, но база данных не предоставляет языковую информацию и вы не можете быть уверены, что язык есть. Результатом будет предотвращение назначения любой речевой информации выше по иерархии элементов документа от применения во включенном тексте.

Однако вы должны отмечать текст только, как undetermined (неопределенный), когда вы не можете просто оставить все как есть. На практике это означает, что вы должны использовать только эту xml:lang разметку, если undetermined текст вложен в некоторый контент, который некоторым образом уже получил назначение языка, или, если его использование на уровне документа требуется форматом, который вы используете.

xml:lang="" работает только тогда, когда схема, которая описывает формат документа позволяет пустую строку, как значение xml:lang. Например, так как XHTML DTDs определяет xml:lang таким образом, что значение пустой строки для атрибута xml:lang - disallowed(запрещено), то вы не можете использовать пустую строку в XHTML.

Для тех кто знают, как работает DTDs и другие схемы: Атрибут xml:lang принимает значения NMTOKEN в схеме HTML, поэтому они не могут быть пустыми. В вашей XML DTD, по возможности, назначайте xml: lang как CDATA так что пустое значение разрешено. Для пользователей схемы XML опирайтесь на XML схему документа по XML namespace.

Вовлечение XHTML/HTML Для XHTML и HTML вы должны использовать und если вам необходимо выразить неопределенную природу некоторого встроенного в документ текста, так как (как уже упоминалось ранее) xml:lang="" не разрешен. Очень редко, когда весь документ написанный на неопределенном языке, лучше просто не назначать язык по умолчанию.

То же касается атрибута lang в HTML (по той же причине).

Кстати говоря

Это резюме обсуждения в среде выполнения на www-international@w3.org, и позже восстановление тех идей, к которым имеют отношение несколько человек.

Martin Dürst указывает, что вы можете переопределить формат XHTML/HTML внутри документа, чтобы создать страницу HTML/XHTML, которая проверяется при использовании атрибута lang="" или xml:lang="". Это не рекомендуется для широкого применения, поскольку такой документ уже не строго соответствует XHTML 1.0.

Выскажите своё мнение (по-английски).

Подпишитесь на ленту новостей RSS.

Новые публикации

Новости главной страницы

Twitter (Новости главной страницы)

‎@webi18n

Дополнительные материалы

Автор: Richard Ishida, W3C. Переводчик: Alexandr Shlapak.

Допустимый XHTML 1.0!
Допустимый CSS!
Кодировка UTF-8!

Перевод с английского: 2007-10-30. Последнее внесение изменений в перевод: 2011-07-30 12:00 GMT

Для просмотра истории внесения изменений нажмите qa-no-language в блоге i18n.