Прискорююча кнопка n назначена для пропусків при навігації по сторінкам. Пропуск для переходу на початок контента.

Даний документ є перекладом. У випадку будь-яких невідповідностей і помилок остання версія документу англійською мовою повинна розглядатися як офіційна. Першопочаткове авторське право належить W3C, як це вказано нижче.

Перекладач: Alexandr Shlapak

s_gotoW3cHome Інтернаціоналізація
 

Відмітка тексту без мови

Аудиторія: шифрувальники XML та XHTML/HTML (використовуючи редактори або скрипти), розробники скриптів (PHP, JSP, і т.д.), розробники схем (DTDs, XML Schema, RelaxNG, і т.д.), і кожен, хто хоче дізнатися як використовувати розмітку контента із мовною інформацією, тоді як жодна мова не застосовується.

Питання

Як використовувати мовну розмітку в HTML або XML контенті, коли не знаєш мови, або контент нелінгвістичний?

Ввідна інформація

Ви завжди повинні визначати нормальну мову тексту в HTML або форматі, що оснований на XML, так щоб такі додатки, як голосові браузери, таблиці стилів, і подібні, могли обробити цей текст. В форматах, основаних на XML вам зазвичай доведеться використовувати атрибут xml:lang , і в XHTML/HTML атрибут lang і/або атрибут xml:lang. (Дивіться Призначення мови в XHTML і HTML для більш детальної інформації про language теги в HTML.)

Ви можете змінити, ті початкові установки мови для частини документа, яка написана на іншій мові, наприклад деякі Французькі цитати в Англійському документі, шляхом використання одного і того ж атрибуту(ів) біля відповідного біту тексту.

Припустимо, що ви маєте якийсь текст, який не є лінгвістичним, такий як типи зразків, номери, ілюстрації двійкових даних і т.д. Як би ви повідомили, що він нелінгвістичний? А як щодо ситуації, куди ви розпакували текст з бази даних, і він прийшов без лінгвістичної інформації?

Відповідь

Є два варіанти, щодо цих питань. У цій статті використовуються приклади із xml:lang, що є рекомендованим методом призначення мови у форматах, що базуються на основі XML.

Коли текст нелінгвістичний

Використовуйте subtag zxx, коли відомо , що текст нелінгвістичний.

Це застосовується для такого тексту, як типи зразків, номери, ілюстрації двійкових даних і т.д. zxx визначений в Language Subtag Реєстрі, як 'нелінгвістичний контент'.

Наприклад:

<p>Here is a list of part numbers: <span xml:lang="zxx" lang="zxx">9RUI34 8XOS12 3TYY85</span>.</p>

Коли мова не визначена

Якщо формат XML, що ви використовуєте, підтримує це, то використовуйте xml:lang="", в іншому випадку використовуйте xml:lang="und".

Ці значення показують, що з тієї чи іншої причини, ми не можемо визначити, яка відповідна мовна інформація, або чи є текст нелінгвістичним. Наприклад, ви можете використовувати xml:lang="" якщо текст бази даних включений в документ, але база даних не надає мовну інформацію і ви не можете бути впевнені, що мова є. Результатом буде запобігання призначення будь-якої мовної інформації вище за ієрархією елементів документа від застосування у включеному тексті.

Однак ви повинні відмічати текст тільки, як undetermined (невизначений), коли ви не можете просто залишити все як є. На практиці це означає, що ви повинні використовувати тільки цю xml:lang розмітку, якщо undetermined текст вкладено в деякий контент, який деяким чином вже отримав призначення мови, або, якщо його використання на рівні документу вимагається форматом, який ви використовуєте.

xml:lang="" працює тільки тоді, коли схема, яка описує формат документу дозволяє порожній рядок, як значення xml:lang. Наприклад, так як XHTML DTDs визначає xml:lang таким чином, що значення порожнього рядка для атрибуту xml:lang - disallowed(заборонено), то ви не можете використовувати порожній рядок в XHTML.

Для тих хто знають, як працює DTDs та інші схеми: Атрибут xml:lang приймає значення NMTOKEN в схемі HTML, тому вони не можуть бути порожніми. У вашій XML DTD, якщо це можливо, призначайте xml:lang як CDATA так що порожнє значення дозволене. Для користувачів схеми XML опирайтесь на XML схему документа по XML namespace.

Залучення XHTML/HTML Для XHTML і HTML ви маєте використовувати und якщо вам необхідно виразити невизначену природу деякого вбудованого в документ тексту, так як (як уже згадувалося раніше) xml:lang="" не дозволений. Дуже рідко, коли весь документ написаний на невизначеній мові, краще просто не призначати мову документа за замовчуванням.

Те ж саме стосується атрибуту lang в HTML (з тієї ж причини).

Доречі

Це резюме обговорення в середовищі виконання на www-international@w3.org, і пізніше відновлення тих ідей, до яких мають відношення декілька людей.

Martin Dürst вказує, що ви можете перевизначити формат XHTML/HTML всередині документу, щоб створити сторінку HTML/XHTML, яка перевіряється при використанні атрибута lang="" або xml:lang="". Це не рекомендується для широкого застосування, оскільки такий документ вже не строго відповідає XHTML 1.0.

Розкажіть нам про те, що Ви думаєте.

Підписатися на RSS джерело.

Нові джерела

Новини головної сторінки

Twitter (Новини головної сторінки)

‎@webi18n

Додаткові матеріали

Автор: Richard Ishida, W3C. Перекладач: Alexandr Shlapak.

Допустимий XHTML 1.0!
Допустимий CSS!
Кодування UTF-8!

Переклад Англійського контенту від 2007-10-30. Переклад останнього оновлення 2011-07-30 12:00 GMT

Для перегляду історії внесення змін до перекладу натисність qa-no-language в блоге i18n.