Неанглийские тэги

Вопрос

Можно ли писать HTML и XML элементы и названия тэга атрибута языками и скриптами, которые отличаются от Английского?

Ответ

Все HTML или XHTML тэги заранее определены (Английским) и должны оставаться в таком виде чтобы клиентские приложения могли их правильно распознать (например браузеры).

В XML можно установить свои собственные названия тэгов. Вы можете это сделать на любом языке или скрипте, которые поддерживаются Unicode.

Хотя и все XML процессоры должны поддерживать Unicode, здесь целесообразно быть осторожным. Если человек имеет дело с набором тэгов, скажем, Китайським, Арабским или Хинди, то может быть трудно определить тот факт: не разговаривают ли они теми языками или не имеют ли правильных шрифтов и программного обеспечения для перевода на их системах. Английские названия тэгов лучшие для DTDs (Определение Типа Документа), которые используются многоязычными группами потому что люди с большого количества стран скорее всего, смогут легко просматривать и понимать значение тэгов, которые вы используете.

С другой стороны, неанглийского названия тэгов могут быть полезными для учебных материалов. Например, это часто встречается в японских обоснованиях XML.

Кстати говоря

Отметим также, что, поскольку NCRs (числовые ссылки) не разрешены в названиях тэгов, использование non-ASCII названий тэгов требует от вас использовать кодирование символов которое поддерживает необходимые символы. Как правило, использование такой Unicode кодировки как UTF-8 является наилучшим вариантом.

При использовании XML 1.1 почти любой символ разрешен, но не каждый символ имеет значение. Для набора рекомендаций о том, какие символы использовать, смотрите Appendix B с XML 1.1 спецификации.

Для получения конкретной информации о том, какие символы разрешены в XML тэгах смотрите спецификации, перечисленные ниже.