Можно ли писать HTML и XML элементы и названия тэга атрибута языками и скриптами, которые отличаются от Английского?
Все HTML или XHTML тэги заранее определены (Английским) и должны оставаться в таком виде чтобы клиентские приложения могли их правильно распознать (например браузеры).
В XML можно установить свои собственные названия тэгов. Вы можете это сделать на любом языке или скрипте, которые поддерживаются Unicode.
Хотя и все XML процессоры должны поддерживать Unicode, здесь целесообразно быть осторожным. Если человек имеет дело с набором тэгов, скажем, Китайським, Арабским или Хинди, то может быть трудно определить тот факт: не разговаривают ли они теми языками или не имеют ли правильных шрифтов и программного обеспечения для перевода на их системах. Английские названия тэгов лучшие для DTDs (Определение Типа Документа), которые используются многоязычными группами потому что люди с большого количества стран скорее всего, смогут легко просматривать и понимать значение тэгов, которые вы используете.
С другой стороны, неанглийского названия тэгов могут быть полезными для учебных материалов. Например, это часто встречается в японских обоснованиях XML.
Отметим также, что, поскольку NCRs (числовые ссылки) не разрешены в названиях тэгов, использование non-ASCII названий тэгов требует от вас использовать кодирование символов которое поддерживает необходимые символы. Как правило, использование такой Unicode кодировки как UTF-8 является наилучшим вариантом.
При использовании XML 1.1 почти любой символ разрешен, но не каждый символ имеет значение. Для набора рекомендаций о том, какие символы использовать, смотрите Appendix B с XML 1.1 спецификации.
Для получения конкретной информации о том, какие символы разрешены в XML тэгах смотрите спецификации, перечисленные ниже.
XML 1.0 Спецификация, 2.3 Общие Синтаксические Конструкции http://www.w3.org/TR/REC-xml#sec-common-syn
XML 1.1 Спецификация, 2.3 Общие Синтаксические Конструкции http://www.w3.org/TR/xml11/#sec2.3