Nicht-englische Tags

Frage

Kann man in HTML und XML Element- und Attributbezeichner in anderen Sprachen und Schriften als der englischen verwenden?

Antwort

In HTML und XHTML sind alle Bezeichner vordefiniert (in Englisch) und müssen so verwendet werden, damit sie von Nutzerprogrammen (Browsern) korrekt verarbeitet werden.

In XML kann man seine eigenen Bezeichner definieren – in jeder Sprache und Schrift, die von Unicode unterstützt wird.

Obwohl alle XML-Prozessoren Unicode unterstützen müssen, ist hier etwas Vorsicht geboten. Wenn jemand mit Bezeichnern in, sagen wir, Chinesisch, Arabisch oder Hindi arbeiten muss, kann sich das als schwierig erweisen, wenn er diese Sprache nicht spricht oder keine passende Schriftart und Software zum Rendern auf seinem System hat. Englische Bezeichner haben den Vorteil bei DTDs, die von internationalen Gruppen verwendet werden, dass Menschen in verschiedenen Ländern sie wirklich angezeigt bekommen und ihre Bedeutung verstehen können.

Auf der anderen Seite kann die Verwendung nicht-englischer Bezeichner in Lehrmaterialien sinnvoll sein. Dies ist bspw. üblich in japanischen XML-Grundkursen.

Übrigens

Zu beachten ist auch, dass in Bezeichnern keine Zeichenreferenzen erlaubt sind und deshalb bei Verwendung von Nicht-ASCII-Bezeichnern eine Zeichencodierung verwendet werden muss, die die benötigten Zeichen unterstützt. Die Verwendung einer Unicode-Codierung wie UTF-8 ist meist der beste Ansatz.

In XML 1.1 sind fast alle Zeichen erlaubt, aber nicht jedes Zeichen ist sinnvoll. Empfehlungen, welche Zeichen verwendet werden können, gibt Anhang B der XML-1.1-Spezifikation.

Für genaue Informationen, welche Zeichen in XML-Bezeichnern erlaubt sind, siehe nachfolgende Literaturhinweise.