Zweibuchstabige oder dreibuchstabige Sprachcodes

Frage

Sollte man die zweibuchstabigen oder die dreibuchstabigen ISO-Sprachcodes in Sprachkennzeichnungen verwenden?

Im Internet und im World Wide Web werden Sprachkennzeichnungen verwendet, um die natürliche Sprache des Textes in Protokollen und Formaten wie HTML, XHTML, XML, HTTP u.a. anzugeben. In der Vergangenheit wurden die Werte für Sprachkennzeichnungen durch RFC 3066: Kennzeichnungen zur Identifikation von Sprachen (und seinen Vorgänger RFC 1766) definiert.

Die Sprachkennzeichnungen begannen entweder mit einem zweibuchstabigen Code nach ISO 639-1 oder einem dreibuchstabigen Code nach ISO 639-2. Für manche Sprachen gab es beide Alternativen. (Und für manche Sprachen standen sogar zwei dreibuchstabige Alternativen zur Auswahl.) Viele waren sich unsicher, welchen ISO-Code sie in einer Sprachkennzeichnung verwenden sollten.

Antwort

Die gute Nachricht ist: Man muss sich über diese Frage keine Gedanken mehr machen!

Die aktuelle IETF-Spezifikation, die beschreibt, wie Sprachkennzeichnungen gebildet werden, ist BCP 47. Darin wird nicht mehr auf die ISO-Codes verwiesen, sondern auf das neue IANA-Register für Sprachkürzel. Dieses Register enthält nur ein Kürzel für jede Sprache, so dass es keine Unklarheiten mehr gibt.

Anmerkung des Übersetzers: In dieser Übersetzung werden folgende Begriffe verwendet:
Sprachcode für language code
Sprachkennzeichnung für language tag
Sprachkürzel für language subtag

Sprachkürzel sind Bestandteile der Sprachkennzeichnungen.

Obwohl man jetzt im IANA-Register für Sprachkürzel anstatt in den ISO-Code-Listen nachschlagen sollte, ändern sich die bisher verwendeten Sprachkennzeichnungen nicht (sofern die „Kürzester-Code“-Regel eingehalten wurde). Es hat sich lediglich geändert, woher man sie bezieht.

Das IANA-Register für Sprachkürzel basiert auf den ISO-Standards und wird mit diesen aktualisiert. Die Verwalter des Registers sorgen jedoch dafür, dass jede Sprache nur ein Kürzel hat: entweder ein zweibuchstabiges oder ein dreibuchstabiges.

Für weitere Informationen über die neue Syntax für Sprachkennzeichnungen und das Register siehe Artikel Sprachkennzeichnungen in HTML und XML und Eine Sprachkennzeichnung wählen.