Κώδικες γλώσσας με δύο ή τρία γράμματα

Ερώτηση

Πρέπει να χρησιμοποιώ ISO κώδικες γλώσσας δύο ή τριών γραμμάτων σε στοιχεία γλώσσας;

Το διαδίκτυο και ο Ιστός χρησιμοποιούν στοιχεία γλώσσας για να καθορίσουν την φυσική γλώσσα του κειμένου σε πρωτόκολλα και formats, όπως HTML, XHTML, XML, HTTP, και άλλα. Στο παρελθόν οι τιμές των στοιχείων γλώσσας οριζόταν από το RFC 3066 Στοιχεία για την Ταυτοποίηση Γλωσσών (και τον προκάτοχό του RFC 1766) και ξεκινούσαν με είτε ένα ISO 639-1 κωδικό γλώσσας δύο γραμμάτων ή ένα ISO 639-2 κωδικό τριών γραμμάτων.

Για μερικές γλώσσες υπήρχαν και οι δύο εναλλακτικές δύο και τριών γραμμάτων στους κώδικες ISO. (Και για μερικές γλώσσες υπήρχαν ακόμα και δύο εναλλακτικές τριών γραμμάτων προς επιλογή.) Οι άνθρωποι ήταν μερικές φορές σε σύγχυση, σχετικά με ποιό κωδικό ISO οποία θα πρέπει να χρησιμοποιήσουν σε ένα στοιχείο γλώσσας.

Απάντηση

Τα καλά νέα είναι ότι δεν πρέπει να σας απασχολεί πλέον αυτό το ζήτημα!

Το 2006 το IETF δημοσίευσε μία νέα προδιαγραφή, που περιγράφει πώς να δημιουργείτε στοιχεία γλώσσας, την BCP 47. Αυτή δεν σας παραπέμπει πλέον στις λίστες κωδικών ISO. Αντιθέτως, θα πρέπει να αναζητήσετε τα κατάλληλα υποστοιχεία στο νέο Μητρώο Υποστοιχείων Γλώσσας IANA. Το μητρώο αυτό περιέχει μόνο ένα υποστοιχείο ανά γλώσσα, οπότε δεν υπάρχει πλέον καμία ασάφεια.

Παρόλο που τώρα πρέπει να αναζητήσετε το Μητρώο Υποστοιχείων Γλώσσας IANA και όχι τις λίστες κωδικών ISO, τα στοιχεία γλώσσας, που χρησιμοποιούσατε μέχρι τώρα, δεν είναι απαραίτητο να αλλάξουν (αν ακολουθήσατε τον κανόνα του 'συντομότερου κώδικα'). Πρόκειται μόνο για αλλαγή του τρόπου πρόσβασης σε αυτά.

το Μητρώο Υποστοιχείων Γλώσσας IANA χρησιμοποιεί ακόμα και ενημερώνεται συνεχώς με κώδικες από τα πρότυπα ISO, αλλά οι συντηρητές του μητρώου έχουν αναλάβει τη φροντίδα του κανόνα 2- ή 3-γραμμάτων.

For more information about how to use the new language tag syntax and the registry, see the articles Language Tags in HTML and XML and Choosing a Language Tag.