Codici di linguaggio ISO a due o tre lettere

Domanda

Devo utilizzare codici di lingua ISO a due o tre lettere nei tag linguistici?

Internet e il Web utilizza tag linguistici per indicare il linguaggio naturale del testo in protocolli e formati, come HTML, XHTML, XML, HTTP e altri. In passato, i valori dei tag di lingua erano definiti da RFC 3066 Tag di Identificazione della Lingua (e dal suo predecessore RFC 1766) e iniziavano con un codice di lingua ISO 639-1 a due lettere o ISO 639-2 a tre lettere.

Per alcune lingue esistevano alternative sia di due che di tre lettere nei codici ISO. (E per alcune lingue c'erano anche due alternative di tre lettere tra cui scegliere). A volte le persone erano confuse su quale codice ISO dovessero usare in un tag linguistico.

Risposta

La risposta non è né l'una né l'altra!

L'attuale specifica IETF che descrive come creare i tag di lingua si chiama BCP 47. Questa non fa più riferimento alle liste di codici ISO. Dovreste invece cercare i sottotag appropriati nella nuova IANA Language Sottotag Registry. Questo registro contiene un solo sottotag per lingua, quindi non c'è più alcuna ambiguità.

Anche se ora è necessario cercare nel Language Subtag Registry della IANA piuttosto che negli elenchi di codici ISO, i tag di lingua che avete usato finora non hanno bisogno di essere modificati (a patto che abbiate seguito la regola del "codice più breve"). Questo è solo un cambiamento nel modo di accedervi.

Il Language Subtag Registry della IANA utilizza ancora e si aggiorna con i codici degli standard ISO, ma i responsabili del registro si preoccupano che ci sia un solo sottotag per ogni lingua: un sottotag di due o tre lettere.

Per maggiori informazioni su come usare la nuova sintassi dei tag di lingua e il registro, vedere gli articoli Tag linguistici in HTML e XML e Scegliere un'etichetta di lingua.