Дву-символни или три-символни кодове за език

Въпрос

Дву-символни или три-символни кодове за език да използвам?

В световната мрежа и интернет се използват маркировки за езика, които определят езика на текста в пророколи и формати като HTML, XHTML, XML, HTTPи други. В миналото стойностите за маркиране на езика бяха дефинирани в RFC 3066 Маркировка за идентифициране на езици (и неговият предшественик RFC 1766) и започваха с ISO 639-1 дву-символен код за език или ISO 639-2 три-символен код.

За някои езици имаше дву-символни и три-символни варианти в ISO кодовете. (А за някои езици имаше дори два три-символни варианта за избор.) Хората понякога се объркваха кой ISO код да използват в маркировката за език.

Отговор

Добрата новина е че вече не се налага да се притеснявате за този проблем!

Текущата IETF спецификация описваща как да се създават кодове за език се нарича BCP 47. Това вече не ви насочва към списъците с кодове на ISO. Вместо това, би трябвало да погледнете съответните под-маркировки в новия IANA Регистър на под-маркировките за език. Този регистър съдържа само една под-маркировка за език, така че вече няма почва за двусмислие или колебание.

Въпреки че вече би трябвало да поглеждате в Регистър IANA за под-маркировки на езика вместо в ISO списъците с кодове, мракировките за език които сте използвали до сега не е нужно да бъдат променяни (стига да сте спазвали правилото за 'най-кратък код'). Това е просто промяна на начина по който ги достъпвате.

Регистъра IANA за езиковите под-маркировки все оше използва, и е обновяван редовно с кодовете от ISO стандартите, но хората които поддържат регистъра се грижат за дву или три-символното правило.

За повече информация относно как да използвате новата маркировка за език и регистъра, вижте статиите Маркировки за език в HTML и XML and Избор на маркировка за език.