Код за достъп n прескача къмнавигацията във страницата. Отиди в началото на съдържанието.

Този документ е преведен. В случй на несъответствие или грешки, най-новият Английси оригинал трябва да се счита за официален. Оригиналното авторско право принадлежи на W3C, както е указано долу.

Преводач: Ivan Baldwin

s_gotoW3cHome Интернационализация
 

Кодировка на символите

Аудитория: за всички които искат да получат основна информация относно кодирането на символи в HTML и XML. За повече информация следвайте препратките в текста или вижте Допълнителната информация.

Наборът от символи на документа

Наборът от символи на документа за XML и HTML 4.0 е Unicode (познат още като ISO 10646). Това означава че HTML браузъри и XML процесори трябва да работят така сякаш Unicode е използван преднамерено. Но това не означава че документите трябва да бъдат прехвърляни използвайки Unicode. Ако клиентът и сървърът са съгласувани да изполват идентична кодировка, те могат да използват всякаква кодировка която може да бъде преведена към Unicode. Прочети повече за наборът от символи на документа.

Деклариране на кодировката

Много е важно кодировката за за всеки XML или (X)HTML документ да бъде ясно обзначена, за да може клиентът лесно да преобразува кодировката в Unicode. Това може да бъде направено по следните начини...

За дискусия, кой метод е най-добър за даденият тип (X)HTML документ, прочетете упътването Набор от символи и кодиране в XHTML, HTML и CSS.

Горепосочените примери показват декларации за UTF-8 кодирано съдържание. Вероятно това е най-добрият избор за повечето цели, но не е единственият възможен.

Ако не използвате UTF-8 трябва да промените текста utf-8 в примерите дадени по-горе с името на кодировката която сте избрали. Можете да видите пълният списък с имена на коидровка на символите регистрирани от IANA. В практиката обичйно са предпочитани няколко вида кодиране: ISO-8859-1 (Latin-1), US-ASCII, UTF-16, другите кодировки в списъка ISO-8859, iso-2022-jp, euc-kr, и т.н.

Проверка на функционалността на кодировката

Важно е не само декларациите за кодировката да бъдат възможно най-горе в HTTP или съдържанието, но също:

За повече информация по тези въпроси вижте Променяне кодировката на (X)HTML старница към UTF-8. Въпреки че страницата описва нещата в UTF-8 переспектива, тя важи за всякакъв вид кодировка.

Междо другото

Стойностите за атрибута за кодировка можете да откриете в списъка IANA. Забележете че те са наречени имена на charset, въпреки че в действителност се отнасят за кодировката а не за набора от символи.

Ако желаете детайлна информация относно термина 'charset', вижте статията на Dan Connolly (Смята се че наборът от символи причинява вреди) и отговорът на Glenn Adams (Терминология на наборът от символи, SC2 в сравнение с SC18 и Интернет Стандартите).

Забележка: Rick Jellife е предложил използването на SPREAD записите от ERCS.

Изкажете своето мнение (на Английски).

Абонирай се за RSS фиид.

Нови ресурси

Новините от началната страница

Twitter (Новините от началната страница)

‎@webi18n

Странична информация

Полезни уводни статии:

Препратки към спецификациите:

Други препратки:

Автор: Bert Bos, W3C. Редактирано от: Martin J. Dürst, W3C; Richard Ishida, W3C. Преводач: Ivan Baldwin.

Валиден XHTML 1.0!
Валиден CSS!
Енкодинк UTF-8!

Превод от Английско съдържание от дата 2006-07-20. Последна ревизия на преведената версия: 2011-01-26 20:10 GMT

За да видите направените прмени поръсете за article-O-charset във блога i18n.