Код за достъп n прескача къмнавигацията във страницата. Отиди в началото на съдържанието.
Този документ е преведен. В случй на несъответствие или грешки, най-новият Английси оригинал трябва да се счита за официален. Оригиналното авторско право принадлежи на W3C, както е указано долу.
Преводач: Ivan Baldwin
Аудитория: за всички които искат да получат основна информация относно кодирането на символи в HTML и XML. За повече информация следвайте препратките в текста или вижте Допълнителната информация.
Наборът от символи на документа за XML и HTML 4.0 е Unicode (познат още като ISO 10646). Това означава че HTML браузъри и XML процесори трябва да работят така сякаш Unicode е използван преднамерено. Но това не означава че документите трябва да бъдат прехвърляни използвайки Unicode. Ако клиентът и сървърът са съгласувани да изполват идентична кодировка, те могат да използват всякаква кодировка която може да бъде преведена към Unicode. Прочети повече за наборът от символи на документа.
Много е важно кодировката за за всеки XML или (X)HTML документ да бъде ясно обзначена, за да може клиентът лесно да преобразува кодировката в Unicode. Това може да бъде направено по следните начини...
Изпращайки 'charset' параметър във Content-Type хедъра на HTTP. Пример:
Content-Type: text/html; charset=utf-8За да направите това е необходимо да имате достъп до настройките на сървъра или да използвате скриптинг (виж Настройване на charset параметър в HTTP за повече информация).
За XML (включително XHTML), използвайте псевдо-атрибут за кодировка в XML декларацията в началото на документа или текстова декларацията в началото на записа. Пример:
<?xml version="1.0" encoding="utf-8" ?> Има потенциални проблеми с които трябва да сте наясно когато използвате това с XHTML 1.0 предоставян от сървъра във форма на HTML.
За HTML или XHTML предоставен от сървъра като HTML, винаги трябва да използвате <meta> таг във <head> секцията.
Пример:
<meta http-equiv="Content-Type" content="text/html;charset=utf-8" >За XHTML, е необходимо да добавите наклонена черта в края:
<meta http-equiv="Content-Type" content="text/html;charset=utf-8" />За дискусия, кой метод е най-добър за даденият тип (X)HTML документ, прочетете упътването Набор от символи и кодиране в XHTML, HTML и CSS.
Горепосочените примери показват декларации за UTF-8 кодирано съдържание. Вероятно това е най-добрият избор за повечето цели, но не е единственият възможен.
Ако не използвате UTF-8 трябва да промените текста utf-8 в примерите дадени по-горе с името на кодировката която сте избрали.
Можете да видите пълният списък с имена на коидровка на символите регистрирани от IANA. В практиката обичйно са предпочитани няколко вида кодиране: ISO-8859-1 (Latin-1), US-ASCII, UTF-16, другите кодировки в списъка ISO-8859, iso-2022-jp, euc-kr, и т.н.
Важно е не само декларациите за кодировката да бъдат възможно най-горе в HTTP или съдържанието, но също:
Да запишете данните си в правилната кодировка от средата за редактиране.
За повече информация по тези въпроси вижте Променяне кодировката на (X)HTML старница към UTF-8. Въпреки че страницата описва нещата в UTF-8 переспектива, тя важи за всякакъв вид кодировка.
Стойностите за атрибута за кодировка можете да откриете в списъка IANA. Забележете че те са наречени имена на charset, въпреки че в действителност се отнасят за кодировката а не за набора от символи.
Ако желаете детайлна информация относно термина 'charset', вижте статията на Dan Connolly (Смята се че наборът от символи причинява вреди) и отговорът на Glenn Adams (Терминология на наборът от символи, SC2 в сравнение с SC18 и Интернет Стандартите).
Забележка: Rick Jellife е предложил използването на SPREAD записите от ERCS.
Изкажете своето мнение (на Английски).
Превод от Английско съдържание от дата 2006-07-20. Последна ревизия на преведената версия: 2011-01-26 20:10 GMT
За да видите направените прмени поръсете за article-O-charset във блога i18n.
Copyright © 31 May, 1996-2011 W3C® (MIT, ERCIM, Keio, Beihang), All Rights Reserved. W3C liability, trademark, document use and software licensing rules apply. Your interactions with this site are in accordance with our public and Member privacy statements.