Ускоряющая клавиша n предназначена для пропусков при навигации по страницам. Пропуск для перехода на начало контента.

Данный документ является переводом. В случае каких-либо несоответствий и ошибок последняя версия документа на английском языке должна рассматриваться в качестве официальной. Первоначальное авторское право принадлежит W3C, как то указано ниже.

Переводчик: Елена Неллсон (Elena Nellson)

s_gotoW3cHome Internationalization
 

Кодировка символов

Предполагаемая аудитория: для тех, кто хочет вкратце получить основную информацию о кодировке символов в HTML и XML. Для более подробной информации читать далее.

Набор символов документа

Набор символов документа для XML и HTML 4.0 - это Unicode (также известный, как ISO 10646). Это значит, что HTML браузеры и XML процессоры должны работать, как если бы они используют Unicode. Но это не значит, что передаваемые документы должны быть в Unicode. Если клиент и сервер согласованы на использование какой-либо кодировки, они могут использовать любую кодировку, которая может быть переведена на Unicode. Подробнее об этом на набор символов документа.

Обозначение кодировок

Очень важно ясно обозначить кодировку символов в XML и (X)HTML документах, чтобы клиенты могли легко преобразовать кодировку в Unicode. Этого можно достичь следующими способами:

Для дискуссии, какой способ (X)HTML документа лучше, посмотрите руководство Наборы символов и кодировок в XHTML, HTML и CSS.

Вышеуказанные примеры показывают декларации для UTF-8 кодировки содержания. Предполагается, что это наилучший выбор кодировки для различного вида документов, но не единственный выбор.

Если не используется UTF-8, то нужно заменить utf-8 текст в вышеуказанных примерах выбранной кодировкой. Полный список можно посмотреть на Названия кодировок символов, зарегистрированных IANA. Скорее всего, предпочтительны будут несколько видов кодировок: ISO-8859-1 (Latin-1), US-ASCII, UTF-16, другие кодировки из списка ISO-8859, iso-2022-jp, euc-kr, и т.д.

Проверка функциональности кодировки

Важно не только обозначить декларацию кодировки, как выше в HTTP или в содержании, но также:

Более подробно об этом на Изменяя (X)HTML кодировку страницы на UTF-8. Несмотря на то, что статья написана с перспективы UTF-8, информация статьи может относится к любой используемой кодировке.

Кстати говоря

Значения атрибута кодировки можно найти на Реестр IANA. Заметьте, что значения - это так называемые имена charset, хотя в действительности они относятся к кодировкам, а не наборам символов.

Для более углублённой информации, относящейся к термину "charset", прочитайте статью Дэна Конноли (Dan Connolly) Считается, что "Набор символов" приносит вред) и ответ Глена Эдамс (Glenn Adams) Терминология набора символов, SC2 в сравнении с SC18 и Стандартов Интернета).

Заметка: Рик Джеллифе (Rick Jellife) предложил использовать записи SPREAD из ERCS.

Выскажите своё мнение (по-английски).

Подпишитесь на ленту новостей RSS.

Новые публикации

Новости главной страницы

Twitter (Новости главной страницы)

‎@webi18n

Дополнительные материалы

Полезные вводные статьи:

Ссылки к спецификациям:

Другие ссылки:

Автор: Bert Bos, W3C. Изменения внес: Martin J. Dürst, W3C; Richard Ishida, W3C. Переводчик: Елена Неллсон (Elena Nellson).

Допустимый XHTML 1.0!
Допустимый CSS!
Кодировка UTF-8!

Перевод с английского: 2006-07-20. Последнее внесение изменений в перевод: 2011-01-26 20:10 GMT

Для просмотра истории внесения изменений нажмите article-O-charset в блоге i18n.