Прискорююча кнопка n назначена для пропусків при навігації по сторінкам. Пропуск для переходу на початок контента.

Даний документ є перекладом. У випадку будь-яких невідповідностей і помилок остання версія документу англійською мовою повинна розглядатися як офіційна. Першопочаткове авторське право належить W3C, як це вказано нижче.

Перекладач: Елена Неллсон (Elena Nellson)

s_gotoW3cHome Інтернаціоналізація
 

Кодировка символов

Аудиторія: для тех, кто хочет вкратце получить основную информацию о кодировке символов в HTML и XML. Для более подробной информации читать далее.

Набор символов документа

Набор символов документа для XML и HTML 4.0 - это Unicode (также известный, как ISO 10646). Это значит, что HTML браузеры и XML процессоры должны работать, как если бы они используют Unicode. Но это не значит, что передаваемые документы должны быть в Unicode. Если клиент и сервер согласованы на использование какой-либо кодировки, они могут использовать любую кодировку, которая может быть переведена на Unicode. Подробнее об этом на набор символов документа.

Обозначение кодировок

Очень важно ясно обозначить кодировку символов в XML и (X)HTML документах, чтобы клиенты могли легко преобразовать кодировку в Unicode. Этого можно достичь следующими способами:

Для дискуссии, какой способ (X)HTML документа лучше, посмотрите руководство Наборы символов и кодировок в XHTML, HTML и CSS.

Вышеуказанные примеры показывают декларации для UTF-8 кодировки содержания. Предполагается, что это наилучший выбор кодировки для различного вида документов, но не единственный выбор.

Если не используется UTF-8, то нужно заменить utf-8 текст в вышеуказанных примерах выбранной кодировкой. Полный список можно посмотреть на Названия кодировок символов, зарегистрированных IANA. Скорее всего, предпочтительны будут несколько видов кодировок: ISO-8859-1 (Latin-1), US-ASCII, UTF-16, другие кодировки из списка ISO-8859, iso-2022-jp, euc-kr, и т.д.

Проверка функциональности кодировки

Важно не только обозначить декларацию кодировки, как выше в HTTP или в содержании, но также:

Более подробно об этом на Изменяя (X)HTML кодировку страницы на UTF-8. Несмотря на то, что статья написана с перспективы UTF-8, информация статьи может относится к любой используемой кодировке.

Доречі

Значения атрибута кодировки можно найти на Реестр IANA. Заметьте, что значения - это так называемые имена charset, хотя в действительности они относятся к кодировкам, а не наборам символов.

Для более углублённой информации, относящейся к термину "charset", прочитайте статью Дэна Конноли (Dan Connolly) Считается, что "Набор символов" приносит вред) и ответ Глена Эдамс (Glenn Adams) Терминология набора символов, SC2 в сравнении с SC18 и Стандартов Интернета).

Заметка: Рик Джеллифе (Rick Jellife) предложил использовать записи SPREAD из ERCS.

Розкажіть нам про те, що Ви думаєте.

Підписатися на RSS джерело.

Нові джерела

Новини головної сторінки

Twitter (Новини головної сторінки)

‎@webi18n

Додаткові матеріали

Полезные вводные статьи:

Ссылки к спецификациям:

Другие ссылки:

Автор: Bert Bos, W3C. Змінено: Martin J. Dürst, W3C; Richard Ishida, W3C. Перекладач: Елена Неллсон (Elena Nellson).

Допустимий XHTML 1.0!
Допустимий CSS!
Кодування UTF-8!

Переклад Англійського контенту від 2006-07-20. Переклад останнього оновлення 2011-01-26 20:10 GMT

Для перегляду історії внесення змін до перекладу натисність article-O-charset в блоге i18n.