Прискорююча кнопка n назначена для пропусків при навігації по сторінкам. Пропуск для переходу на початок контента.
Даний документ є перекладом. У випадку будь-яких невідповідностей і помилок остання версія документу англійською мовою повинна розглядатися як офіційна. Першопочаткове авторське право належить W3C, як це вказано нижче.
Перекладач: Елена Неллсон (Elena Nellson)
Аудиторія: для тех, кто хочет вкратце получить основную информацию о кодировке символов в HTML и XML. Для более подробной информации читать далее.
Набор символов документа для XML и HTML 4.0 - это Unicode (также известный, как ISO 10646). Это значит, что HTML браузеры и XML процессоры должны работать, как если бы они используют Unicode. Но это не значит, что передаваемые документы должны быть в Unicode. Если клиент и сервер согласованы на использование какой-либо кодировки, они могут использовать любую кодировку, которая может быть переведена на Unicode. Подробнее об этом на набор символов документа.
Очень важно ясно обозначить кодировку символов в XML и (X)HTML документах, чтобы клиенты могли легко преобразовать кодировку в Unicode. Этого можно достичь следующими способами:
Обозначить 'charset' параметр в заголовоке HTTP Content-Type. Например:
Content-Type: text/html; charset=utf-8Для этого нужно иметь доступ к установкам сервера или обозначить документ через язык сценариев (подробнее об этом на Установка параметра charset HTTP)
Для XML (включая XHTML) используйте псевдо-атрибут в декларации XML в начале документа или в текстовой декларации в начале записи. Например:
<?xml version="1.0" encoding="utf-8" ?> Существует ряд потенциальных сложностей, о которых нужно знать, используя данный метод при XHTML 1.0, функционирующий как HTML.
Для HTML или XHTML, функционирующих как HTML, всегда нужно использовать <meta> тег внутри
<head>. Например:
<meta http-equiv="Content-Type" content="text/html;charset=utf-8" >Для XHTML нужен символ / в конце строки:
<meta http-equiv="Content-Type" content="text/html;charset=utf-8" />Для дискуссии, какой способ (X)HTML документа лучше, посмотрите руководство Наборы символов и кодировок в XHTML, HTML и CSS.
Вышеуказанные примеры показывают декларации для UTF-8 кодировки содержания. Предполагается, что это наилучший выбор
кодировки для различного вида документов, но не единственный выбор.
Если не используется UTF-8, то нужно заменить utf-8 текст в вышеуказанных примерах выбранной кодировкой. Полный список можно
посмотреть на Названия кодировок символов, зарегистрированных IANA. Скорее всего,
предпочтительны будут несколько видов кодировок: ISO-8859-1 (Latin-1), US-ASCII, UTF-16, другие кодировки из
списка ISO-8859, iso-2022-jp, euc-kr, и т.д.
Важно не только обозначить декларацию кодировки, как выше в HTTP или в содержании, но также:
Сохранить все данные в определённой кодировке в среде редактирования.
Убедитесь, что нет конфликта между декларацией в документе и кодировки, которую автоматически применяет сервер, так как установки сервера переписываются вместо деклараций документа.
Более подробно об этом на Изменяя (X)HTML кодировку страницы на UTF-8. Несмотря на то, что статья написана с перспективы UTF-8, информация статьи может относится к любой используемой кодировке.
Значения атрибута кодировки можно найти на Реестр IANA. Заметьте, что значения - это так называемые имена charset, хотя в действительности они относятся к кодировкам, а не наборам символов.
Для более углублённой информации, относящейся к термину "charset", прочитайте статью Дэна Конноли (Dan Connolly) Считается, что "Набор символов" приносит вред) и ответ Глена Эдамс (Glenn Adams) Терминология набора символов, SC2 в сравнении с SC18 и Стандартов Интернета).
Заметка: Рик Джеллифе (Rick Jellife) предложил использовать записи SPREAD из ERCS.
Розкажіть нам про те, що Ви думаєте.
Підписатися на RSS джерело.
Twitter (Новини головної сторінки)
Переклад Англійського контенту від 2006-07-20. Переклад останнього оновлення 2011-01-26 20:10 GMT
Для перегляду історії внесення змін до перекладу натисність article-O-charset в блоге i18n.
Copyright © 31 May, 1996-2011 W3C® (MIT, ERCIM, Keio, Beihang), All Rights Reserved. W3C liability, trademark, document use and software licensing rules apply. Your interactions with this site are in accordance with our public and Member privacy statements.