Ускоряющая клавиша n предназначена для пропусков при навигации по страницам. Пропуск для перехода на начало контента.

Данный документ является переводом. В случае каких-либо несоответствий и ошибок последняя версия документа на английском языке должна рассматриваться в качестве официальной. Первоначальное авторское право принадлежит W3C, как то указано ниже.

Переводчик: Alexandr Shlapak (Александр Шлапак)

s_gotoW3cHome Internationalization
 

Проверка заголовков HTTP

Предполагаемая аудитория: пользователи, шифровальщики XHTML/HTML (используя редакторы или скрипты), разработчики скриптов (PHP, JSP, и т.д.), менеджеры веб проектов, и каждый кому надо узнать как проверить кодирование символов, которое используется заголовком HTTP.

Обновление перевода: 2011-08-22 21:30

Вопрос

Как можно проверить информацию о кодирование символов переданную в заголовке НТТР веб документа?

Вводная информация

Важно четко определить кодирование символов (charset) документа обслуживаемого в Сети. В противном случае, получатель не может правильно интерпретировать документ. Веб-браузер, например, может показать случайные символы вместо текста что можно прочесть. Один из способов указать кодирование символов веб-документа это поставить эту информацию в параметр charset заголовка Content-Type.

В частности, важно отметить, что кодирование назначенное в заголовке HTTP переопределяет все назначения кодирования в середине документа в HTML и CSS файлах.

Ответ

Есть несколько способов проверить текущий Веб документ, включая заголовки:

Валидатор i18n

Инструмент для проверки интернационализации, Инструмент для проверки интернационализации , разработанный W3C, проверяет веб страницы по различным аспектам Интернационализации. Он также имеет информационный раздел, который суммирует ключевую информацию о странице, которая связана с интернационализацией, например, кодирование символов, назначение языка и т.д. Этот раздел расскажет вам используется ли назначение кодирования в заголовке HTTP, и если да, то, что это за кодирование.

Инструмент валидатор i18n особенно полезный, поскольку он показывает вам другие назначения кодирования, которые используются в документе, и сообщает вам если есть различия.

Использование сервиса, базирующегося на основе Сети

Есть несколько служб, которые показывают все заголовки HTTP и (HTML / XHTML) исходный код документа, который возвращается с сервера после ввода адреса документа который вас интересует:

римечание: W3C не имеет никакого отношения к любой из этих служб.

В заголовках HTTP, найдите заголовок Content-Type, и в частности параметр charset, например

Content-Type: text/html; charset=utf-8

Примечание: параметра charset может и не быть. Это нормально, если ваш документ сам указывает свое кодирование символов.

Использование Службы для Проверки Разметки W3C

Чтобы проверить разметку, Служба для Проверки Разметки должна убедиться, что она правильно декодирует документ, который она проверяет. Он покажет сообщение об ошибке, если она не сможет найти информацию о кодировке, или если она найдет противоречивую информацию, или если она не сможет декодировать документ, согласно информации, которую она нашла.

Чтобы узнать кодировку, которую обнаружил валидатор, вы можете использовать расширенный интерфейс. В этом интерфейсе, вы также можете выбрать опцию показать исходный код, и тогда визуально проверить правильно ли интерпретирован тот исходный код. Это полезно для того, чтобы проверить правильную ли кодировку вы используете в настоящее время. Не всегда возможно машинально проверить, например, на самом ли деле документ с назначенным кодировкой iso-8859-1 закодирован в iso-8859-2 или в любом другом кодировании.

Используйте telnet или другой инструмент, запускаемый из командной строки

Этот способ требует немного больше опыта, но его можно легко автоматизировать. Еще один инструмент, запускаемый из командной строки - это wget (с опцией -S или -s).

Кстати говоря

Некоторые серверы перекодирует веб-документы, которые они обслуживают в различные кодировки для разных клиентов. Это происходит, например, на некоторых Российских серверах. Нужно быть очень внимательным, так как браузер, работающий, например, на Mac или на операционной системе Windows, может указывать на использование другого кодирования, отличающегося от предоставленного вам службой, базирующейся на основе Сети или W3C Сервисом Проверки Разметки (который в основном базируются на основе UNIX-систем).

Выскажите своё мнение (по-английски).

Подпишитесь на ленту новостей RSS.

Новые публикации

Новости главной страницы

Twitter (Новости главной страницы)

‎@webi18n

Дополнительные материалы

Автор: Martin Dürst, W3C. Изменения внес: Richard Ishida, W3C. Переводчик: Alexandr Shlapak (Александр Шлапак).

Допустимый XHTML 1.0!
Допустимый CSS!
Кодировка UTF-8!

Перевод с английского: 2010-08-28. Последнее внесение изменений в перевод: 2011-08-22 21:30 GMT

Для просмотра истории внесения изменений нажмите qa-headers-charset в блоге i18n.