Прискорююча кнопка n назначена для пропусків при навігації по сторінкам. Пропуск для переходу на початок контента.

Даний документ є перекладом. У випадку будь-яких невідповідностей і помилок остання версія документу англійською мовою повинна розглядатися як офіційна. Першопочаткове авторське право належить W3C, як це вказано нижче.

Перекладач: Alexandr Shlapak (Олександр Шлапак)

s_gotoW3cHome Інтернаціоналізація
 

Перевірка Заголовків HTTP

Аудиторія: користувачі, шифрувальники XHTML/HTML (використовуючи редактори або скрипти), розробники скриптів (PHP, JSP, і т.д.), менеджери веб проектів, і кожен кому треба дізнатися як перевірити кодування символів, яке використовується заголовком HTTP.

Питання

Як можна перевірити інформацію про кодування символів передану в заголовку НТТР веб документу?

Ввідна інформація

Важливо чітко визначити кодування символів (charset) документа що обслуговується в Мережі. В іншому випадку, одержувач не може правильно інтерпретувати документ. Веб-браузер, наприклад, може показати випадкові символи замість тексту що можна прочитати. Один із способів вказати кодування символів веб-документа це поставити цю інформацію в параметр charset заголовка Content-Type.

Зокрема, важливо відзначити, що кодування призначене в заголовку HTTP перевизначає всі призначення кодування в середині документу в HTML і CSS файлах.

Відповідь

Є кілька способів перевірити поточний Веб документ, включаючи заголовки:

Валідатор i18n

Інструмент для перевірки Інтернаціоналізації, розроблений W3C, перевіряє веб сторінки по різним аспектам Інтернаціоналізації. Він також має інформаційний розділ, який підсумовує ключову інформацію про сторінку, що пов'язана з інтернаціоналізацією, наприклад, кодування символів, призначення мовни і т.д. Цей розділ розповість вам чи використовується призначення кодування в заголовку HTTP, і якщо так, то, що це за кодування.

Інструмент валідатор i18n особливо корисний, оскільки він показує вам інші призначення кодування, що використовуються в документі, і повідомляє вас якщо є відмінності.

Використання сервісу, що базується на основі Мережі

Є декілька служб, які показують всі заголовки HTTP і (HTML/XHTML) вихідний код документа, який повертається з сервера після введення адреси документу який вас цікавить:

Примітка: W3C не має ніякого відношення до будь-якої з цих служб.

В заголовках HTTP, знайдіть заголовок Content-Type, і зокрема параметр charset, наприклад

Content-Type: text/html; charset=utf-8

Примітка: параметра charset може і не бути. Це нормально, якщо ваш документ сам вказує своє кодування символів.

Використання Служби для Перевірки Розмітки W3C

Щоб перевірити розмітку, Служба для Перевірки Розмітки має переконатися, що вона правильно декодує документ, який вона перевіряє. Він покаже повідомлення про помилку, якщо вона не зможе знайти інформацію про кодування, або якщо вона знайде суперечливу інформацію, або якщо вона не зможе декодувати документ, згідно інформації, яку вона знайшла.

Щоб дізнатися кодування, яке знайшов валідатор, ви можете використовувати розширений інтерфейс. У цьому інтерфейсі, ви також можете вибрати опцію показати вихідний код, і тоді візуально перевірити чи правильно інтерпретуваний той вихідний код. Це корисно для того, щоб перевірити чи в даний час ви використовуєте правильне кодування. Не завжди можливо машинально перевірити чи, наприклад, документ з призначеним кодуванням iso-8859-1 насправді закодований в iso-8859-2 чи в якомусь іншому кодуванні.

Використовуйте telnet або інший інструмент, що запускається через командний рядок

Цей спосіб вимагає трохи більше досвіду, але його можна легко автоматизувати. Ще один інструмент, що запускається через командний рядок - це wget (із опцією -S або -s).

Доречі

Деякі сервери перекодовують веб-документи, які вони обслуговують в різні кодування для різних клієнтів. Це відбувається, наприклад, на деяких Російських серверах. Потрібно бути дуже уважним, так як браузер, що працює, наприклад, на Mac або на операційній системі Windows, може вказувати на використання іншого кодування, що відрізняється від наданого вам службою, що базується на основі Мережі або W3C Сервісом Перевірки Розмітки (який в основному базуються на основі UNIX-систем).

Розкажіть нам про те, що Ви думаєте.

Підписатися на RSS джерело.

Нові джерела

Новини головної сторінки

Twitter (Новини головної сторінки)

‎@webi18n

Додаткові матеріали

Автор: Martin Dürst, W3C. Змінено: Richard Ishida, W3C. Перекладач: Alexandr Shlapak (Олександр Шлапак).

Допустимий XHTML 1.0!
Допустимий CSS!
Кодування UTF-8!

Переклад Англійського контенту від 2010-08-28. Переклад останнього оновлення 2011-08-22 21:00 GMT

Для перегляду історії внесення змін до перекладу натисність qa-headers-charset в блоге i18n.