Прискорююча кнопка n назначена для пропусків при навігації по сторінкам. Пропуск для переходу на початок контента.

Даний документ є перекладом. У випадку будь-яких невідповідностей і помилок остання версія документу англійською мовою повинна розглядатися як офіційна. Першопочаткове авторське право належить W3C, як це вказано нижче.

Перекладач: Nataly Panchenko

s_gotoW3cHome Інтернаціоналізація
 

Кодування Символів

Аудиторія: Програмісти мови XHTML/HTML (які використовують текстовий редактор або мову сценаріїв, програмісти мови сценаріїв (PHP, JSP і т.д.), програмісти CSS, розробники XSLT, менеджери Web-проектів, і ті, кому цікаво, що таке набір символів документів і як він пов’язаний з кодуванням документа чи сторінки. Для більш детальної інформації Додатково.

Набір Символів Документа

Набір символів документа чи базовий набір символів XML і HTML (версія 4.0) Unicode – (також відомий як ISO 10646). Це означає, що HTML браузери та XML процесори повинні працювати так, ніби вони використовують Unicode. Але це не значить, що документи, які передаються, повинні бути в Unicode. Якщо клієнт і сервер узгоджені на використання будь-якого кодування, вони можуть використовувати будь-яке кодування, яке може бути переведене на Unicode. Детальніше Набір символів документа.

Позначення кодування

Це не означає, що всі документи XML і HTML повинні бути закодовані як Unicode, це значить, що всі подібні документи можуть містити лише набір знаків, визначених Unicode. Це можна зробити наступним чином:

Ведучи дискусію про те, який з підходів найкращий для типу (X)HTML документу, дивіться посилання Набори символів & Кодування в XHTML, HTML та CSS.

Приклади вище показують декларації для UTF-8 закодованого контента. Це мабуть найкращий вибір кодування для більшості цілей, але не єдиний можливий.

Якщо не використовувати UTF-8, Ви маєте змінити utf-8 текст з назвою обраного кодування у прикладах вище. Ви можете переглянути повний список кодування імен символів зареєстрованих IANA (long). На практиці, дуже мало кодувань отримають перевагу, найбільш популярні: ISO-8859-1 (Latin-1), US-ASCII, UTF-16, інші кодування ISO-8859 серій, iso-2022-jp, euc-kr, і т.д.

Перевірка функціональності кодування

Дуже важливо не тільки використовувати декларації кодування HTTP чи контента, але й також:

Для отримання більш детальної інформації з даного питання обирайте наступні посилання Заміна (X)HTML кодування сторінки на UTF-8. Хоча воно написано з перспективи кодування UTF-8, воно використовує будь-яке кодування, яким користуєтесь Ви.

Доречі

Значення атрибута кодування можна знайти в IANA Реєстрі. Зауважте, що значення – це так звані імена charset хоча в дійсності вони відносяться до кодувань, а не до наборів символів.

Для більш поглибленої інформації, що відноситься до терміну 'charset', статтю Дена Коннолі (Dan Connolly) ("Набір символів" Шкідливо) і відповідь Глена Едамс (Glenn Adams)(Термінологія Набору символів, SC2 в порівнянні з SC18 та Інтернет Стандартів).

Примітка: Рік Джелліфе (Rick Jellife) запропонував використовувати записи SPREAD з ERCS.

Розкажіть нам про те, що Ви думаєте.

Підписатися на RSS джерело.

Нові джерела

Новини головної сторінки

Twitter (Новини головної сторінки)

‎@webi18n

Додаткові матеріали

Корисні матеріали:

Довідкова інформація серед специфікацій:

Додаткові матеріали:

Автор: Bert Bos, W3C. Змінено: Martin J. Dürst, W3C; Richard Ishida, W3C. Перекладач: Nataly Panchenko.

Допустимий XHTML 1.0!
Допустимий CSS!
Кодування UTF-8!

Переклад Англійського контенту від 2006-07-20. Переклад останнього оновлення 2011-01-26 20:10 GMT

Для перегляду історії внесення змін до перекладу натисність article-O-charset в блоге i18n.