Прискорююча кнопка n назначена для пропусків при навігації по сторінкам. Пропуск для переходу на початок контента.

Даний документ є перекладом. У випадку будь-яких невідповідностей і помилок остання версія документу англійською мовою повинна розглядатися як офіційна. Першопочаткове авторське право належить W3C, як це вказано нижче.

Перекладач: Alexandr, Art life

s_gotoW3cHome Інтернаціоналізація
 

Представлення наборів символів і кодування

Аудиторія: ті, хто тільки познайомився із інтернаціоналізацією і має потребу в керівництві по темах для розгляду, і хоче зрозуміти матеріал на сайті.

Ця сторінка орієнтує новачків у веб інтернаціоналізації, які дійсно не знають з чого почати. Мета - полегшити розуміння деяких матеріалів на сайті.

За допомогою посилань справа ви можете знайти підбірку більш докладних статтей. Після того, як ви ознайомитесь з цією сторінкою, ви, ймовірно, просто використаєте тематичний перелік, технічний перелік, або пошук на сайті.

Що це таке?

Дізнайтесь більше...

Кодування символів для початківців пояснює деякі основні поняття про кодування символів, і навіщо вам це потрібно.

Основні визначення, пов'язані з кодуваннями пояснює такі терміни, як Unicode, набори символів, кодування наборів символів, кодування символів, набір символів документа, і екрановані символи.

Набір символів - набір букв і символів, що використовуються для писання. Наприклад, набір символів ASCII охоплює букви і символи для англійськомовного тексту, ISO-8859-6 охоплює букви і символи, необхідні для багатьох мов, що основані на арабському скрипті, і набір символів Unicode містить символи для більшості існуючих мов і скриптів світу.

Символи в наборі символів зберігаються у вигляді одного або декількох байтів на комп'ютері. Кожен байт або послідовність байтів представляє обумовлений символ. Кодування символів розподіляє окремий байт або послідовність байтів в окремі символи, які відображаються шрифтом, як текст.

Є багато різних кодувань символів. Якщо неправильне кодування застосовується до байтів у пам'яті, то в результаті буде незрозумілий текст. Щоб люди могли читати ваш контент, важливо правильно вибрали кодування символів.

Вибір кодування

Кожен розробник контенту, будь то автор або програміст, повинен вирішити яке кодування символів він буде використовувати. На сьогоднішній день рекомендують використовувати кодування UTF-8 , але все ще можуть бути речі, які ви повинні розглянути перед її використанням.

Дізнайтесь більше...

Автори HTML і CSS
Вибір кодування

Розробники специфікацій
Вибір кодування

Установки сервера
Вибір кодування


Призначення і примінненя кодування символів

Як тільки було вирішено, яке кодування використовувати, розробники контенту і програмісти повинні переконатися, що воно правильно призначене.

В XHTML, призначити кодування не просто; потрібно розуміти 'стандартний' режим в порівнянні з режимом 'сумісності' , і вплив XML призначення.

Ви також повинні переконатися, що ваші дані зберігаються в кодуванні, яке ви вибрали, не досить тільки назвати його.

Розробникам контенту та веб-майстрам необхідно буде переконатися, що сервер передає контент з правильним кодуванням символів , бо налаштування сервера можуть відкидати призначення записані у вашому документі.

Екрановані символи

Екрановані символи - використовуються для відображення символів, використовуючи тільки текст ASCII. Вони є засобом відображення символів, які не доступні в кодуванні, що ви використовуєте, допомагають уникнути використання символів з інших причин (наприклад, коли вони можуть конфліктувати з синтаксисом). Ви повинні зрозуміти, коли і як слід використовувати ці екрановані символи.


Веб адреси

На сьогоднішній день веб адреси можуть містити non-ASCII символи. Користувач робить трохи інше, ніж натискає на відповідному посиланні або вводить текст, так як він його бачить, важку роботу виконує клієнтський додаток (пошуковий робот), але вас може зацікавити, як це працює.

Розробники специфікацій повинні проектувати їх так, щоб можна було використовувати non-ASCII символи у веб адресах.


Автор: Richard Ishida, W3C. Перекладач: Alexandr, Art life.

Допустимий XHTML 1.0!
Допустимий CSS!
Кодування UTF-8!

Переклад Англійського контенту від 2011-02-22. Переклад останнього оновлення 2011-02-22 23:50 GMT

Для перегляду історії внесення змін до перекладу натисність gs-characters в блоге i18n.