Ускоряющая клавиша n предназначена для пропусков при навигации по страницам. Пропуск для перехода на начало контента.

Данный документ является переводом. В случае каких-либо несоответствий и ошибок последняя версия документа на английском языке должна рассматриваться в качестве официальной. Первоначальное авторское право принадлежит W3C, как то указано ниже.

Переводчик: Alexandr, Art life

s_gotoW3cHome Internationalization
 

Представление наборов символов и кодировки

Предполагаемая аудитория: те, кто только познакомился с интернационализацией и нуждается в руководстве по темам для рассмотрения, и хочет понять материал на сайте.

Эта страница ориентирует новичков в веб интернационализации, которые действительно не знают с чего начать. Цель - облегчить понимание некоторых материалов на сайте.

С помощью ссылок справа вы можете найти подборку более подробных статей. После того как вы ознакомитесь с этой страницей, вы, вероятно, просто используете тематический перечень, технический перечень, или поиск на сайте.

Что это такое?

Узнайте больше...

Кодировка для начинающих объясняет некоторые основные понятия о кодировке, и зачем вам это нужно.

Основные определения, связанные с кодировками объясняет такие термины, как Unicode, наборы символов, кодировка наборов символов, кодировка символов, набор символов документа, и экранированные символы.

Набор символов - набор букв и символов, используемых для письма. Например, набор символов ASCII охватывает буквы и символы для англоязычного текста, ISO-8859-6 охватывает буквы и символы, необходимые для многих языков, основанные на арабском скрипте, и набор символов Unicode содержит символы для большинства существующих языков и скриптов мира.

Символы в наборе символов хранятся в виде одного или нескольких байтов на компьютере. Каждый байт или последовательность байтов представляет обусловленный символ. Кодування символів розподіляє окремий байт або послідовність байтів в окремі символи, які відображаються шрифтом, як текст.

Есть много разных кодировок символов. Если неправильная кодировка применяется к байтам в памяти, то в результате будет непонятен текст. Чтобы люди могли читать ваш контент, важно правильно выбрали кодировку.

Выбор кодировки

Каждый разработчик контента, будь то автор или программист, должен решить какую кодировку символов он будет использовать. На сегодняшний день рекомендуют использовать кодировку UTF-8 , но все еще могут быть вещи, которые вы должны рассмотреть перед ее использованием.

Узнайте больше...

Авторы HTML и CSS
Выбор кодировки

Разработчики спецификаций
Выбор кодировки

Установки сервера
Выбор кодировки


Назначение и приминненя кодировки символов

Как только было решено, какую кодировку использовать, разработчики контента и программисты должны убедиться, что она правильно назначена.

В XHTML, назначить кодирования не просто; нужно понимать 'стандартный' режим по сравнению с режимом 'совместимости' , и влияние XML назначения.

Вы также должны убедиться, что ваши данные хранятся в кодировке, которую вы выбрали, не достаточно только назвать ее.

Разработчикам контента и веб-мастерам необходимо будет убедиться, что сервер передает контент с правильной кодировкой символов , ибо настройки сервера могут отвергать назначения записаные в вашем документе.

Экранированные символы

Экранированные символы - используются для отображения символов, используя только текст ASCII. Они являются средством отображения символов, которые не доступны в кодировке, что вы используете, помогают избежать использования символов по другим причинам (например, когда они могут конфликтовать с синтаксисом). Вы должны понять, когда и как следует использовать эти экранированные символы.


Веб адреса

На сегодняшний день веб адреса могут содержать non-ASCII символы. Пользователь делает немного другое, чем нажимает на соответствующей ссылке или вводит текст, так как он его видит, тяжелую работу выполняет клиентское приложение (поисковый робот), но вас может заинтересовать, как это работает.

Разработчики спецификаций должны проектировать их так, чтобы можно было использовать non-ASCII символов в веб адресах.


Автор: Richard Ishida, W3C. Переводчик: Alexandr, Art life.

Допустимый XHTML 1.0!
Допустимый CSS!
Кодировка UTF-8!

Перевод с английского: 2011-02-22. Последнее внесение изменений в перевод: 2011-02-22 23:50 GMT

Для просмотра истории внесения изменений нажмите gs-characters в блоге i18n.