Представление наборов символов и кодировки

Эта страница ориентирует новичков в веб интернационализации, которые действительно не знают с чего начать. Цель - облегчить понимание некоторых материалов на сайте.

You can find a selection of more detailed articles using the links to the right. Once you get some ideas from this page, you will probably just use Learn to internationalize, or the site search.

Что это такое?

Набор символов - набор букв и символов, используемых для письма. Например, набор символов ASCII охватывает буквы и символы для англоязычного текста, ISO-8859-6 охватывает буквы и символы, необходимые для многих языков, основанные на арабском скрипте, и набор символов Unicode содержит символы для большинства существующих языков и скриптов мира.

Символы в наборе символов хранятся в виде одного или нескольких байтов на компьютере. Каждый байт или последовательность байтов представляет обусловленный символ. Кодування символів розподіляє окремий байт або послідовність байтів в окремі символи, які відображаються шрифтом, як текст.

Есть много разных кодировок символов. Если неправильная кодировка применяется к байтам в памяти, то в результате будет непонятен текст. Чтобы люди могли читать ваш контент, важно правильно выбрали кодировку.

Узнайте больше...

Кодировка для начинающих объясняет некоторые основные понятия о кодировке, и зачем вам это нужно.

Основные определения, связанные с кодировками объясняет такие термины, как Unicode, наборы символов, кодировка наборов символов, кодировка символов, набор символов документа, и экранированные символы.

Выбор кодировки

Каждый разработчик контента, будь то автор или программист, должен решить какую кодировку символов он будет использовать. На сегодняшний день рекомендуют использовать кодировку UTF-8 , но все еще могут быть вещи, которые вы должны рассмотреть перед ее использованием.

 

 

Узнайте больше...

Авторы HTML и CSS

Разработчики спецификаций

Установки сервера

Назначение и приминненя кодировки символов

Как только было решено, какую кодировку использовать, разработчики контента и программисты должны убедиться, что она правильно назначена.

В XHTML, назначить кодирования не просто; нужно понимать 'стандартный' режим по сравнению с режимом 'совместимости' , и влияние XML назначения.

Вы также должны убедиться, что ваши данные хранятся в кодировке, которую вы выбрали, не достаточно только назвать ее.

Разработчикам контента и веб-мастерам необходимо будет убедиться, что сервер передает контент с правильной кодировкой символов , ибо настройки сервера могут отвергать назначения записаные в вашем документе.

Экранированные символы

Экранированные символы - используются для отображения символов, используя только текст ASCII. Они являются средством отображения символов, которые не доступны в кодировке, что вы используете, помогают избежать использования символов по другим причинам (например, когда они могут конфликтовать с синтаксисом). Вы должны понять, когда и как следует использовать эти экранированные символы.

 

 

 

 

Веб адреса

На сегодняшний день веб адреса могут содержать non-ASCII символы. Пользователь делает немного другое, чем нажимает на соответствующей ссылке или вводит текст, так как он его видит, тяжелую работу выполняет клиентское приложение (поисковый робот), но вас может заинтересовать, как это работает.

Разработчики спецификаций должны проектировать их так, чтобы можно было использовать non-ASCII символов в веб адресах.

Узнайте больше...

Авторы HTML и CSS