Présentation des jeux et encodages de caractères

Public visé : tous ceux qui découvrent l’internationalisation et ont besoin de conseils sur des thèmes à envisager et des façons de se familiariser avec le contenu sur le site.

Cette page offre quelques informations de base aux nouveaux venus dans le domaine de l’internationalisation Web qui ne savent pas vraiment par où commencer. Le but est de vous offrir une introduction simple à quelques contenus présents sur le site.

Vous pouvez découvrir une sélection d’articles plus détaillés en utilisant les liens à droite. Une fois que vous aurez obtenu quelques idées sur cette page, vous utiliserez probablement l’index des sujets, the l’index des techniques, ou l’outil de recherche du site.

De quoi s’agit-il ?

En savoir plus…

Les encodages de caractères pour les débutants explique quelques concepts de base sur les encodages de caractères et pourquoi vous devriez vous en soucier.

Les encodages de caractères: concepts essentiels fournit des explications sur la terminologie, comme Unicode, jeux de caractères, jeux de caractères codés, encodages de caractères, jeu de caractères du document, et caractères d’échappement.

Un jeu de caractères est un ensemble de lettres et de symboles utilisés dans un système d’écriture. Par exemple, le jeu de caractères ASCII inclut les lettres et symboles des textes en anglais, l’ISO-8859-6 inclut les lettres et symboles nécessaires à de nombreuses langues basées sur l’écriture arabe, et le jeu de caractères Unicode contient les caractères utilisés dans la plupart des langues vivantes et écritures du monde.

Les caractères d’un jeu de caractères sont stockés sous la forme d’un ou plusieurs octets sur un ordinateur. Chaque octet ou séquence d’octets représente un caractère particulier. L’encodage d’un caractère est la clé qui associe un octet ou une séquence d’octets aux caractères particuliers que la police de caractères retranscrit sous forme de texte.

Il existe de nombreux encodages de caractères différents. Si le mauvais encodage est appliqué aux octets en mémoire, ceci rendra le texte incompréhensible. C’est pourquoi il est important que vous marquiez l’encodage de caractères utilisé correctement pour que des personnes puissent lire votre contenu.

Choisir un encodage

Tous ceux qui développent du contenu, qu’ils soient des auteurs de contenus ou des programmeurs, devraient utiliser l’encodage de caractères UTF-8, sauf s’il existe des raisons très spéciales pour utiliser autre chose. (Si vous décidez de ne pas utiliser UTF-8, vous devrez choisir l’un des quelques encodages interopérables mis en place sur tous les navigateurs.)

En savoir plus…

Auteurs HTML & CSS

Développeurs de spécifications

Configuration du serveur

Déclarer et appliquer un encodage

Les développeurs et programmeurs de contenu doivent s’assurer que l’encodage de caractères utilisé pour un document ou une page soit déclaré de la bonne manière.

Vous devez également vérifier que vos données sont sauvegardées dans l’encodage que vous avez choisi, il n’est pas suffisant de juste l’étiqueter.

(Veuillez remarquer qu’en XHTML, les déclarations d’encodage ne sont pas toujours très simples ; elles exigent une compréhension des modes « normaux » vs. « subterfuges », et de l’impact de la déclaration XML.)

Les développeurs de contenu et webmestres peuvent également avoir besoin de s’assurer que le serveur fournisse des contenus avec des déclarations d’encodage correctes, étant donné que les paramètres du serveur peuvent être prioritaires sur les déclarations qui figurent sur le document.

Caractères d’échappement

Les caractères d’échappement sont une façon de représenter un caractère en utilisant uniquement du texte ASCII. Ils fournissent un moyen de représenter des caractères qui ne sont pas disponibles dans l’encodage de caractères que vous utilisez, ou un moyen d’éviter l’utilisation de caractères pour d’autres raisons (telles que lorsqu’ils peuvent être en conflit avec la syntaxe). Vous devez avoir une notion précise de quand et comment ces caractères d’échappement doivent être utilisés.

Adresses Web

Les adresses Web peuvent également inclure des caractères non-ASCII. L’utilisateur n’a pas autre chose à faire que de cliquer sur le lien approprié ou de saisir le texte comme il le voit, la plus grosse partie du travail est effectuée par l’agent utilisateur, mais il peut être intéressant de savoir comment ça marche.

Les développeurs de spécifications devraient concevoir leurs spécifications de manière à ce que des adresses Web non-ASCII puissent être utilisées.

En savoir plus…

Auteurs HTML & CSS