Langage sur le Web

Cette page offre quelques informations de base aux nouveaux venus dans le domaine de l’internationalisation Web qui ne savent pas vraiment par où commencer. Le but est de vous offrir une introduction simple à quelques contenus présents sur le site.

You can find a selection of more detailed articles using the links to the right. Once you get some ideas from this page, you will probably just use Learn to internationalize, or the site search.

De quoi s’agit-il ?

Les formats HTML et XML vous permettent de déclarer le langage naturel (c.-à-d. la langue humaine et non un langage de programmation) d’un document ou d’une série de textes afin que les outils et applications puissent utiliser cette information pour les tâches sensibles à la langue. Ceci inclut des choses telles que l’utilisation des bonnes polices d’écriture ou autres styles, le changement de voix dans la synthèse de la parole à partir de texte, la vérification orthographique, etc.

Plus le contenu est balisé et balisé correctement avec des informations de langue, plus de telles applications deviendront utiles et omniprésentes.

Il est également possible d’utiliser les informations de langue fournies par un navigateur ou agent utilisateur pour s’assurer que, lorsqu’un choix existe, les utilisateurs reçoivent des données dans leur langue.

En savoir plus…

Pourquoi utiliser l’attribut « langue » ? décrit en quelques mots pourquoi les auteurs et développeurs de contenu devraient déclarer les informations relatives à la langue.

Déclarer la langue

Les auteurs de contenu ont besoin de savoir comment déclarer la langue d’un document ou d’une série de textes avec la technologie Web qu’ils utilisent. HTML utilise l’attribut lang, mais il peut y avoir d’autres balises. Par exemple, la plupart des formats XML, tels que XHTML, SVG, SSML, etc. utilisent l’attribut xml:lang défini dans les spécifications XML.

Les auteurs de contenu doivent décider s’ils ont besoin de faire une distinction entre la déclaration de la langue d’un document et celle d’une série de textes afin que l’outil puisse le prendre en compte, et la déclaration du public cible d’une ressource (c.-à-d. des métadonnées). Les approches peuvent être légèrement différentes en HTML, par exemple. Il faut aussi éviter de mélanger les déclarations de langue avec les déclarations d’encodage de l’écriture et des caractères.

Les auteurs de contenu et les webmestres doivent aussi savoir comment utiliser les valeurs des langues de manière normalisée. L’approche standard actuelle des spécifications du W3C est d’utiliser les règles formulées dans la norme BCP 47. Ceci remplace les spécifications précédentes telles que les normes RFC 3066 et RFC 1766, et va au-delà des informations disponibles dans les normes ISO concernant les langues et les pays. Vous devriez également utiliser le Registre des sous-balises de langue de l’IANA pour y rechercher des balises de langue, plutôt que les spécifications ISO.

Les webmestres ou personnes qui travaillent avec des paramètres de serveur peuvent également avoir besoin de configurer le serveur afin qu’il envoie des informations HTTP liées à la langue avec les fichiers nécessaires. C’est généralement effectué dans le cadre de la négociation de contenu, où le serveur envoie à l’utilisateur l’une des différentes versions d’un document en fonction des paramètres du navigateur de l’utilisateur.

Naviguer sur des sites utilisant des informations de langue

Lorsqu’une demande HTTP est effectuée vers un serveur, l’agent utilisateur demandeur envoie généralement des informations sur les préférences de langue. Le serveur peut ensuite utiliser ces informations pour renvoyer une version du document dans la langue appropriée si une telle alternative est disponible.

Les utilisateurs finaux doivent savoir comment vérifier si leurs préférences de langue sont correctement configurées et comment les modifier, le cas échéant.

Les webmestres doivent savoir comment configurer leur serveur afin de gérer la négociation de contenus basés sur la langue.

Les concepteurs et développeurs Web faisant face à des sites multilingues doivent déterminer comment guider les visiteurs vers les bonnes ressources.

Utiliser les informations de langue pour le style

Sur la plupart des navigateurs, vous pouvez utiliser des sélecteurs CSS pour appliquer différents styles selon la langue d’une partie de texte. Par exemple, dans un document en anglais, vous pouvez affecter une police de caractères particulière à un texte intégré en thaï et des hauteurs de lignes appropriées partout où il apparaît, simplement parce que le contenu est marqué comme étant du thaï.

Dans les CSS, les développeurs de feuilles de style peuvent utiliser des sélecteurs avec la propriété content, lorsqu’elle est prise en charge, afin d’indiquer automatiquement la langue de la cible d’un lien.

Concevoir des informations relatives à la langue dans des formats de balises

Les développeurs de schémas ou de spécifications doivent envisager si le format qu’ils développent doit inclure des balises pour permettre aux auteurs d’identifier la langue principale du document et tout changement de langue au sein du document.

Les développeurs de schémas ou de spécifications doivent également savoir avec certitude quand il est opportun d’utiliser xml:lang dans les formats XML, et quand il vaut mieux créer un attribut ou un élément différent afin de spécifier les informations relatives à la langue.

En savoir plus…

Développeurs de schémas