Pourquoi dois-je utiliser l'attribut du langage dans les pages Web ?
L'attribut lang
(parfois xml:lang
) précise la langue d'origine d'une page Web. Un attribut sur l'étiquette html
détermine le langage pour l'ensemble du texte sur la page. Si du texte utilise un langage différent dans une partie de la page, vous pouvez ajouter un attribut du langage comportant une valeur différente à l'élément qui entoure ce contenu. Vous trouverez de l'information sur la façon d'utiliser les attributs du langage à Déclarer le langage en HTML.
Identifier le langage de votre contenu vous permet d'effectuer plusieurs tâches automatiquement, du changement de l'apparence de votre page à l'extraction d'informations ou à la modification du fonctionnement d'une application. Certaines applications de langage fonctionnent sur l'ensemble du document, d'autres sur des parties du document convenablement étiquetées.
Il est préférable d'ajouter l'information du langage à votre contenu dès maintenant afin de profiter de nouvelles applications futures. Il est facile de le faire lorsque vous créez du contenu, mais plus difficile une fois celui-ci créé.
Voici différents aperçus illustrant l'utilité actuelle des informations relatives au langage. Cependant, les spécifications et les navigateurs étant amenés à évoluer, il pourra exister de nombreuses applications supplémentaires conçues pour l'information du langage.
Les attributs du langage vous permettent de diversifier le style du contenu pour chaque langue. Pour obtenir des informations complémentaires sur ce procédé, consultez Paramétrer le style avec l’attribut du langage.
Par exemple, les polices ou l'interligne peuvent devoir être modifiés pour tenir compte de différents alphabets, des langues peuvent exiger des types de guillemets différents, l'accentuation peut varier selon la langue, etc.
L'exemple suivant montre comment paramétrer dans une page une police particulière pour un texte en police Arabic.
La césure est un autre exemple du comportement du langage. Les règles relatives à la césure sont étroitement liées à la langue. Le lien description des propriétés de la hyphens
dans CSS (qui est en train d'être pris en charge par les navigateurs au moment de la rédaction du présent article) indique que « insérer automatiquement la césure appropriée exige de posséder une ressource adaptée à la langue du texte cible. Par conséquent, l’agent d’utilisateur (UA) doit seulement insérer automatiquement une césure dans le texte pour lequel l'auteur a signalé une langue (par exemple HTML lang
or XML xml:lang
) et pour lequel il possède une ressource adaptée pour la césure. »
D'autres caractéristiques typographiques et d'affichage qui sont touchées par la langue regroupent le saut à la ligne, la justification et le problème de conversion. De nouvelles caractéristiques vont voir le jour à mesure que les spécifications apparaissent.
Les utilisateurs peuvent utiliser et utilisent d'ailleurs l'information du langage pour choisir les polices adaptées à la langue, ce qui améliore l'expérience globale de l'utilisateur de la page.
Par exemple, dans une page encodée en Unicode, un texte en chinois simplifié, en chinois traditionnel, en japonais et en coréen peut utiliser le même codage pour un idéogramme. Cependant, les locuteurs de ces langues s'attendent à ce que les caractères utilisés représentent parfaitement leur propre langue. En l'absence d'un style défini que l'auteur du contenu applique, certains navigateurs attribuent automatiquement les polices adaptées selon la langue du contenu. L'illustration ci-dessous montre le résultat sur un texte lorsque seule la valeur de l'attribut du langage est modifiée dans un navigateur comme Firefox or Internet Explorer.
Même si la détection automatique de la langue est utilisée par la plupart des moteurs de recherche pour identifier la langue des ressources, le balisage interne de la page peut être utilisé pour améliorer la qualité de la recherche des résultats basés sur les préférences linguistiques de l'utilisateur.
Les outils de traduction peuvent utiliser les attributs du langage pour reconnaître des pages ou des parties de texte dans une langue spécifique. Ils peuvent aussi adapter automatiquement le traitement des données ou éviter que le traducteur ne modifie le texte contenu dans les outils de traduction.
L'information du langage permet aux synthétiseurs de la parole et aux traducteurs de Braille d'obtenir des résultats exploitables. Ces applications doivent être programmées pour extraire des éléments du texte ou pour adopter un mode de langage différent.
L'étiquetage du langage est recommandé par les Directives d’accessibilité Web de W3C et est appliqué légalement dans certains pays, par exemple au Royaume-Uni (Loi sur la discrimination des personnes handicapées).
L'étiquetage du contenu avec l'information de la langue permet aussi le traitement d'une langue particulière.
Par exemple, un script ou une feuille en format XSLT peut être utilisée pour réaliser différentes tâches :
N'oubliez pas que lorsque vous créez l'information, vous ne savez pas toujours comment les utilisateurs voudront la traiter ultérieurement.
L'utilité de l'étiquetage du langage est devenue évidente au cours des dernières années à mesure que les technologies ont évolué, évolution qui se poursuivra dans le futur. Dans bien des cas, ces applications peuvent ne pas être importantes à vos yeux lorsque vous créez votre contenu pour la première fois. Vous les apprécierez avec le temps. Cependant, c'est un cercle vicieux. Les personnes qui n'utilisent pas les applications de l'information du langage ne fournissent pas d'information sur la langue de contenu. Les applications liées au langage s'utilisent encore peu pour que l'information ne soit largement appliquée aux contenus. Cette situation peut être renversée par les auteurs de contenu lorsqu'ils assurent que l'information sur la langue est inéluctable. Plus il y a de contenu étiqueté convenablement, plus des applications utiles et convaincantes comme celles-ci seront appréciées. Il est en général facile d'ajouter de l'information sur la langue.
Prêts à commencer ? Langage sur le Web
Tutoriel, Travailler avec le langage en HTML
Liens utiles, création HTML et CSS