Pourquoi utiliser l'attribut du langage ?

Question

Pourquoi dois-je utiliser l'attribut du langage dans les pages Web ?

L'attribut lang (parfois xml:lang) précise la langue d'origine d'une page Web. Un attribut sur l'étiquette html détermine le langage pour l'ensemble du texte sur la page. Si du texte utilise un langage différent dans une partie de la page, vous pouvez ajouter un attribut du langage comportant une valeur différente à l'élément qui entoure ce contenu. Vous trouverez de l'information sur la façon d'utiliser les attributs du langage à Déclarer le langage en HTML.

Réponse courte

Identifier le langage de votre contenu vous permet d'effectuer plusieurs tâches automatiquement, du changement de l'apparence de votre page à l'extraction d'informations ou à la modification du fonctionnement d'une application. Certaines applications de langage fonctionnent sur l'ensemble du document, d'autres sur des parties du document convenablement étiquetées.

Il est préférable d'ajouter l'information du langage à votre contenu dès maintenant afin de profiter de nouvelles applications futures. Il est facile de le faire lorsque vous créez du contenu, mais plus difficile une fois celui-ci créé.

Details

Voici différents aperçus illustrant l'utilité actuelle des informations relatives au langage. Cependant, les spécifications et les navigateurs étant amenés à évoluer, il pourra exister de nombreuses applications supplémentaires conçues pour l'information du langage.

Paramétrer le style des pages

Les attributs du langage vous permettent de diversifier le style du contenu pour chaque langue. Pour obtenir des informations complémentaires sur ce procédé, consultez Paramétrer le style avec l’attribut du langage.

Par exemple, les polices ou l'interligne peuvent devoir être modifiés pour tenir compte de différents alphabets, des langues peuvent exiger des types de guillemets différents, l'accentuation peut varier selon la langue, etc.

L'exemple suivant montre comment paramétrer dans une page une police particulière pour un texte en police Arabic.

body {
    font-family: "Palatino Linotype", "Book Antiqua", Palatino, serif;
    }
:lang(ar) {
    font-family: "Traditional Arabic", "Al Bayan", serif;}

La césure est un autre exemple du comportement du langage. Les règles relatives à la césure sont étroitement liées à la langue. Le lien description des propriétés de la hyphens dans CSS (qui est en train d'être pris en charge par les navigateurs au moment de la rédaction du présent article) indique que « insérer automatiquement la césure appropriée exige de posséder une ressource adaptée à la langue du texte cible. Par conséquent, l’agent d’utilisateur (UA) doit seulement insérer automatiquement une césure dans le texte pour lequel l'auteur a signalé une langue (par exemple HTML lang or XML xml:lang) et pour lequel il possède une ressource adaptée pour la césure. »

D'autres caractéristiques typographiques et d'affichage qui sont touchées par la langue regroupent le saut à la ligne, la justification et le problème de conversion. De nouvelles caractéristiques vont voir le jour à mesure que les spécifications apparaissent.

Sélection de la police

Les utilisateurs peuvent utiliser et utilisent d'ailleurs l'information du langage pour choisir les polices adaptées à la langue, ce qui améliore l'expérience globale de l'utilisateur de la page.

Par exemple, dans une page encodée en Unicode, un texte en chinois simplifié, en chinois traditionnel, en japonais et en coréen peut utiliser le même codage pour un idéogramme. Cependant, les locuteurs de ces langues s'attendent à ce que les caractères utilisés représentent parfaitement leur propre langue. En l'absence d'un style défini que l'auteur du contenu applique, certains navigateurs attribuent automatiquement les polices adaptées selon la langue du contenu. L'illustration ci-dessous montre le résultat sur un texte lorsque seule la valeur de l'attribut du langage est modifiée dans un navigateur comme Firefox or Internet Explorer.

Recherche

Même si la détection automatique de la langue est utilisée par la plupart des moteurs de recherche pour identifier la langue des ressources, le balisage interne de la page peut être utilisé pour améliorer la qualité de la recherche des résultats basés sur les préférences linguistiques de l'utilisateur.

Vérificateurs d'orthographe et de grammaire

Les outils de création peuvent appliquer le vérificateur d'orthographe et de grammaire en fonction du contenu de la langue, ou ignorer le contenu qui n'est pas dans la langue du vérificateur d'orthographe. Ainsi, le rendement est considérablement amélioré lors de la vérification orthographique.

Récemment, les navigateurs commencent à autoriser les utilisateurs à vérifier l'orthographe du texte qu'ils saisissent dans des formes ou éléments pour lesquels l'attribut contenteditable est installé. Un navigateur qui prend en compte les informations de la langue du contenu peut améliorer l'expérience de l'utilisateur.

Traduction

Les outils de traduction peuvent utiliser les attributs du langage pour reconnaître des pages ou des parties de texte dans une langue spécifique. Ils peuvent aussi adapter automatiquement le traitement des données ou éviter que le traducteur ne modifie le texte contenu dans les outils de traduction.

Outils d'assistance pour personnes ayant des problèmes de vue

L'information du langage permet aux synthétiseurs de la parole et aux traducteurs de Braille d'obtenir des résultats exploitables. Ces applications doivent être programmées pour extraire des éléments du texte ou pour adopter un mode de langage différent.

L'étiquetage du langage est recommandé par les Directives d’accessibilité Web de W3C et est appliqué légalement dans certains pays, par exemple au Royaume-Uni (Loi sur la discrimination des personnes handicapées).

Analyseurs syntaxiques et script

L'étiquetage du contenu avec l'information de la langue permet aussi le traitement d'une langue particulière.

Par exemple, un script ou une feuille en format XSLT peut être utilisée pour réaliser différentes tâches :

N'oubliez pas que lorsque vous créez l'information, vous ne savez pas toujours comment les utilisateurs voudront la traiter ultérieurement.

En passant

L'utilité de l'étiquetage du langage est devenue évidente au cours des dernières années à mesure que les technologies ont évolué, évolution qui se poursuivra dans le futur. Dans bien des cas, ces applications peuvent ne pas être importantes à vos yeux lorsque vous créez votre contenu pour la première fois. Vous les apprécierez avec le temps. Cependant, c'est un cercle vicieux. Les personnes qui n'utilisent pas les applications de l'information du langage ne fournissent pas d'information sur la langue de contenu. Les applications liées au langage s'utilisent encore peu pour que l'information ne soit largement appliquée aux contenus. Cette situation peut être renversée par les auteurs de contenu lorsqu'ils assurent que l'information sur la langue est inéluctable. Plus il y a de contenu étiqueté convenablement, plus des applications utiles et convaincantes comme celles-ci seront appréciées. Il est en général facile d'ajouter de l'information sur la langue.