Accesskey n springt zur Seitennavigation. Springe zum Inhalt.
Dieses Dokument ist eine Übersetzung. Im Falle von Abweichungen oder Fehlern sollte das aktuelle englische Original als maßgeblich angenommen werden. Das W3C besitzt das Copyright am Original, wie unten beschrieben.
Übersetzer: Gunnar Bittersmann
Zielgruppe: XHTML/HTML-Autoren (die Web-Editoren/Texteditoren oder Scripte benutzen), Script-Entwickler (PHP, JSP u.a.) und alle, die sich fragen, warum sie Sprachattribute in HTML verwenden sollten
Hinweis: Das englische Original wurde aktualisiert. Für Änderungen siehe Blog.
Warum sollte man Sprachattribute auf Webseiten verwenden?
Es gibt Applikationen, die die Information über die natürliche Sprache des Inhalts dazu benutzen, dem Nutzer die für ihn relevantesten Informationen je nach seinen bevorzugten Sprachen zu liefern. Je mehr Inhalte mit Sprachinformation gekennzeichnet sind – und zwar mit den richtigen! – desto nützlicher und verbreiteter können solche Applikationen werden.
HTML, XHTML und XML unterscheiden sich darin, wie das Sprachattribut angegeben wird. Siehe Tutorial Sprachangaben in XHTML und HTML.
Übrigens darf man Sprachinformation und Zeichencodierung nicht verwechseln; das sind verschiedene Dinge.
Sprachangaben geben die „natürliche Sprache“ des Inhalts von Webseiten an. Eine Sprachangabe sollte immer verwendet werden, um die Sprache einer Webseite als Ganzes anzugeben. Wenn die Sprache innerhalb des Container-Elements der Seite wechselt, sollte dies in einem Unterelement (span, div, td, p etc.) angezeigt werden.
Information über die Sprache des Inhalts kann für viele Applikationen hilfreich sein. Einige von ihnen arbeiten auf der Ebene des Dokuments als Ganzes, andere bearbeiten entsprechend gekennzeichnete Dokumentfragmente. Es folgt eine Liste möglicher Applikationen für Sprachinformation:
Autorenwerkzeuge können anhand der Sprachangabe für einen Textabschnitt die passende Rechtschreib- und Grammatikprüfung anwenden.
Übersetzungswerkzeuge können die Sprachangabe verwenden, um Textabschnitte in einer bestimmten Sprache zu erkennen.
Die Angabe der Sprache hilft bei Sprachsynthese und Übertragung in Braille-Schrift; sie wird von der W3C Web Accessibility Initiative (WAI) verlangt und in einigen Ländern als Richtlinie umgesetzt, bspw. in Großbritannien mit dem Disability Discrimination Act (UK). Anmerkung des Übersetzers: in Deutschland mit der Verordnung zur Schaffung barrierefreier Informationstechnik nach dem Behindertengleichstellungsgesetz (BITV).
Browser können die Sprache des Inhalts dazu verwenden (und tun das auch), eine zur Sprache passende Schriftart auszuwählen, wodurch ein besseres Nutzungserlebnis der Webseite erzielt wird.
CSS 2 verwendet Sprachinformation als Pseudoklasse. Man kann bspw. abhängig von der Sprache verschiedene Schriftgrößen verwenden:
<style type="text/css">
:lang(ar) {
font-family: Traditional Arabic, serif;
font-size: 125%;
}
:lang(fr) {
font-family: Arial, sans-serif;
font-size: 100%;
}
</style>
Suchmaschinen können Suchergebnisse anhand der vom Nutzer bevorzugten Sprachen gruppieren oder filtern.
Es ist auch üblich, in meta-Elementen Schlüsselwörter anzugeben, die eine Suchmaschine auswerten kann, um die Qualität der Suchergebnisse zu erhöhen. Wenn einzelne meta-Elemente sprachspezifische Informationen über ein Dokument liefern, können Suchmaschinen diese nach dazugehörigen Sprachattributen filtern und den vom Nutzer bevorzugten Sprachen entsprechende Suchergebnisse anzeigen.
Man selbst oder andere könnten XSL oder Scripte einsetzen, um den Text des Dokuments zu verarbeiten. Bei der Verarbeitung der Datei kann man Sprachinformation verwenden, um bestimmten Text zu extrahieren oder zu identifizieren oder um der jeweiligen Sprache entsprechende Ausgaben (bspw. Sortierung oder Kennzeichnung von Zitaten), Styling usw. zu erzielen. Bei der Erstellung von Informationen sollte man bedenken, dass man nicht immer weiß, wie andere diese Informationen später verarbeiten.
Man könnte annehmen, dass die Information über die natürliche Sprache aus der Zeichencodierung gewonnen werden könnte. Die Zeichencodierung erlaubt jedoch keine eindeutige Identifikation der natürlichen Sprache; es müsste eine 1:1-Beziehung zwischen Zeichencodierung und Sprache geben, damit das möglich wäre – und eine solche gibt es nicht. Eine Zeichencodierung kann für viele Sprachen verwendet werden: In ISO 8859-1 (Latin-1) bspw. kann man sowohl Französisch als auch Englisch als auch viele weitere Sprachen codieren. Es können aber auch verschiedene Zeichencodierungen für eine Sprache verwendet werden: Arabisch bspw. kann man in Windows-1256 oder ISO 8859-6 oder UTF-8 (oder einer anderen Unicode-Codierung) codieren.
Sagen Sie uns, was Sie denken (auf Englisch).
Abonnieren Sie unseren RSS-Feed.
Twitter (News auf der Startseite)
Übersetzung der englischen Version vom 2005-08-23. Letzte Änderung der übersetzten Version am 2011-05-27 7:59 GMT
Suchen Sie nach qa-lang-why im i18n-Blog, um alle Dokumentänderungen nachzuvollziehen.
Copyright © 2004-2011 W3C® (MIT, ERCIM, Keio), All Rights Reserved. W3C liability, trademark, document use and software licensing rules apply. Your interactions with this site are in accordance with our public and Member privacy statements.