Sprachangaben im Web

Diese Seite gibt Anfängern auf dem Gebiet Internationalisierung im Web einen Anhaltspunkt, wo sie beginnen können, und führt sie zu einigen Artikeln auf dieser Website.

You can find a selection of more detailed articles using the links to the right. Once you get some ideas from this page, you will probably just use Learn to internationalize, or the site search.

Worum geht’s?

HTML- und XML-basierte Formate erlauben es, die natürliche Sprache (d.h. menschliche Sprache, nicht Computersprache) eines Dokuments bzw. eines Textbereiches anzugeben, damit Tools und Applikationen anhand dieser Information sprachspezifische Aufgaben ausführen können. Darunter fallen die Verwendung passender Schriftarten und anderer Stile, die Umschaltung der Stimme bei Sprachausgabe, Rechtschreibprüfung usw.

Je mehr Inhalte mit Sprachinformation gekennzeichnet sind – und zwar mit den richtigen! – desto nützlicher und verbreiteter können solche Applikationen werden.

Anhand der Sprachinformation, die ein Browser oder Nutzerprogramm angibt, kann auch gewährleistet werden, dass Nutzer Daten in ihrer bevorzugten Sprache erhalten, wenn eine Auswahl vorhanden ist.

Weitere Informationen...

Warum die Sprache angeben? behandelt etwas genauer, warum Autoren und Entwickler die Sprachinformation angeben sollten.

Die Sprache angeben

Autoren von Inhalten sollten wissen, wie die Sprache eines Dokuments bzw. eines Textbereiches in der jeweils verwendeten Webtechnologie anzugeben ist. Die meisten XML-basierten Formate wie XHTML, SVG, SSML usw. verwenden das xml:lang-Attribut, das in der XML-Spezifikation definiert ist. Es gibt aber auch anderes Markup, wie das lang-Attribut in HTML.

Autoren von Inhalten sollten beachten, ob zwischen der Sprachangabe eines Dokuments bzw. eines Textbereiches (damit Tools diese verarbeiten können) und der Sprachangabe der Zielgruppe der Ressource (Metadaten) unterschieden werden muss. In XHTML bspw. wird beides unterschiedlich angegeben. Auch dürfen Angeben der natürlichen Sprache nicht mit der Angabe der Scriptsprache oder mit der Angabe der Zeichencodierung durcheinander gebracht werden.

Autoren von Inhalten und Webmaster sollten weiterhin wissen, wie Sprachangaben standardmäßig erfolgen. Der gegenwärtige Standard für W3C-Spezifikationen sind die in BCP 47 festgeschriebenen Regeln. Diese ersetzen frühere Spezifikationen wie RFC 3066 und RFC 1766 und gehen über die ISO-Sprachkürzelstandards und ISO-Landeskürzelstandards hinaus. Sprachkürzel sollten im IANA-Register für Sprachkürzel nachgeschlagen werden, nicht mehr in den ISO-Spezifikationen.

Webmaster und Serveradministratoren sollten auch wissen, wie der Server so einzurichten ist, dass er Sprachinformation zu angeforderten Ressourcen per HTTP mitschickt. Das ist üblicherweise Teil der Sprachvereinbarung (language negotiation), wodurch der Server eine von mehreren alternativen Versionen eines Dokuments ausliefert – je nach Einstellung im Browser des Nutzers.

Navigation auf Websites anhand von Sprachinformation

Wenn ein Nutzerprogramm einen HTTP-Request an einen Webserver sendet, schickt es üblicherweise auch die Information über die bevorzugten Sprachen mit. Der Server kann diese Information dazu verwenden, eine Version des Dokuments in einer passenden Sprache auszuliefern, sofern eine solche Version verfügbar ist.

Nutzer sollten wissen, wie sie die Spracheinstellungen ihres Browsers überprüfen und ggfs. ändern können.

Webmaster sollten wissen, wie ein Server einzurichten ist, dass er Sprachvereinbarung (language negotiation) durchführen kann.

Webdesigner und Webentwickler sollten wissen, wie man Nutzer auf mehrsprachigen Websites zu den richtigen Ressourcen führt.

Verwendung von Sprachinformation fürs Styling

In den meisten Browsern lassen sich CSS-Selektoren einsetzen, um im Stylesheet Formatierungen anhand der Sprache des betreffendes Textes anzugeben. Bspw. kann man einem in ein englisches Dokument eingebetteten Text in Thai eine bestimmte Schriftart und eine passende Zeilenhöhe zuweisen – einfach dadurch, dass der Text als Thai gekennzeichnet ist.

Stylesheet-Entwickler können Selektoren und die content-Eigenschaft einsetzen (wenn sie unterstützt wird), um automatisch die Sprache eines Linkziels anzugeben.

Weitere Informationen …

zu Nutzereinstellungen:
Einstellung der bevorzugten Sprachen im Browser

für HTML- und CSS-Autoren:
Styling abhängig von der Sprache
Anzeige der Sprache eines Linkziels

Berücksichtigung von Sprachinformation beim Entwurf von Markup-Formaten

Entwickler von Schemas und Spezifikationen sollten berücksichtigen, dass das von ihnen entwickelte Format Markup bereithält, das es Autoren ermöglicht, die Hauptsprache des Dokuments sowie Änderungen der Sprache innerhalb des Dokuments anzugeben.

Entwickler von Schemas und Spezifikationen sollten sich auch im Klaren darüber sein, wann es angebracht ist, xml:lang in XML-basierten Formaten zu verwenden, und wann sie ein anderes Attribut oder Element zur Angabe der Sprache entwerfen sollten.

Weitere Informationen …

für Schema-Entwickler:
Entwurf von Markup zur Angabe der natürlichen Sprache