Diese Seite gibt Anfängern auf dem Gebiet Internationalisierung im Web einen Anhaltspunkt, wo sie beginnen können, und führt sie zu einigen Artikeln auf dieser Website.
You can find a selection of more detailed articles using the links to the right. Once you get some ideas from this page, you will probably just use Learn to internationalize, or the site search.
HTML- und XML-basierte Formate erlauben es, die natürliche Sprache (d.h. menschliche Sprache, nicht Computersprache) eines Dokuments bzw. eines Textbereiches anzugeben, damit Tools und Applikationen anhand dieser Information sprachspezifische Aufgaben ausführen können. Darunter fallen die Verwendung passender Schriftarten und anderer Stile, die Umschaltung der Stimme bei Sprachausgabe, Rechtschreibprüfung usw.
Je mehr Inhalte mit Sprachinformation gekennzeichnet sind – und zwar mit den richtigen! – desto nützlicher und verbreiteter können solche Applikationen werden.
Anhand der Sprachinformation, die ein Browser oder Nutzerprogramm angibt, kann auch gewährleistet werden, dass Nutzer Daten in ihrer bevorzugten Sprache erhalten, wenn eine Auswahl vorhanden ist.
Weitere Informationen...
Warum die Sprache angeben? behandelt etwas genauer, warum Autoren und Entwickler die Sprachinformation angeben sollten.
Autoren von Inhalten sollten wissen, wie die Sprache eines Dokuments bzw. eines Textbereiches in der jeweils verwendeten Webtechnologie anzugeben ist. Die meisten XML-basierten Formate wie XHTML, SVG, SSML usw. verwenden das xml:lang-Attribut, das in der XML-Spezifikation definiert ist. Es gibt aber auch anderes Markup, wie das lang-Attribut in HTML.
Autoren von Inhalten sollten beachten, ob zwischen der Sprachangabe eines Dokuments bzw. eines Textbereiches (damit Tools diese verarbeiten können) und der Sprachangabe der Zielgruppe der Ressource (Metadaten) unterschieden werden muss. In XHTML bspw. wird beides unterschiedlich angegeben. Auch dürfen Angeben der natürlichen Sprache nicht mit der Angabe der Scriptsprache oder mit der Angabe der Zeichencodierung durcheinander gebracht werden.
Autoren von Inhalten und Webmaster sollten weiterhin wissen, wie Sprachangaben standardmäßig erfolgen. Der gegenwärtige Standard für W3C-Spezifikationen sind die in BCP 47 festgeschriebenen Regeln. Diese ersetzen frühere Spezifikationen wie RFC 3066 und RFC 1766 und gehen über die ISO-Sprachkürzelstandards und ISO-Landeskürzelstandards hinaus. Sprachkürzel sollten im IANA-Register für Sprachkürzel nachgeschlagen werden, nicht mehr in den ISO-Spezifikationen.
Webmaster und Serveradministratoren sollten auch wissen, wie der Server so einzurichten ist, dass er Sprachinformation zu angeforderten Ressourcen per HTTP mitschickt. Das ist üblicherweise Teil der Sprachvereinbarung (language negotiation), wodurch der Server eine von mehreren alternativen Versionen eines Dokuments ausliefert – je nach Einstellung im Browser des Nutzers.
für HTML- und CSS-Autoren:
Sprachangaben mit Attributen
Metadaten über die Sprache des Zielpublikums
Sprachangaben in Dokumenten für mehrsprachige Nutzer
für SVG-Autoren:
Angabe der Sprache des Inhalts
für XML-Autoren:
Angabe der Sprache des Inhalts
zur Server-Konfiguration:
Einrichtung von MultiViews-Sprachvereinbarung auf Apache
Einrichtung von PHP-basierter Sprachvereinbarung
Wenn ein Nutzerprogramm einen HTTP-Request an einen Webserver sendet, schickt es üblicherweise auch die Information über die bevorzugten Sprachen mit. Der Server kann diese Information dazu verwenden, eine Version des Dokuments in einer passenden Sprache auszuliefern, sofern eine solche Version verfügbar ist.
Webmaster sollten wissen, wie ein Server einzurichten ist, dass er Sprachvereinbarung (language negotiation) durchführen kann.
Webdesigner und Webentwickler sollten wissen, wie man Nutzer auf mehrsprachigen Websites zu den richtigen Ressourcen führt.
zu Nutzereinstellungen:
Einstellung der bevorzugten Sprachen im Browser
für HTML- und CSS-Autoren:
Navigation: Erste Schritte
Verlinkung von lokalisierten Inhalten
Verwendung von Inhaltsvereinbarung (content negotiation)
In den meisten Browsern lassen sich CSS-Selektoren einsetzen, um im Stylesheet Formatierungen anhand der Sprache des betreffendes Textes anzugeben. Bspw. kann man einem in ein englisches Dokument eingebetteten Text in Thai eine bestimmte Schriftart und eine passende Zeilenhöhe zuweisen – einfach dadurch, dass der Text als Thai gekennzeichnet ist.
Stylesheet-Entwickler können Selektoren und die content
-Eigenschaft einsetzen (wenn sie unterstützt wird), um automatisch die Sprache eines Linkziels anzugeben.
zu Nutzereinstellungen:
Einstellung der bevorzugten Sprachen im Browser
für HTML- und CSS-Autoren:
Styling abhängig von der Sprache
Anzeige der Sprache eines Linkziels
Entwickler von Schemas und Spezifikationen sollten berücksichtigen, dass das von ihnen entwickelte Format Markup bereithält, das es Autoren ermöglicht, die Hauptsprache des Dokuments sowie Änderungen der Sprache innerhalb des Dokuments anzugeben.
Entwickler von Schemas und Spezifikationen sollten sich auch im Klaren darüber sein, wann es angebracht ist, xml:lang
in XML-basierten Formaten zu verwenden, und wann sie ein anderes Attribut oder Element zur Angabe der Sprache entwerfen sollten.
für Schema-Entwickler:
Entwurf von Markup zur Angabe der natürlichen Sprache