Frage: Wie kann ich die Information über die Zeichencodierung prüfen, die im HTTP-Header eines Webdokuments gesendet wird?
Es ist wichtig, die Zeichencodierung (charset) eines übers Web ausgelieferten Dokuments anzugeben. Andernfalls kann der Empfänger das Dokument nicht richtig interpretierten. Ein Webbrowser würde bspw. irgendwelche Zeichen anzeigen anstatt lesbaren Text. EIne Möglichkeit, die Zeichencodierung eines Webdokuments anzugeben, ist es, diese Information in den charset
-Parameter des Content-Type
-Headers zu tun.
Hier muss insbesondere darauf hingewiesen werden, dass die im HTTP-Header angegebene Zeichencodierung bei HTML- oder CSS-Dokumenten alle Angaben im Dokument selbst überschreibt.
Der vom W3C entwickelte Internationalization-Checker prüft Webseiten auf verschiedene für die Internationalisierung problematische Dinge. Er enthält auch einen Abschnitt, der die mit Internationalisierung verbundenen Informationen über eine Seite zusammenfasst, wie bspw. Zeichencodierung, Sprachangabe usw. Dieser Abschnitt zeigt, ob eine Zeichencodierungs-Angabe im HTTP-Header vorliegt, und wenn ja, welche.
Besonders nützlich ist am i18n-Checker, dass er auch andere, im Dokument vorliegende Zeichencodierungs-Angaben anzeigt und warnt, wenn diese verschieden sind.
Es gibt verschiedene Dienste, die alle HTTP-Header und den Quelltext (HTML/XHTML) des vom Server ausgelieferten Dokuments anzeigen, nachdem man dessen Adresse angegeben hat:
Das W3C steht in keiner Verbindung zu diesen Diensten.
Sehen Sie in den HTTP-Headern nach dem Content-Type
-Header und insbesondere nach dem charset
-Parameter, z.B.
Content-Type: text/html; charset=utf-8
Es kann auch sein, dass kein charset
-Parameter vorhanden ist. Das ist in Ordnung, wenn das Dokument selbst seine Zeichencodierung angibt.
Modern desktop browsers usually contain a set of web developer tools, and they can be used to view HTTP headers of a web document and its related resources. Here's how to do it in major browsers.
Content-Type
header, and in particular for the charset
parameter.Content-Type
header, and in particular for the charset
parameter.telnet
oder ein anderes Kommandozeilen-Tool verwendenHierzu benötigt man etwas mehr Erfahrung, das ist aber leichter zu automatisieren. Ein anderes Kommandozeilen-Tool ist wget
(mit Option -S
oder -s
).
Manche Server führen eine Umcodierung durch und senden Webdokumente an verschiedene Clients in verschiedenen Zeichencodierungen. Das geschieht bspw. auf einigen Servern in Russland. Das erfordert besondere Achtsamkeit, denn ein Browser, der bspw. auf einem Mac oder einem Windows-System läuft, könnte eine andere Zeichencodierung anzeigen als ein webbasierter Dienst oder der W3C-Markup-Validator (die meist auf UNIX-Systemen basieren).
HTML und CSS verfassen
Server-Konfiguration