Accesskey n springt zur Seitennavigation. Springe zum Inhalt.

Dieses Dokument ist eine Übersetzung. Im Falle von Abweichungen oder Fehlern sollte das aktuelle englische Original als maßgeblich angenommen werden. Das W3C besitzt das Copyright am Original, wie unten beschrieben.

Übersetzer: Gunnar Bittersmann

s_gotoW3cHome Internationalisierung
 

Überprüfung der Zeichencodierung mit dem Validator

Zielgruppe: Nutzer, XHTML/HTML-Autoren (die Web-Editoren/Texteditoren oder Scripte benutzen), Script-Entwickler (PHP, JSP u.a.), Webprojekt-Manager und alle, die wissen möchten, wie man die Zeichencodierung eines Dokuments überprüft

Frage

Wie kann man mithilfe des W3C-HTML-Validators überprüfen, ob die Zeichencodierung eines Dokuments korrekt ist?

Antwort

Um sicherzustellen, dass alle Empfänger eines Dokuments dieses richtig darstellen und verarbeiten können, ist es sehr wichtig, die Zeichencodierung ('charset') korrekt anzugeben. Eine Möglichkeit, diese zu überprüfen, bietet der W3C Markup Validation Service. Der Validator erkennt gewöhnlich die Zeichencodierung aus dem HTTP-Header und aus den Angaben im Dokument. Wenn der Validator die Zeichencodierung nicht erkennt, kann diese auf der Ergebnisseite im Pulldown-Menü 'Encoding' ausgewählt werden (Beispiel).

Aber oft hat der Validator nichts zu beanstanden, selbst wenn eine falsche Codierung erkannt oder ausgewählt wurde. Der Grund dafür ist, dass sich viele Codierungen sehr ähnlich sind und der Validator nur die Syntax des Markups prüft und nicht entscheiden kann, ob der decodierte Text einen Sinn ergibt oder nicht. Um sicherzustellen, dass die Codierung richtig ist, d.h. dass das Dokument beim Leser richtig angezeigt wird, beachten Sie folgende Punkte:

Übrigens

Der Validator kann nicht ohne die Information über die Zeichencodierung arbeiten, denn SGML- oder XML-Validierung basiert auf der Prüfung der Folge von Zeichen des Dokuments; was der Validator aber als Eingabe erhält, ist eine Folge von Bytes. Anhand der Zeichencodierung kann der Validator die Bytes in Zeichen konvertieren. Das gilt allgemein für alle möglichen Empfänger, einschließlich Browser. Wenn nicht die richtigen Zeichen bestimmt werden, zeigt ein Webbrowser Müll an.

Der Validator tut dies, indem er die angegebene Codierung in UTF-8 konvertiert und intern UTF-8 verwendet. Wenn die Konvertierung nach UTF-8 fehlschlägt, weil eine bestimmte Bytefolge in der Eingabecodierung nicht vorkommen darf, meldet der Validator einen Fehler. Bei Eingaben in UTF-8 prüft der Validator, dass nur gültige UTF-8-Bytefolgen verwendet wurden.

Die visuelle Prüfung einer Webseite in einem Browser ohne Verwendung des Validators kann evtl. nicht ausreichend sein, denn:

Sagen Sie uns, was Sie denken (auf Englisch).

Abonnieren Sie unseren RSS-Feed.

Neue Ressourcen

News auf der Startseite

Twitter (News auf der Startseite)

‎@webi18n

Literaturhinweise

Autor: Martin Dürst, W3C. Übersetzer: Gunnar Bittersmann.

Valides XHTML 1.0!
Valides CSS!
Kodiert in UTF-8!

Übersetzung der englischen Version vom 2003-10-22. Letzte Änderung der übersetzten Version am 2011-07-06 20:00 UTC.

Suchen Sie nach qa-validator-charset-check im i18n-Blog, um alle Dokumentänderungen nachzuvollziehen.