Klucz dostępu n przeskakuje w nawigacji strony. Przejdź do początku.

Ten dokument jest tłumaczeniem. W przypadku rozbieżności i błędów aktualna wersja angielska powinna być uznana za autorytatywną. Pierwotne prawa autorskie należą do W3C jak wykazano poniżej.

Tłumacz: Tłumaczenia Dokumentów Team

s_gotoW3cHome Internacjonalizacja
 

Kodowanie znaków

Potencjalni odbiorcy: każdy, kto chce szybkiego podsumowania podstawowych informacji dotyczących kodowania znaków w HTML i XML. Po dalsze informacje, odwiedź odnośniki w tekscie lub zobacz inne artykuły.

Zbiór znaków dokumentu

Zbiorem znaków dokumentów dla XML i HTML 4.0 jest Unicode (aka ISO 10646). Oznacza to, że przglądarki HTML i procesory XML powinny zachowywać się tak jakby używały wewnętrznie Unicode. Nie oznacza to, że dokumenty muszą być wysyłane w Unicode. Tak długo jak klient i serwer zgadzają się co do kodowania, które może być przekształcone w Unicode. Przeczytaj więcej na temat zbioru znaków dokumentu.

Deklarowanie kodowania

Jest bardzo ważnym aby kodowanie znaków dokumentów XML lub (X)HTML było wyraźnie oznakowane po to aby klienci mogli z łatwością mapować takie kodowanie na Unicode. Można to zrobić w następujący sposób:

Po dyskusje na temat które podejście jest lepsze dla danego typu dokumentu (X)HTML, odwiedź tutorial Zbiory znaków & kodowanie w XHTML, HTML i CSS.

Powyższy przykład pokazuje deklarację dla treści kodowanych w UTF-8. W większości przypadków wydaje się to najlepszym kodowaniem, ale nie jest to jedyną możliwością.

Jeśli nie używa się UTF-8, powinno się zamienić tekst UTF-8 z powyższych przykładów na nazwę kodowania, które się wybrało. Dostępna jest pełna lista nazw kodowania znaków zarejestrowanych przez IANA (długa). W praktyce, kilka kodowań jest preferowanych, najczęściej są to: ISO-8859-1 (Latin-1), US-ASCII, UTF-16, inne kodowania z serii ISO-8859, iso-2022-jp, euc-kr, itd.

Upewnij się, że deklaracja działa

Ważnym jest, aby używać powyższych deklaracji kodowania nie tylko w HTTP lub treści, ale także:

Aby uzyskać więcej informacji na ten temat sprawdź następujący link Zmiana kodowania strony (X)HTML na UTF-8. Aczkolwiek pisane jest to z perspektywy użycia UTF-8, odnosi się to jednak do każdego rodzaju kodowania.

Dodadkowe informacje

Wartości dla atrybutu kodowania są dostępne w IANA registry. Zauważ, że są one nazwane nazwami charset, chociaż w rzeczywistości odnoszą się do kodowań a nie do zbioru znaków.

Bardziej szczegółowe informacje dostępne są w artykule autorstwa Dan'a Connolly ("Character Set" Considered Harmful) i odpowiedź Glenn'a Adams'a (Character Set Terminology, SC2 vs. SC18 vs. Internet Standards).

Notka historyczna: Rick Jellife zaproponował użycie encji SPREAD z ERCS.

Powiedz nam co myślisz (po angielsku).

Prenumeruj kanał RSS.

Nowe źródła

Wiadomość ze strony głównej

Twitter (Wiadomość ze strony głównej)

‎@webi18n

Warto przeczytać

Materiały pomocnicze:

Referenje w specyfikacjach:

Inne odnośniki:

Autor: Bert Bos, W3C. Zmodyfikowano przez: Martin J. Dürst, W3C; Richard Ishida, W3C. Tłumacz: Tłumaczenia Dokumentów Team.

Ważny XHTML 1.0!
Ważne CSS!
Zakodowano w UTF-8!

Angielska wersja dokumentu z dnia 2006-07-20. Tłumaczenie wykonano dnia 2011-01-26 20:10 GMT

Historia zmian dokumentu article-o-charset w blogu i18n.