Klucz dostępu n przeskakuje w nawigacji strony. Przejdź do początku.
Ten dokument jest tłumaczeniem. W przypadku rozbieżności i błędów aktualna wersja angielska owinna być uznana za autorytatywną. Pierwotne prawa autorskie należą do W3C jak wykazano poniżej.
Tłumacz: Tłumaczenia Dokumentów Team
Potencjalni odbiorcy: każdy, kto chce szybkiego podsumowania podstawowych informacji dotyczących kodowania znaków w HTML i XML. Po dalsze informacje, odwiedź odnośniki w tekscie lub zobacz inne artykuły.
Zbiorem znaków dokumentów dla XML i HTML 4.0 jest Unicode (aka ISO 10646). Oznacza to, że przglądarki HTML i procesory XML powinny zachowywać się tak jakby używały wewnętrznie Unicode. Nie oznacza to, że dokumenty muszą być wysyłane w Unicode. Tak długo jak klient i serwer zgadzają się co do kodowania, które może być przekształcone w Unicode. Przeczytaj więcej na temat zbioru znaków dokumentu.
Jest bardzo ważnym aby kodowanie znaków dokumentów XML lub (X)HTML było wyraźnie oznakowane po to aby klienci mogli z łatwością mapować takie kodowanie na Unicode. Można to zrobić w następujący sposób:
Wyślij parametr 'charset' w Nagłówku HTTP Content-Type. Na przykład:
Content-Type: text/html; charset=utf-8Potrzebujesz dostępu do ustawień serwera lub podaj dokument w skrypcie (zobacz ustawianie parametru charset HTTP po więcej informacji).
Dla XML (wliczając XHTML), Użycie pseudo atrybutu kodowania w deklaracji xml na początku dokumentu lub deklaracji tekstu na początku. Przykład:
<?xml version="1.0" encoding="utf-8" ?> Istnieją potencjalne problemy , o których powinno się wiedzieć kiedy używa się XHTML 1.0 jako HTML.
Dla HTML lub XHTML jako HTML, zawsze użyj znacznika <meta> wewnątrz <head>. Przykład:
<meta http-equiv="Content-Type" content="text/html;charset=utf-8" >Z XHTML należy użyć ukośnika na końcu:
<meta http-equiv="Content-Type" content="text/html;charset=utf-8" />Po dyskusje na temat które podejście jest lepsze dla danego typu dokumentu (X)HTML, odwiedź tutorial Zbiory znaków & kodowanie w XHTML, HTML i CSS.
Powyższy przykład pokazuje deklarację dla treści kodowanych w UTF-8. W większości przypadków wydaje się to najlepszym
kodowaniem, ale nie jest to jedyną możliwością.
Jeśli nie używa się UTF-8, powinno się zamienić tekst UTF-8 z powyższych przykładów na nazwę kodowania, które się wybrało. Dostępna jest
pełna lista nazw kodowania znaków zarejestrowanych przez IANA (długa). W praktyce, kilka
kodowań jest preferowanych, najczęściej są to: ISO-8859-1 (Latin-1), US-ASCII, UTF-16, inne kodowania z serii
ISO-8859, iso-2022-jp, euc-kr, itd.
Ważnym jest, aby używać powyższych deklaracji kodowania nie tylko w HTTP lub treści, ale także:
Zapaisywać dane we właściwym kodowaniu już w procesie edycji.
Upewnić się, że nie zachodzi konflikt między deklaracją w dokumencie a informacją stosowaną przez serwer, ponieważ ustawienia serwera mają priorytet nad deklaracjami dokumentu.
Aby uzyskać więcej informacji na ten temat sprawdź następujący link Zmiana kodowania strony (X)HTML na UTF-8. Aczkolwiek pisane jest to z perspektywy użycia UTF-8, odnosi się to jednak do każdego rodzaju kodowania.
Wartości dla atrybutu kodowania są dostępne w IANA registry. Zauważ, że są one nazwane nazwami charset, chociaż w rzeczywistości odnoszą się do kodowań a nie do zbioru znaków.
Bardziej szczegółowe informacje dostępne są w artykule autorstwa Dan'a Connolly ("Character Set" Considered Harmful) i odpowiedź Glenn'a Adams'a (Character Set Terminology, SC2 vs. SC18 vs. Internet Standards).
Notka historyczna: Rick Jellife zaproponował użycie encji SPREAD z ERCS.
Powiedz nam co myślisz (po angielsku).
Przetłumaczono z angielskiego dnia 2006-09-09. Ostatnia zmiana wersji tłumacznia 2006-10-26 17:41 GMT
Historia zmian dokumentu article-o-charset w blogu i18n.
Copyright © 1996-2006 W3C® (MIT, ERCIM, Keio), All Rights Reserved. W3C liability, trademark, document use and software licensing rules apply. Your interactions with this site are in accordance with our public and Member privacy statements.