Klucz dostępu n przeskakuje w nawigacji strony. Przejdź do początku.

Ten dokument jest tłumaczeniem. W przypadku rozbieżności i błędów aktualna wersja angielska powinna być uznana za autorytatywną. Pierwotne prawa autorskie należą do W3C jak wykazano poniżej.

Tłumacz: A.Osobka, N.Fabisz, Angielski Team

s_gotoW3cHome Internacjonalizacja
 

Wprowadzenie do zbiorów znaków i kodowania

Potencjalni odbiorcy: każdy kto jest nowicjuszem w internacjonalizacji i potrzebuje odpowiednich wskazówek.

Uwaga: Wprowadzono zmiany do oryginalnej wersji angielskiej od czasu wykonania tłumaczenia. Dostępna lista zmian.

Niniejsza strona jest wprowadzeniem do procesu internacjonalizacji dla nowicjuszy, którzy nie wiedzą od czego zacząć.

Poprzez zamieszczenie szeregu artykułów na konkretne tematy związane z internacjonalizacją, mamy nadzieję, że pomożemy Państwu w zrozumieniu pewnych rzeczy oraz damy Państwu punk odniesienia do dalszyego studiowania tematu oraz innych tematów pokrewnych.

Staramy się również wskazać kto może być zainteresowany konkretnym aspektem tematu.

Po przeczytaniu tych źródeł możecie Państwo znaleźć bardziej dokładne informacje używając indeksu tematów, indeksu technik lub wyszukiwania na tej stronie.

O co chodzi?

Zbiór znaków to zestaw liter i symboli używanych w systemach piśmiennictwa. Na przykład: zbiór ASCII zawiera litery i symbole używane w języku angielskim, ISO-8859-6 zawiera litery i symbole używane w wielu językach opartych na skrypcie arabskim, a Unicode składa się ze znaków dla większości języków nowżytnych na świecie.

Znaki w zbiorze znaków są przechowywane jako jeden lub więcej bajtów w komputrze. Każdy bajt lub ciąg bajtów reprezentuje pewien znak. Kodowanie znaków to klucz przypisujący konkretny bajt lub ciąg bajtów do konkretnego znaku, który to znak jest wyrażony jako czcionka w tekscie.

Istnieje wiele kodowań znaków. Jeśli użyje się złego kodowania w bajtach pamięci, skutkiem będzie nieczytelny tekst, dlatego też ważnym jest aby poprawnie określic kodowanie znaków jeśli użytkownik twojej strony ma przeczytać jej zawartość.

Wybór kodowania

Każdy kto buduje treść, w tym programista, musi zdecydować się na typ kodowania, którego będzie używał. UTF-8 jest obecnie najpopularniejszą rekomendacją, ale istnieją rzeczy, które należałoby rozważyć przed jego użyciem.

Deklaracja i zastosowanie kodowania

Kiedy zdecydowano już jakiego kodowania użyć, programiści i autorzy treści muszą je odpowiednio zadeklarować w dokumencie.

W technologii takiej jak XHTML, deklaracje kodowania nie są takie oczywiste, wymagają one zrozumienia trybu 'standards' i 'quirks' oraz jaki impakt będzie miała daklaracja XML.

Trzeba również mieć na uwadze, że dane powinny być zapisane w wybranym kodowaniu, a nie jedynie deklarowane w dokumencie.

Twórcy stron i webmasterzy będą również musieli upewnić się, że serwer przekazuje dokumenty z właściwymi deklaracjami kodowania, ponieważ ustawienia serwera są ważniejsze niż deklaracje dokumentu.

Escapes

Escapes są sposobem na reprezentowanie znaków przy użyciu tekstu ASCII. Reprezentują one znaki, które nie są dostępne w zbiorze znaków danego języka. Są też sposobem na unikanie znaków z określonych powodów, np.: kiedy mogą one kolidować z syntaksem danego języka. Trzeba wiedzieć kiedy i dlaczego powinny być one zastosowane.

Adresy sieciowe

Obecnie adresy sieciowe mogą zawierać znaki, które nie są ASCII. Użytkownicy nie robią nic poza naciśnięciem na odpowiedni link lub wejściem w tekst, który ich interesuje. Prawdziwą pracę wykonują natomiast przeglądarki - można dowiedzieć się jak one działają.

Powiedz nam co myślisz (po angielsku).

Prenumeruj kanał RSS.

Nowe źródła

Wiadomość ze strony głównej

Twitter (Wiadomość ze strony głównej)

‎@webi18n

Walidowanie i rozwiązywanie problemów

W przypadku problemów z kodowaniem, można skorzystać z następujących źródeł:

Autor: Richard Ishida, W3C. Tłumacz: A.Osobka, N.Fabisz, Angielski Team.

Ważny XHTML 1.0!
Ważne CSS!
Zakodowano w UTF-8!

Angielska wersja dokumentu z dnia 2006-01-16. Tłumaczenie wykonano dnia 2007-07-11 9:23 GMT

Historia zmian dokumentu gs-characters w blogu i18n.