Klucz dostępu n przeskakuje w nawigacji strony. Przejdź do początku.
Ten dokument jest tłumaczeniem. W przypadku rozbieżności i błędów aktualna wersja angielska powinna być uznana za autorytatywną. Pierwotne prawa autorskie należą do W3C jak wykazano poniżej.
Tłumacz: A.Osobka, N.Fabisz, Angielski Team
Potencjalni odbiorcy: każdy kto jest nowicjuszem w internacjonalizacji i potrzebuje odpowiednich wskazówek.
Uwaga: Wprowadzono zmiany do oryginalnej wersji angielskiej od czasu wykonania tłumaczenia. Dostępna lista zmian.
Niniejsza strona jest wprowadzeniem do procesu internacjonalizacji dla nowicjuszy, którzy nie wiedzą od czego zacząć.
Poprzez zamieszczenie szeregu artykułów na konkretne tematy związane z internacjonalizacją, mamy nadzieję, że pomożemy Państwu w zrozumieniu pewnych rzeczy oraz damy Państwu punk odniesienia do dalszyego studiowania tematu oraz innych tematów pokrewnych.
Staramy się również wskazać kto może być zainteresowany konkretnym aspektem tematu.
Po przeczytaniu tych źródeł możecie Państwo znaleźć bardziej dokładne informacje używając indeksu tematów, indeksu technik lub wyszukiwania na tej stronie.
Zbiór znaków to zestaw liter i symboli używanych w systemach piśmiennictwa. Na przykład: zbiór ASCII zawiera litery i symbole używane w języku angielskim, ISO-8859-6 zawiera litery i symbole używane w wielu językach opartych na skrypcie arabskim, a Unicode składa się ze znaków dla większości języków nowżytnych na świecie.
Znaki w zbiorze znaków są przechowywane jako jeden lub więcej bajtów w komputrze. Każdy bajt lub ciąg bajtów reprezentuje pewien znak. Kodowanie znaków to klucz przypisujący konkretny bajt lub ciąg bajtów do konkretnego znaku, który to znak jest wyrażony jako czcionka w tekscie.
Istnieje wiele kodowań znaków. Jeśli użyje się złego kodowania w bajtach pamięci, skutkiem będzie nieczytelny tekst, dlatego też ważnym jest aby poprawnie określic kodowanie znaków jeśli użytkownik twojej strony ma przeczytać jej zawartość.
Każdy kto buduje treść, w tym programista, musi zdecydować się na typ kodowania, którego będzie używał. UTF-8 jest obecnie najpopularniejszą rekomendacją, ale istnieją rzeczy, które należałoby rozważyć przed jego użyciem.
Kiedy zdecydowano już jakiego kodowania użyć, programiści i autorzy treści muszą je odpowiednio zadeklarować w dokumencie.
W technologii takiej jak XHTML, deklaracje kodowania nie są takie oczywiste, wymagają one zrozumienia trybu 'standards' i 'quirks' oraz jaki impakt będzie miała daklaracja XML.
Trzeba również mieć na uwadze, że dane powinny być zapisane w wybranym kodowaniu, a nie jedynie deklarowane w dokumencie.
Twórcy stron i webmasterzy będą również musieli upewnić się, że serwer przekazuje dokumenty z właściwymi deklaracjami kodowania, ponieważ ustawienia serwera są ważniejsze niż deklaracje dokumentu.
Escapes są sposobem na reprezentowanie znaków przy użyciu tekstu ASCII. Reprezentują one znaki, które nie są dostępne w zbiorze znaków danego języka. Są też sposobem na unikanie znaków z określonych powodów, np.: kiedy mogą one kolidować z syntaksem danego języka. Trzeba wiedzieć kiedy i dlaczego powinny być one zastosowane.
Obecnie adresy sieciowe mogą zawierać znaki, które nie są ASCII. Użytkownicy nie robią nic poza naciśnięciem na odpowiedni link lub wejściem w tekst, który ich interesuje. Prawdziwą pracę wykonują natomiast przeglądarki - można dowiedzieć się jak one działają.
Powiedz nam co myślisz (po angielsku).
W przypadku problemów z kodowaniem, można skorzystać z następujących źródeł:
Angielska wersja dokumentu z dnia 2007-03-07. Tłumaczenie wykonano dnia 2007-07-11 9:23 GMT
Historia zmian dokumentu gs-characters w blogu i18n.
Copyright © 2006-2007 W3C® (MIT, ERCIM, Keio), All Rights Reserved. W3C liability, trademark, document use and software licensing rules apply. Your interactions with this site are in accordance with our public and Member privacy statements.