Gyors tippek a web nemzetköziesítéséhez

Kódolás. Amikor csak lehetséges, a tartalomhoz vagy az adatbázishoz, stb. unikód karaktereket használjunk. Mindig adjuk meg a tartalom kódolását.

Feloldójelek (Escape karakterek). A feloldójelek (pl. á á or á) helyett használjunk inkább karaktereket, amikor csak lehet.

Nyelvek. Deklaráljuk a dokumentum nyelvét, és jelöljük, ha a dokumentum belsejében más nyelvre térünk át.

Prezentáció vagy tartalom. Használjunk stíluslapokat a bemutatandó információkhoz. Korlátozódjunk szemantikai jelölésekre.

Képek, animációk és példák. Ellenőrizzük a fordíthatóságot és a kulturális megközelítést.

Űrlapok. Használjunk megfelelő kódolást mind az űrlapon, mind a szerveren. Támogassunk helyi formátumot a név/cím, idő/dátum, stb esetén.

Szövegírás. Egyszerű, tömör szövegeket használjunk. Bánjunk óvatosan a több szöveges változóból összeálló mondatok alkotásakor.

Navigáció. Minden oldalon a célnyelven megfogalmazva, jól látható helyen legyen elhelyezve a helyi oldalakra, honlapokra mutató link.

Jobbról balra haladó szöveg. XHTML-ben adjunk dir="rtl" a html címkéhez. Csak az alap szövegirány változtatásánál használjuk újra.

Ellenőrizzük munkánkat. Érvényeítés! Használjuk az http://www.w3.org/International/ oldalon található tutoriálokban és cikkekben leírt technikákat!

Az alábbi ’Gyors tippek’-ben összegezzük a web szerkesztéssel kapcsolatos kulcsfogalmakat. Ez nem részletes útmutató, hanem a W3C nemzetköziesítési tevékenység néhány irányelvét mutatjuk be.

Ezen az oldalon először tömören összefoglalt tanácsokat adunk, melyek a névjegykártya méretű referencia kártyákon is megtalálhatók, majd ezeket részletesebben kifejtjük. Az összefoglalókat a W3C nemzetköziesítés témakörrel foglalkozó, kapcsolódó oldalakra mutató hivatkozással zárjuk, ahonnan további információhoz lehet jutni.

Az oldalt időről időre frissítjük.

Gyors tippek

Kódolás. Amikor csak lehetséges, használjunk unikódot a tartalomhoz vagy az adatbázishoz, stb. Mindig adjuk meg a tartalom kódolását.

A kiválasztott karakterkódolás meghatározza, hogy a bájtokat hogyan lehet leképezni a megfelelő karakterekre szövegünkben.

Általában a karakterkódolások behatárolják, hogy milyen írásjelet vagy nyelveket használhatunk. Az unikód segítségével majdnem minden nyelvet és írásjelet egyszerűen használhatunk. Így az unikód leegyszerűsíti a többnyelvű tartalom kezelését egy vagy több oldalon keresztül. Űrlapoknál, szkripteknél vagy adatbázisoknál, különösen hasznos az unikód karakterek használata, hiszen ezeknél gyakran van szükség a többnyelvűségre. Az unikód karakterek használatával egyszerűbben adhatunk új nyelveket a honlapokhoz.

Ha nem megfelelően adjuk meg, hogy milyen karakterkódolást használunk, akkor a felhasználóink esetleg nem fogják tudni elolvasni a tartalmat. Ez azért fordulhat elő, mert az alkalmazás helytelenül rendelheti a szöveg bájtjaihoz a karaktereket.

További háttérinformáció
A Karakterkódolások kezdőknek részletezi, hogy miért fontos a helyes karakterkódolás, illetve ezzel kapcsolatos alapfogalmakat definiál. A Bevezetés a karakterkészletekbe és -kódolásokba betekintést ad a témába különböző szempontok alapján.
Hogyan csináljuk?
HTML és CSS fejlesztőkSpecifikáció fejlesztőkSzerver telepítés
Feloldójelek (escape karakterek). A feloldójelek (pl. á á vagy á) helyett használjunk karaktereket, amikor csak lehet.

A feloldójelek (escape karakterek), mint pl. numerikus karakter referenciák (NCR) és entitások az unikód karakterek csak ASCII karakterekkel való megjelenítését szolgálják. X/HTML-ben például az á karaktert pl. á á vagy á módon adhatjuk meg.

Az ilyen feloldójelek általában hasznosak a félreérthető vagy láthatatlan karakterek egyértelmű megjelenítésénél. Ugyancsak hasznosak a szintaktikai karakterek, mint például az és jel valamint a szögletes zárójel kapcsán felmerülő problémák megelőzésénél. Hasznosak lehetnek olyan esetekben is, amikor az adott karaktert a használt karakterkészlet nem támogatja, vagy a billentyűzetről nem elérhető. Máskülönben mindig érdemes karaktereket használni a feloldójel helyett.

További háttérinformáció
A karakter entitások és az NCR használata további információt tartalmaz a feloldójelek leíró nyelvekben való használatáról. Megjegyzendő, hogy az entitásokat (mint például &aacute) óvatosan kell kezelni.
Hogyan csináljuk?
HTML és CSS fejlesztőkSpecifikáció fejlesztőkSVG fejlesztők
Nyelvek. Adjuk meg a dokumentum nyelvét, és jelöljük, ha a dokumentum belsejében más nyelvre térünk át.

A tartalom nyelvével kapcsolatos információ alapvetően fontos a hozzáférhetőség, formázás, keresés, szerkesztés, stb. miatt. Ahogy egyre több és több tartalmat jelölünk meg helyesen, azok az alkalmazások, melyek felismerik a nyelvi információkat egyre hasznosabbak és elterjedtebbek lesznek.

A nyelv megadásánál szükségünk lehet a dokumentum egészére vonatkozó metaadatoktól eltérő nyelvi információk definiálására a dokumentum egy részén. Fontos, hogy tisztában legyünk ezzel a különbséggel.

További háttérinformáció
A Nyelv a Weben több megközelítésből ad információt a témáról.
Hogyan csináljuk?
HTML és CSS fejlesztőkSVG fejlesztőkXML fejlesztőkRendszer fejlesztőkSzerver telepítés
Prezentáció vagy tartalom. Használjunk stíluslapokat a bemutatandó információkhoz. Korlátozódjunk szemantikai jelölésekre.

A webszerkesztés egyik fontos elve, hogy különítsük el a tartalom formázási módját vagy megjelenítését az aktuális szövegtől. Ez egyszerűvé teszi más formázás használatát ugyanannál a szövegnél, például annak érdekében, hogy ugyanazt a tartalmat lássuk egy hagyományos böngészőben és egy kis kézi készüléken is.

Ez az elv különösen fontos a lokalizációnál, mivel különböző írásjeleknek különböző tipográfiai igényeik lehetnek. Például a japán karakterek összetettsége miatt a hangsúlyokat esetleg ajánlatosabb a félkövér vagy dőlt stílus helyett más stílussal jelölni a japán X/HTML oldalakon. Sokkal egyszerűbb ilyen változásokat alkalmazni, ha a prezentáció CSS-t használ, valamint a jelölés sokkal érthetőbb és kezelhetőbb, ha a szöveget helyesen és egyértelműen jelöljük 'kiemelt' és nem 'félkövér' stílusként.

Jelentős időt és erőfeszítést spórolhatunk meg a lokalizálás során, ha CSS fájlokkal dolgozunk a jelölések változtatása helyett. Így egy minden oldalra vonatkozó jelölésbeli változást egyetlen helyen meg tudunk valósítani, és így a fordító inkább a tartalomra, semmint a megjelenítésre tud koncentrálni.

További háttérinformáció
Olvassuk el a 2007-es @media konferencia "Szerkesztés nemzetközi felhasználóknak: Gyakorlati tanácsok" előadásainak diáit.
Képek, animációk és példák. Ellenőrizzük a fordíthatóságot és az esetleges kulturális torzítást.

Ha azt akarjuk, hogy a tartalom valóban eljusson az emberekhez, akkor az ő nyelvükön, helyi képeiken, színeiken, tárgyaikon és elképzeléseiken, s nemcsak a szövegen keresztül kell beszélnünk hozzájuk. Könnyű figyelmen kívűl hagyni a szimbolizmus, viselkedés, fogalmak, testbeszéd, humor, stb. kultúra-specifikus természetét. Visszajelzéseket kellene gyűjtenünk képeink, vidóklippjeink és más példák kapcsán azok alkalmasságával, relevanciájával kapcsolatban az adott ország felhasználóitól.

Mikor a tartalmat fordítjuk, arra is figyelnünk kell, ha a grafika szöveget tartalmaz. Egy komplex háttérrel rendelkező vagy szűk helyen lévő szöveg komoly gondot okozhat a fordító számára. Olyan grafikát kell biztosítani a lokalizációs csoportnak, ahol a szöveg egy külön rétegen helyezkedik el, valamint szem előtt kell tartanunk azt is, hogy például az angol és kínai szövegek szinte mindig bővülnek a fordítás következtében.

További háttérinformáció
Olvassuk el a 2007-es @media konferencia "Szerkesztés nemzetközi felhasználóknak: Gyakorlati tanácsok" előadásának diáit.
Űrlapok. Használjunk megfelelő kódolást mind az űrlapon, mind a szerveren. Használjuk a helyi formátumot a név/cím, idő/dátum, stb esetén.

Az űrlapot tartalmazó HTML oldalhoz használt kódolás támogasson minden olyan karaktert, ami az adatbevitelhez szükséges. Ez különösen fontos akkor, ha a felhasználó vélhetőleg több nyelven visz be információt.

Azoknak az adatbázisoknak és szkripteknek, amik többnyelvű oldalakon lévő űrlapokról kapnak adatot, minden nyelven egyszerre kell támogatniuk a karaktereket.

A legegyszerűbb módja annak, hogy képesek legyünk erre az, ha unikódot használunk mind az űrlapot tartalmazó oldalon, mind a háttérfolyamatoknál és tárolásnál. Ebben az esetben a felhasználó az adatokat bármilyen nyelven és írásjelet használva kitöltheti, attól függően, hogy mire van szüksége.

Azt se feltételezzük automatikusan, hogy például a felhasználó neve, címe megfelel a formázási szabályainknak. Vizsgáljuk meg, hogy pl. a címnél valójában hány mezőre van szükség. Tartsuk szem előtt azt is, hogy néhány országban nincsenek utcanevek, máshol az utcanevet a házszám követi, van akinek egynél több sorra van szüksége címének azon részére, ami megelőzi az utca és a város nevét, stb. Valójában néhány országban a cím a hely megnevezésétől halad a konkrét házszám felé, ami egy egészen más kifejezési stratégia. Legyünk nagyon óvatosak az irányítószámok, telefonszámok hosszúsága kapcsán, nehogy téves kritériumokat alkalmazzunk az ellenőrzés során. Ismerjük fel, hogy egyértelmű jelölés szükséges a numerikus dátumok beviteléhez, hiszen különböző konvenciók vannak a nap, hónap, év sorrendjét illetően.

Ha információkat gyűjtünk különböző országokból származó emberektől, akkor a különböző formátumokhoz fontos kiépítünk egy olyan stratégiát, ami a felhasználók számára is kezelhető. Nem csak ez fontos az általunk létrehozott űrlapok stílusában, hiszen arra is hatással van, hogyan fogjuk tárolni az információkat az adatbázisokban.

Hogyan csináljuk?
HTML és CSS fejlesztőkHTML és CSS fejlesztőkSpecifikáció fejlesztők
Szövegírás. Egyszerű, tömör szövegeket használjunk. Bánjunk óvatosan a több szöveges változóból összeálló mondatok alkotásakor.

Az egyszerű, tömör szöveget könnyebb fordítani. Ezt olvasni is könnyebb a felhasználóknak, különösen, ha a szöveg, amit olvasnak, nem az anyanyelvükön van.

Különösen vigyáznunk kell arra, ha több részsztringből állítjuk össze a szöveget, vagy ha szöveges változókat illesztünk a sztringek közé. Például tegyük fel, hogy az oldalunk JSP szkriptet használ és bizonyos üzeneteket akarunk megfogalmazni menet közben. Esetleg részsztringek összefűzésével hozunk létre üzeneteket, úgy is mint 'Csak' vagy 'Ne', ' visszatérés az eredményekhez ', és 'minden űrlap' vagy 'HTML'. Mivel a mondatok sorrendje különböző nyelveken nagyon eltérő lehet, ezek fordítása nagy nehézségeket jelenthet.

Hasonlóan fontos, hogy kerüljük a szövegben lévő változók elhelyezkedésének fixálását, mint pl. "Első oldal a 10-ből". Más nyelvek szintaktikája lehet, hogy megkívánja a számok módosítását, hogy értelme legyen. Ha PHP-t használunk, akkor ez inkább azt a sztring formázást jelentené, mint "Page %1\$d of %2\$d.", mint az egyszerűbb "Page %d of %d.". Az utóbbi néhány nyelvre lefordíthatatlan.

Hogyan csináljuk?
HTML és CSS fejlesztők
Navigáció. Minden oldalon a célnyelven megfogalmazva, jól látható helyen legyen elhelyezve a helyi oldalakra, honlapokra mutató link.

Ahol különböző nyelveken vagy különböző országoknak, régióknak szóló különféle verziójú oldalunk, honlapunk van, biztosítanunk kell a felhasználó számára bármely verzió elérhetőségét. Ezt a honlap minden oldaláról elérhetővé kell tenni.

Amikor különböző nyelvű hivatkozásokat adunk meg az oldalakhoz, a célnyelv nevét használjuk az adott nyelvet és írásmódot használva. Ne feltételezzük automatikusan, hogy a felhasználó tud angolul olvasni. Például egy francia oldalra való hivatkozásban a 'francia' szó, mint 'français' lenne írva. Ez szintén érvényes, ha a felhasználót egy ország – vagy régió – specifikus oldalára kalauzoljuk. Pl. 'Németország' helyesen 'Deutschland'.

Hogyan csináljuk?
HTML és CSS fejlesztők
Jobbról balra haladó szöveg. XHTML-ben adjunk dir="rtl" a html címkéhez. Csak az alap szövegirány változtatásánál használjuk újra.

Például az arab, héber, perzsa és urdu nyelvű szövegeket jobbról balra olvassuk. Ez az olvasási rend általában jobbra záráshoz, az oldal és táblázatok tükörképi párjához vezet. Az alapértelmezett beállítást és lapelrendezését úgy állíthatjuk be jobbról balra, ha a html címkéhez egyszerűen hozzáadjuk a dir="rtl" bejegyzést.

A html címkében lévő irány beállítás definiálja a dokumentum alapirányát, amely végighalad az oldal összes elemén. Nem szükséges megismételnünk az attribútumot alacsonyabb szinten lévő elemekre, kivéve akkor, ha szándékosan meg akarjuk változtatni a szöveg haladási irányát.

A beágyazott szöveg, pl. a latin betűs szöveg, továbbra is balról jobbra fut, még akkor is, ha az eredeti szövegben jobbról balra a szöveg haladási iránya. Ugyanez vonatkozik a számokra is. Ha egy jobbról balra haladó írásmódú nyelvvel dolgozunk, akkor ismernünk kell az unikód kétirányú algoritmusának alapjait. Ez az algoritmus a legtöbb kétirányú szövegről gondoskodik, anélkül, hogy a szerzőnek ezzel foglalkoznia kellene. Akad néha azonban olyan körülmény, amikor jelölő vagy unikód vezérlő karakterekre van szükségünk ahhoz, hogy biztosítsuk a megfelelő eredményt.

További háttérinformáció
Az arab és héber nyelvű (X)HTML oldalak készítése a jobbról balra haladó szövegek HTML-ben való kezeléséről ad információt. Az elvek a többi jelölőnyelvhez hasonlóak.
A Mit kell tudnunk a kétirányú (bidi) algoritmusról és a soron belüli jelölésről rész bevezetést ad a kétirányú szövegek soron belüli kezelésének alapjairól.
Hogyan csináljuk?
HTML és CSS fejlesztőkSVG fejlesztőkXML fejlesztőkSchema fejlesztők
Ellenőrizzük munkánkat. Érvényeítés! Használjuk az http://www.w3.org/International/ oldalon található tutoriálokban és cikkekben leírt technikákat!
Try the W3C Internationalization Checker.

Egyéb bevezető anyagok

Az Első lépések oldalunkat nemrég jelentettük meg, hogy segítsünk a tájékozódásban. Az Első lépések oldalon olyan cikksorozatokat találunk, amelyek bevezetik a kevésbé tapasztaltakat a lokalizáció témakörébe, és amelyek az indulást segítő alapvető információt tartalmaznak.