Szövegméret a fordításban

Amikor egy szöveget egyik nyelvről a másikra fordítunk, a lefordított szöveg hossza általában eltér az eredeti szövegétől. Van néhány módszer, amelyekkel ezek a különbségek szisztematikusak lehetnek.

Ez a cikk háttéranyagként szolgál, ami röviden bemutat néhányat ezek közül. Egyéb cikkeink foglalkoznak a konkrét kihatásokkal és azok javasolt megoldásaival.

Általánosságban elmondható, hogy minél rugalmasabbra szerkesztjük az oldalunk kinézetét, annál jobb. Hagyjuk hogy a szöveg a böngésző méretéhez igazodjon és kerüljük a kicsi, fix szélességű cellákat és a szűk összepréselést, ahol csak lehet. Legyünk különösen óvatosak a weboldal grafikai tervezésénél, hogy a szöveg kényelmesen elférjen. Válasszuk szét a kinézetet és a tartalmat, így a szöveg mérete, a sormagasság, stb. könnyen adaptálható a lefordított szövegre. Ezeket akkor is tartsuk szem előtt, amikor az adatbázis mező karaktereinek a hosszát meghatározzuk.

Az angol és kínai különösen problémás

Az angol és kínai szöveg általában nagyon tömör és az ezekről történő fordítás jellemzően hosszabb lesz mint az eredeti - néha riasztó mértékben.

Egy kép a Flickr-en található fotókból. Például a Flickr felhasználói felülete mostanában lett lefordítva több nyelvre. Amikor a saját fotónkat nézzük, ki van írva, hogy hányszor látták, például "392 megtekintés". Az alábbi táblázat arányaiban* összehasonlítja az angol 'views' (megtekintések) szót a lefordított változatukkal:

Nyelv Forditás Arány
Koreai 조회 0.8
Angol views 1
Kínai 次檢視 1.2
Portugál visualizações 2.6
Francia consultations 2.6
Német -mal angesehen 2.8
Olasz visualizzazioni 3

A kínai és koreai karakter kettő angol betűnek számít a szélessége miatt.

A 300%-os megnyúlás angolról olaszra egyáltalán nem meglepő egy ilyen kis szónál mint ez. Az alábbi táblázat a szöveg hosszának várható átlagos megnyúlását mutatja angolról európai nyelvre történő fordításnál. Az IBM publikálta ezeket az adatokat a National Language Design Guide (Nemzetközi Nyelvi Design Útmutató) című 1. kötetében, 1994-ben.

Karakterek száma
az angol forrásban
Átlag meghosszabbodás
1-10 200-300%
11 - 20 180 - 200%
21 - 30 160 - 180%
31 - 50 140 - 160%
51 - 70 130 - 140%
70 fölött 150%

A lényeg tehát az, hogy a szöveg általában megnyúlik, de minél kisebb a forrás, annál valószínűbb hogy a fordítás mérete hosszabb lesz.

Természetesen ez nem igaz mindenre, de ha ilyen van, találni kell valamilyen módot arra hogy kezeljük. Például a Flickr-en a FAQ (Gyakran Ismételt Kérdések) németül és franciául is FAQ, de "Perguntas freqüentes" portugálul és "Preguntas frecuentes" spanyolul.

A probléma az, hogy minél kisebb az angol szöveg, annál valószínűbb hogy egy kis helyre lesz elhelyezve, mint például egy űrlap mező mellett, vagy egy grafikai elemben, vagy egy korlátozott szélességű részen, stb.

Azt is tartsuk észben, hogy nem csak egyedül a szövegnyúlás a probléma a felhasználói felületeknél angol és kínai nyelven. Ha az eredeti szöveg például spanyol, akkor az "Idioma de la interfaz" kifejezés kisebb lesz angolul ("Interface language"), de sokkal hoszabb maláj nyelven ("Bahasar pegantar untuk penelusuran"). Kisebb fordítások szintén lehetnek olyan problémásak, mint a nagyobbak ha túl sok 'white-space'-t használnak az oldalon.

Ha paragrafusokkal foglalkozunk, a relatív nyúlás valószínűleg kevesebb lesz de még így is vannak dolgok amiket meg kell fontolnunk. Ilyen például a fejléc hossza vagy az elemek megfelelő rendezése akkor is, ha összemennek különféle méretre.

Bonyolító tényezők

A fordításból eredő kiszámíthatatlan karakterszámon felül más tényezők is vannak amik bonyolítják a szöveg elrendezését.

Összetett főnevek

Számos nyelvnél, mint a finn, német és dán, kialakult egy nagy szó, hogy helyettesítsen több kisebb szóból álló kifejezést.

Például az angol "Input processing features" kifejezésből "Eingabe­verarbeitungs­funktionen" lesz németül. Az angol szöveg könnyen elválasztható két sorba, ahol megszabott szélesség van, mint például egy űrlap beviteli mezője mellett vagy más szűk oszlopokban de németül ugyanez már kihívás a külalakra nézve.

Karakterek szélessége

Kínai, japán és koreai, többek között azok a nyelvek amelyek komplikáltabb karakterekkel rendelkeznek mint a Latin. Ez azt jelenti, hogy még ha a karakterek száma ugyanannyi marad a fordítás után, vagy még kevesebb, a szükséges vízszintes tér még nagyobb lesz.

Például az angol "desktop" japánul "デスクトップ". Mint látható, kevesebb egy karakterrel, mégis több helyet foglal vízszintesen.

Karakter és sormagasság

Nagyon jellemző a latintól eltérő szövegre hogy magasabb karakterekkel rendelkezik mint a latin. Sőt, gyakran igényelnek több függőleges teret a sorok között mint a latin.

Például az alábbi ábra ugyanazt a szöveget mutatja angolul és thai nyelven. Figyeljük meg, hogy két sor van mindkét esetben, de a függőleges tér a thai szövegnél sokkal nagyobb. Ez részben a karakterek összetettsége miatt van, illetve részben azért is mert a thai nyelvben tipikus a sorok közötti nagyobb tér a latinhoz képest. Ilyen nyelvek még ezen felül az arab (különösen a Nastaliq betűk), kínai, hindi, japán, koreai, tibeti, stb.

Az összehasonlítás azt mutatja, ahogy a thai szöveg kb. 150%-al nagyobb függőleges teret foglal a latinhoz képest.

Gondoljuk meg kétszer is a rövidítéseket

Ha rövidítjük a szövegünket, hogy beleférjen egy korlátozott szélességű helyre, figyelembe kell vennünk hogy ez valóban jó ötlet-e. Más nyelvek nem biztos, hogy rendelkeznek hasonló rövidítésekkel és a fordított szöveg így néha nagyobb lehet.

Sok nyelvben ismeretlen a rövidítés. Ez adódhat a nyelvi hiányosságból, más esetekben pedig gyakorlati megfontolásból. Például az arab 'szavak' jellemzően nagyon tömör, minta alapú szótőből tevődnek össze, elő és utótagokkal, illetve kisebb belső változásokkal, így fejezve ki a pontos jelentést. Nehéz lenne rövidíteni anélkül, hogy elvesztenénk valamit a jelentésből.

(Ne feledjük, hogy a fordítónak szüksége lehet egy listára a rövidítésekről amiket használunk)