Наступні "Поради" підсумовують ключові концепції Міжнародного Веб Дизайну. Ці поради не є досконалим керуванням, це тільки витяги з концепцій із дочірнього сайту W3C Діяльності Інтернаціоналізації.
На цій сторінці перераховані короткі поради, що також можна переглянути на візитних довідкових картках , які слідують за текстом, що дає більше деталей і пояснень. Коли це можливо ми посилаємось на інформацію на дочірньому вебсайті W3C Інтернаціоналізації, де ви можете прочитати додаткову інформацію.
Ця сторінка буде оновлюватися час від часу.
Кодування символів, що ви вибрали визначає, якими символами в тексті будуть відображатися байти.
Зазвичай кодування символів обмежує вас конкретним скриптом або набором мов. Unicode дозволяє вам використовувати майже всі скрипти і мови, які використовуються по всьому світу. Таким чином, Unicode спрощує обробку контенту на декількох мовах, як у межах однієї сторінки, так і на одному або декількох сайтах в цілому. Unicode особливо корисний при використанні у формах, скриптах та базах даних, де часто потрібна підтримка декількох мов. За допомогою Unicode дуже просто додавати нові мови до вашого контенту.
Якщо ви призначили кодування символів, що не відповідає вашому контенту, то, можливо, ваші відвідувачі не зможуть прочитати ваш контент. Це тому, що неправильні припущення можуть бути зроблені в результаті застосування інтерпретації тексту до того, якими символами в тексті будуть відображатися байти.
Такі екрановані символи, як Чисельні Позначення Символів (NCRs) і Сутності символів використовуються для відтворення будь-якого символу Unicode в розмітці використовуючи тільки символи ASCII. Наприклад, ви можете відобразити символ á у X/HTML як á або á або á.
Ці екрановані елементи корисні для чіткого відображення неоднозначних або невидимих символів, і для запобігання проблем із синтаксисом таких символів, як амперсанди та кутові дужки. Вони також можуть бути корисними в деяких випадках для представлення символів, які не підтримуються вашим кодуванням символів або недоступні на вашій клавіатурі. В іншому випадку ви повинні завжди використовувати звичайні символи, а не екрановані.
Інформація про (людську) мову контенту важлива для доступності, дизайну, пошуку, редагування та інший причин. Оскільки все більше контенту оформлено правильно, то все більш корисними і широко поширеними будуть додатки, що можуть виявити інформацію про мову.
Призначаючи мову, вам необхідно буде відобразити інформацію про конкретні діапазони контенту, по-іншому в метаданих про документ в цілому. Важливо зрозуміти цю особливість.
Дотримування стилю контенту або представлення його окремо від фактичного тексту - є важливими принципами веб-дизайну. Це дозволяє легко застосовувати альтернативні стилі для одного і того ж тексту, наприклад, для відображення однакового контенту, як у звичайному браузері так і на малих ручних пристрях.
Цей принцип особливо корисний для локалізації, тому що різні скрипти мають різні друкарські потреби. Наприклад, через складність Японських символів, краще робити акцент на Японських X/HTML сторінках іншими способами, аніж виділяти їх жирним шрифтом або курсивом. Набагато легше застосовувати такі зміни, якщо подання описується за допомогою CSS, і розмітка набагато чистіша і більш керована, якщо текст написаний правильно і однозначно позначений як 'підкреслений', а не просто 'жирний'.
Під час локалізації можна зберегти багато часу і сил, якщо працювати з файлами CSS замість того, щоб міняти розмітку тому, що будь-що, що потребує змін можна зробити в одній локації для всіх сторінок, і перекладач може зосередитися на контенті, а не на поданні.
Якщо ви хочете, щоб ваш контент по-справжньому сполучав вас з людьми, ви повинні говорити їхньою мовою, але не тільки через текст, а й через місцеві образи, колір шкіри, об'єкти і турботи. Легко не помітити специфічну культурну символіку, поведінку, поняття, мову тіла, гумор, і т.д. Ви повинні отримати з країн користувачів відгуки, щодо придатності і актуальності ваших зображень, відео-кліпів, а також отримати приклади.
Коли ви перекладаєте ваш контент, ви повинні звернути увагу на текст, що відноситься до графіки. Фоновий текст або текст в обмеженому просторі може викликати значні проблеми для перекладача. Ви маєте включити графіку до групи локалізації, яка має текст на окремому прошарку, і ви повинні мати на увазі, що більш всього текст в таких мовах, як Англійська і Китайська буде розширюватися при перекладі.
Для сторінки HTML, яка містить форму використовується кодування, яке має підтримувати всі символи, які необхідні для введення даних у цій формі. Це особливо важливо, якщо користувачі можуть вводити інформацію на декількох мовах.
Бази даних і скрипти, які отримують дані з форм на сторінках, що опубліковані на декількох мовах також повинні підтримувати символи для всіх цих мов одночасно.
Найпростіший спосіб це дозволить - використовувати Unicode як для сторінок, що містять форми так і для кінцевого процесу та збереження. У такому випадку користувач може заповнити дані на будь-якій мові та скрипті, що йому необхідно.
Не думайте, що такі речі, як ім'я та адрес користувача будуть форматуватися по таким самим правилами, як ваші власні. Вирішіть для себе скільки вам потрібно додати окремих полів для адреси. Майте на увазі, що в деяких культурах немає назв вулиць, в інших номер будинку слідує за назвою вулиці, деяким людям необхідна більше ніж одна лінія для частини адреси, що йде перед назвою населеного пункту і т.д. Насправді в деяких місцях адрес заповнюється зверху вниз від загального до приватного, що припускає дуже різні стратегії складання макета. Будьте обережні при створенні перевірки на правильність кодів або довжини телефонного номеру. Ретельне маркування потрібне для введення номерних дат тому, що використовуються різні значення для відображення дня, місяця та року.
Якщо ви комплектуєте інформацію від людей, з декількох країн, то важливо розробити стратегію надсилання різних форматів, які підходили б цим людям. Це не тільки важливо для дизайну форм, що ви створюєте, а також впливає на те, як ви будете зберігати таку інформацію в базах даних.
Простий, лаконічний текст легше перекладати. Крім того такий текст, легше читати людям, які читають не на своїй рідній мові.
Ви маєте бути уважними при складанні повідомлення з декількох підрядків, або при вставці в рядки змінного тексту. Наприклад, припустимо, що ваш сайт використовує JSP скрипти, і ви вирішили скласти певні повідомлення. Ви можете створювати повідомлення об'єднуючи окремі підрядки, такі як 'Тільки' або 'Ні', ' повертати результати у ', та 'будь-який формат' або 'HTML'. Тому що порядок тексту в реченнях інших мов може дуже відрізнятися, його переклад може представляти серйозні труднощі.
Крім того, важливо, уникнути фіксації позицій змінних в тексті, наприклад "1-ша сторінка із 10-ти". В синтаксисі інших мов можливо доведеться змінити цифри для збереження змісту. Якщо ви використовуєте PHP, необхідно буде використовувати такий форматуючий рядок: "Page %1\$d of %2\$d.", а не більш простий "Page %d of %d.". Останній рядок не перекладається в деяких мовах.
Якщо у вас є версії сторінки або сайту на іншій мові, або для іншої країни або регіону, ви повинні забезпечити користувачів можливістю перегляду тої версії, якій вони віддають перевагу. Це повинно бути доступним на будь-якій сторінці вашого сайту, де є така альтернатива.
При наданні посилання на сторінки на інших мовах, використовуйте назву цільової мови на рідній мові та скрипті. Не думайте, що користувач може читати на англійській мові. Наприклад, у посиланні на Французьку сторінку, 'Французька' має писатися 'français'. Це також використовується, коли ви скеровуєте користувача на специфічну сторінку країни або регіону, наприклад "Німеччина" буде "Deutschland".
Текст в таких мовах, як Арабська, Іврит, Перська і Урду читається справа наліво. Такий порядок читання зазвичай приводить до вирівнювання тексту по правому краю і дзеркального відображення сторінок та макетів таблиць. Ви можете встановити вирівнювання та впорядкування контенту на сторінці за замовчуванням направо або наліво просто включаючи dir="rtl" в html тегах.
Напрямок, заданий в HTML тегах встановлює основний напрямок для документу, який спадає донизу через всі елементи на сторінці. Не варто повторювати атрибут на елементах нижнього рівня, якщо тільки ви не хочете явно змінити спрямований потік.
Вбудований текст, наприклад, в Латинський скрипт досі вирівнюється зліва направо в рамках загального потоку, який вирівнюється справа наліво. Якщо ви працюєте з мовами, які вирівнюються справа наліво, ви повинні бути знайомі з основами двонаправленого алгоритму Unicode. Цей алгоритм піклується про більшу частину цього двонаправленого тексту без необхідності втручання з боку автора. Однак в деяких випадках розмітка або керуючі символи Unicode необхідні для забезпечення правильного ефекту.
Ми нещодавно опублікували сторінку Приступаючи до Роботи, щоб допомогти вам знайти потрібну інформацію на сайті. Ця сторінка вказує на ряд статей, які ознайомлюють новачків із ключовими темами інтернаціоналізації і вказує вам на основну інформацію на сайті.