Поради Інтернаціоналізації для Веб сайту

Кодування. Використовуйте Unicode там де це можливо: для контенту, бази даних і т.д. Завжди призначайте кодування контенту.

Екрановані символи. Коли ви можете використовуйте звичайні символів, а не екрановані (наприклад á á або á).

Мова. Призначення мови документів і вказування внутрішньої зміни мови.

Презентація в порівнянні з контентом. Використання таблиць стилів для презентаційної інформації. Обмеження розмітки семантики.

Зображення, анімації і приклади. Перевірте чи є можливість перекладу і чи немає недоречних культурних упереджень.

Форми. Використання відповідного кодування для форми і сервера. Підтримка місцевих форматів імені / адреси, часу / дати і т.д.

Розробка тексту. Використовуйте простий, лаконічний текст. Будьте уважні при складанні речень, що складаються з декількох рядків.

Навігація. Використовуючи цільову мову включайте на кожній сторінці чітко видну навігацію до локалізованих сторінок або сайтів.

Вирівнювання тексту справа наліво. Для XHTML, додайте dir="rtl" в html теги. Повторно використовуйте його для зміни основного напрямку.

Перевірте свою роботу. Перевіряйте! Використовуйте методи, навчальні посібники та статті на http://www.w3.org/International/

Наступні "Поради" підсумовують ключові концепції Міжнародного Веб Дизайну. Ці поради не є досконалим керуванням, це тільки витяги з концепцій із дочірнього сайту W3C Діяльності Інтернаціоналізації.

На цій сторінці перераховані короткі поради, що також можна переглянути на візитних довідкових картках , які слідують за текстом, що дає більше деталей і пояснень. Коли це можливо ми посилаємось на інформацію на дочірньому вебсайті W3C Інтернаціоналізації, де ви можете прочитати додаткову інформацію.

Ця сторінка буде оновлюватися час від часу.

Поради

Кодування. Використовуйте Unicode там де це можливо: для контенту, бази даних і т.д. Завжди призначайте кодування контенту.

Кодування символів, що ви вибрали визначає, якими символами в тексті будуть відображатися байти.

Зазвичай кодування символів обмежує вас конкретним скриптом або набором мов. Unicode дозволяє вам використовувати майже всі скрипти і мови, які використовуються по всьому світу. Таким чином, Unicode спрощує обробку контенту на декількох мовах, як у межах однієї сторінки, так і на одному або декількох сайтах в цілому. Unicode особливо корисний при використанні у формах, скриптах та базах даних, де часто потрібна підтримка декількох мов. За допомогою Unicode дуже просто додавати нові мови до вашого контенту.

Якщо ви призначили кодування символів, що не відповідає вашому контенту, то, можливо, ваші відвідувачі не зможуть прочитати ваш контент. Це тому, що неправильні припущення можуть бути зроблені в результаті застосування інтерпретації тексту до того, якими символами в тексті будуть відображатися байти.

Дізнатися більше
Кодування символів для початківців пояснює деякі основні поняття про кодуваннями, і чому ви повинні бути уважними. Представлення наборів символів і кодування ознайомлює з різними аспектами теми.
Так, як мені це зробити?
Автори HTML і CSSРозробники специфікаційУстановка сервера
Екрановані символи. Коли ви можете використовуйте звичайні символів, а не екрановані (наприклад á á або á).

Такі екрановані символи, як Чисельні Позначення Символів (NCRs) і Сутності символів використовуються для відтворення будь-якого символу Unicode в розмітці використовуючи тільки символи ASCII. Наприклад, ви можете відобразити символ á у X/HTML як á або á або á.

Ці екрановані елементи корисні для чіткого відображення неоднозначних або невидимих символів, і для запобігання проблем із синтаксисом таких символів, як амперсанди та кутові дужки. Вони також можуть бути корисними в деяких випадках для представлення символів, які не підтримуються вашим кодуванням символів або недоступні на вашій клавіатурі. В іншому випадку ви повинні завжди використовувати звичайні символи, а не екрановані.

Дізнатися більше
Використання символьних сутностей та NCRs надає додаткову інформацію про використання екранованих елементів в мовах розмітки. Зокрема, відзначимо, що треба бути обережним при використанні символьних сутностей (таких як á).
Так, як мені це зробити?
Автори HTML і CSSРозробники специфікаційАвтори SVG
Мова. Призначення мови документів і вказування внутрішньої зміни мови.

Інформація про (людську) мову контенту важлива для доступності, дизайну, пошуку, редагування та інший причин. Оскільки все більше контенту оформлено правильно, то все більш корисними і широко поширеними будуть додатки, що можуть виявити інформацію про мову.

Призначаючи мову, вам необхідно буде відобразити інформацію про конкретні діапазони контенту, по-іншому в метаданих про документ в цілому. Важливо зрозуміти цю особливість.

Дізнатися більше
Мова на Веб сайті ознайомлює з різними аспектами теми.
Так, як мені це зробити?
Автори HTML і CSSАвтори SVGАвтори XMLРозробники схемУстановка сервера
Презентація в порівнянні з контентом. Використання таблиць стилів для презентаційної інформації. Обмеження розмітки семантики.

Дотримування стилю контенту або представлення його окремо від фактичного тексту - є важливими принципами веб-дизайну. Це дозволяє легко застосовувати альтернативні стилі для одного і того ж тексту, наприклад, для відображення однакового контенту, як у звичайному браузері так і на малих ручних пристрях.

Цей принцип особливо корисний для локалізації, тому що різні скрипти мають різні друкарські потреби. Наприклад, через складність Японських символів, краще робити акцент на Японських X/HTML сторінках іншими способами, аніж виділяти їх жирним шрифтом або курсивом. Набагато легше застосовувати такі зміни, якщо подання описується за допомогою CSS, і розмітка набагато чистіша і більш керована, якщо текст написаний правильно і однозначно позначений як 'підкреслений', а не просто 'жирний'.

Під час локалізації можна зберегти багато часу і сил, якщо працювати з файлами CSS замість того, щоб міняти розмітку тому, що будь-що, що потребує змін можна зробити в одній локації для всіх сторінок, і перекладач може зосередитися на контенті, а не на поданні.

Дізнатися більше
Читайте переговорні слайди із 2007 @прес-конференції "Проектування для Іноземних Користувачів: Практичні Поради".
Зображення, анімації і приклади. Перевірте чи є можливість перекладу і чи немає недоречних культурних упереджень.

Якщо ви хочете, щоб ваш контент по-справжньому сполучав вас з людьми, ви повинні говорити їхньою мовою, але не тільки через текст, а й через місцеві образи, колір шкіри, об'єкти і турботи. Легко не помітити специфічну культурну символіку, поведінку, поняття, мову тіла, гумор, і т.д. Ви повинні отримати з країн користувачів відгуки, щодо придатності і актуальності ваших зображень, відео-кліпів, а також отримати приклади.

Коли ви перекладаєте ваш контент, ви повинні звернути увагу на текст, що відноситься до графіки. Фоновий текст або текст в обмеженому просторі може викликати значні проблеми для перекладача. Ви маєте включити графіку до групи локалізації, яка має текст на окремому прошарку, і ви повинні мати на увазі, що більш всього текст в таких мовах, як Англійська і Китайська буде розширюватися при перекладі.

Дізнатися більше
Читайте переговорні слайди із 2007 @прес-конференції "Проектування для Іноземних Користувачів: Практичні Поради".
Форми. Використання відповідного кодування для форми і сервера. Підтримка місцевих форматів імені / адреси, часу / дати і т.д.

Для сторінки HTML, яка містить форму використовується кодування, яке має підтримувати всі символи, які необхідні для введення даних у цій формі. Це особливо важливо, якщо користувачі можуть вводити інформацію на декількох мовах.

Бази даних і скрипти, які отримують дані з форм на сторінках, що опубліковані на декількох мовах також повинні підтримувати символи для всіх цих мов одночасно.

Найпростіший спосіб це дозволить - використовувати Unicode як для сторінок, що містять форми так і для кінцевого процесу та збереження. У такому випадку користувач може заповнити дані на будь-якій мові та скрипті, що йому необхідно.

Не думайте, що такі речі, як ім'я та адрес користувача будуть форматуватися по таким самим правилами, як ваші власні. Вирішіть для себе скільки вам потрібно додати окремих полів для адреси. Майте на увазі, що в деяких культурах немає назв вулиць, в інших номер будинку слідує за назвою вулиці, деяким людям необхідна більше ніж одна лінія для частини адреси, що йде перед назвою населеного пункту і т.д. Насправді в деяких місцях адрес заповнюється зверху вниз від загального до приватного, що припускає дуже різні стратегії складання макета. Будьте обережні при створенні перевірки на правильність кодів або довжини телефонного номеру. Ретельне маркування потрібне для введення номерних дат тому, що використовуються різні значення для відображення дня, місяця та року.

Якщо ви комплектуєте інформацію від людей, з декількох країн, то важливо розробити стратегію надсилання різних форматів, які підходили б цим людям. Це не тільки важливо для дизайну форм, що ви створюєте, а також впливає на те, як ви будете зберігати таку інформацію в базах даних.

Так, як мені це зробити?
Автори HTML і CSSАвтори HTML і CSSРозробники специфікацій
Розробка тексту. Використовуйте простий, лаконічний текст. Будьте уважні при складанні речень, що складаються з декількох рядків.

Простий, лаконічний текст легше перекладати. Крім того такий текст, легше читати людям, які читають не на своїй рідній мові.

Ви маєте бути уважними при складанні повідомлення з декількох підрядків, або при вставці в рядки змінного тексту. Наприклад, припустимо, що ваш сайт використовує JSP скрипти, і ви вирішили скласти певні повідомлення. Ви можете створювати повідомлення об'єднуючи окремі підрядки, такі як 'Тільки' або 'Ні', ' повертати результати у ', та 'будь-який формат' або 'HTML'. Тому що порядок тексту в реченнях інших мов може дуже відрізнятися, його переклад може представляти серйозні труднощі.

Крім того, важливо, уникнути фіксації позицій змінних в тексті, наприклад "1-ша сторінка із 10-ти". В синтаксисі інших мов можливо доведеться змінити цифри для збереження змісту. Якщо ви використовуєте PHP, необхідно буде використовувати такий форматуючий рядок: "Page %1\$d of %2\$d.", а не більш простий "Page %d of %d.". Останній рядок не перекладається в деяких мовах.

Так, як мені це зробити?
Автори HTML і CSS
Навігація. Використовуючи цільову мову включайте на кожній сторінці чітко видну навігації до локалізованих сторінок або сайтів.

Якщо у вас є версії сторінки або сайту на іншій мові, або для іншої країни або регіону, ви повинні забезпечити користувачів можливістю перегляду тої версії, якій вони віддають перевагу. Це повинно бути доступним на будь-якій сторінці вашого сайту, де є така альтернатива.

При наданні посилання на сторінки на інших мовах, використовуйте назву цільової мови на рідній мові та скрипті. Не думайте, що користувач може читати на англійській мові. Наприклад, у посиланні на Французьку сторінку, 'Французька' має писатися 'français'. Це також використовується, коли ви скеровуєте користувача на специфічну сторінку країни або регіону, наприклад "Німеччина" буде "Deutschland".

Так, як мені це зробити?
Автори HTML і CSS
Вирівнювання тексту справа наліво. Для XHTML, додайте dir="rtl" в html теги. Повторно використовуйте його для зміни основного напрямку.

Текст в таких мовах, як Арабська, Іврит, Перська і Урду читається справа наліво. Такий порядок читання зазвичай приводить до вирівнювання тексту по правому краю і дзеркального відображення сторінок та макетів таблиць. Ви можете встановити вирівнювання та впорядкування контенту на сторінці за замовчуванням направо або наліво просто включаючи dir="rtl" в html тегах.

Напрямок, заданий в HTML тегах встановлює основний напрямок для документу, який спадає донизу через всі елементи на сторінці. Не варто повторювати атрибут на елементах нижнього рівня, якщо тільки ви не хочете явно змінити спрямований потік.

Вбудований текст, наприклад, в Латинський скрипт досі вирівнюється зліва направо в рамках загального потоку, який вирівнюється справа наліво. Якщо ви працюєте з мовами, які вирівнюються справа наліво, ви повинні бути знайомі з основами двонаправленого алгоритму Unicode. Цей алгоритм піклується про більшу частину цього двонаправленого тексту без необхідності втручання з боку автора. Однак в деяких випадках розмітка або керуючі символи Unicode необхідні для забезпечення правильного ефекту.

Дізнатися більше
Створення (X)HTML Сторінок на Арабській мові та Івриті ознайомлює з основами текста в HTML, який вирівнюється справа наліво. Ці принципи аналогічні й для інших мовних розміток.
Що вам необхідно знати про двонаправлений алгоритм і вбудовану розмітку ознайомлює з основами обробки вбудованого двонаправленого тексту.
Так, як мені це зробити?
Автори HTML і CSSАвтори SVGАвтори XMLРозробники схем
Перевірте свою роботу. Перевіряйте! Використовуйте методи, навчальні посібники та статті на http://www.w3.org/International/
Try the W3C Internationalization Checker.

Інші вступні матеріали

Ми нещодавно опублікували сторінку Приступаючи до Роботи, щоб допомогти вам знайти потрібну інформацію на сайті. Ця сторінка вказує на ряд статей, які ознайомлюють новачків із ключовими темами інтернаціоналізації і вказує вам на основну інформацію на сайті.