W3C logo
slanted W3C logo

Cover page images (keys)

Webの国際化

佐々木 フェリクス, <fsasaki@w3.org>

スライド

http://www.w3.org/2007/Talks/0621-sfc-lecture-i18n/

概要

国際化「Internationalization」の趣旨

国際化とローカリゼーションの一例

国際化「Internationalization」の趣旨(続き)

概要

Webの国際化の対象

Webの国際化の対象(続き)

文字とは

文字は書き言葉の最も小さい部分。それに関連する概念は

文字の国際化の基「Unicode」

文字符号化方式とは

重要な文字符号化方式

文字集合

文字の処理

U+00E7 `ç` = U+0063 `c` U+0327 `¸`?

文字の処理

Strasse = Straße?
compare
('Strasse', 'Straße','http://example.com/collation-identifier/German')

国際化の対象「URI」

http://ja.wikipedia.org/wiki/文字
http://ja.wikipedia.org/wiki/%E6%96%87%E5%AD%97

テキストの表示について「ルビ」

<ruby>
 <rb>慶應義塾大学</rb>
 <rt>けいおうぎじゅくだいがく</rt>
</ruby>
ルビのプレゼンテーション

テキストの表示「テキストの方向性」

A)english1 HEBREW2 english3 HEBREW4 english5 HEBREW6
B)english1 2WERBEH english3 4WERBEH english5 6WERBEH
           <------          <------          <------
               H                H                H
  ------------------------------------------------->
                          E

テキストの組版

言語の識別の目的

言語によるglyphの違いの例(繰り返し)

<p xml:lang="zh-CN" lang="zh-CN">雪 zh-CN</p> 
<p xml:lang="zh-TW" lang="zh-TW">雪 zh-TW</p> 
<p xml:lang="zh-HK" lang="zh-HK">雪 zh-HK</p> 
<p xml:lang="ja" lang="ja">雪 ja</p> 
<p xml:lang="ko" lang="ko">雪 ko</p>

雪 zh-CN

雪 zh-TW

雪 zh-HK

雪 ja

雪 ko

言語識別の標準「BCP 47」

langtag = (language
 ["-" script]
 ["-" region]
 *("-" variant)
 *("-" extension)
 ["-" privateuse])
File-Date: 2006-04-19
%%
Type: language
Subtag: aa
Description: Afar
Added: 2005-10-16
%%
Type: variant
Subtag: 1901
Description: Traditional German orthography
Added: 2005-10-16
Prefix: de
%%

言語タグの例

タグ「sub tag」の構造趣旨
enlanguage英語
de-ATlanguage-regionオーストリアで使用されるドイツ語
de-CH-1901language-region-variantスイスで使用されるドイツ語で、1901年の正書法
sr-Cyrllanguage-scriptキリル文字でセルビア語

言語タグのマッチ

de-*-DEで検索できる言語タグ

ロケールについて

言語はロケールの主な要素だが…

言語とロケールの違い

国際化とローカリゼーションの一例(繰り返し)

国際化の対象:Web Service

XMLの国際化

まとめ(1)

まとめ(2)

ITSをXML文書の中で適用「local」

<help xmlns:its="http://www.w3.org/2005/11/its" its:version="1.0"> [...]
  <p>To re-compile all the modules of the Zebulon toolkit you need to go in the
    <path
     its:translate="no">\Zebulon\Current Source\binary</path> directory.
    Then from there, run batch file 
<cmd its:translate="no">Build.bat</cmd>.</p> [...]
</help>

ITSをXML文書以外で適用「global」(1)

<its:rules version="1.0">
 <its:translateRule selector="//path | //cmd" translate="no"/>
</its:rules>
<help> [...]
  <p>To re-compile all the modules of the Zebulon toolkit you need to go in the
    <path>\Zebulon\Current Source\binary</path> directory.
    Then from there, run batch file 
<cmd>Build.bat</cmd>.</p> [...]
</help>

ITSをXML文書以外で適用「global」(2)

<its:rules xmlns:its="http://www.w3.org/2005/11/its" version="1.0">
 <its:langRule selector="//*[@langinfo] langInfoPointer="@langInfo"/>
</its:rules>

"Terminology"の一例

<doc its:version="1.0" xmlns:its="http://www.w3.org/2005/11/its">
 <section xml:id="S001">
  <par>A <kw its:term="yes" 
its:termInfoRef="http://en.wikipedia.org/wiki/Motherboard">motherboard</kw>,
also known as a <kw its:term="yes">logic <span its:term="yes">board</span></kw> on
Apple Computers, is the primary circuit board making up a modern computer.</par>
 </section> 
</doc>

"Elements within Text"の一例

<doc>
 <head>
  <its:rules version="1.0" xmlns:its="http://www.w3.org/2005/11/its">
   <its:withinTextRule withinText="yes" selector="//b|//u|//i"/>
   <its:withinTextRule withinText="nested" selector="//fn"/>
  </its:rules>
 </head>
 <body>
  <p>This is a paragraph with <b>bold</b>, <i>italic</i>, and <u>underlined</u>.</p>
  <p>This is a paragraph with a footnote
<fn>This is the text of the footnote</fn> at the middle.</p>
 </body>
</doc>

ルビの一例

<text xmlns:its="http://www.w3.org/2005/11/its">
 <head> ... 
   <its:rules version="1.0">
   <its:rubyRule selector="/text/body/img[1]/@alt">
    <its:rubyText>World Wide Web Consortium</its:rubyText>
   </its:rubyRule>
  </its:rules>
 </head>
 <body>
  <img src="w3c_home.png" alt="W3C"/> ...
  </body>
</text>

ITSの適用分野

Webの国際化の対象(復習)

Webの国際化の対象(復習)

概要

Webの国際化の現状と将来

http://www.paypal.com
/book[@number="1"]//editor ftcontains "salon de the"
with default stop words language "fr"

宿題

下記の分野の一つを選んで、国際化が必要な例を紹介てください。

標準にある特徴も、まだない特徴(例えば組み版に関する分野)もOKです

リンク