この文書は他の言語やスクリプトによる例を含んでいるかもしれません。

ページ内のどこにいても、アクセスキー "n" を使えば文書内のナビゲーションリンクにジャンプできます。ここでは以下のいずれかを行なうことができます:

本文書は http://www.w3.org/ International/ O-charset.en.html を翻訳したものです。
本文書には翻訳上の誤りが含まれる可能性があります。正式な版は上記の英語版です。
原著作権は下記の通り W3C に帰属します。

W3C ホームページへ移動Architecture ドメインのホームページへ移動  国際化 
 

文字符号化

文書文字集合

XML および HTML 4.0 の文書文字集合は Unicode (別名 ISO 10646) です。 これは、HTML ブラウザや XML プロセッサは、(たとえ実際には違っても) 内部的に Unicode を使っているかのように振舞うべきということです。しかし、これは文書は Unicode として常に送信されねばならない、ということではありません。 クライアントとサーバ間で符号化方式の合意がある限り、 Unicode に変換可能であればどのような符号化でも使うことができます。

符号化の宣言

どのような XML あるいは (X)HTML 文書でも、文字符号化が明確にラベル付けされていることは極めて重要です。これは以下のような方法で行なうことができます:

この情報により、クライアントはこれらの符号化を Unicode に容易にマッピングできます。 実際には、以下のようないくつかの符号化がよく使われるでしょう: UTF-8ISO-8859-1 (Latin-1)、US-ASCIIUTF-16、ISO-8859 シリーズの他の符号化、ISO-2022-JP, EUC-KR、など

Tell us what you think

Was this useful?
Poor Excellent

I am a:




インターネットで使われている charset パラメータ値のリスト

  1. IANA に登録されている charset 値の全リスト (長文)
  2. 興味深いテストページ: 第10回 Unicode 会議
  3. RFC 3629 は UTF-8 を定義しています。

用語に関してさらに詳しく知りたければ、Dan Connolly による ("Character Set" Considered Harmful) という記事、およびそれに対する Glenn Adams の反応 (Character Set Terminology, SC2 vs. SC18 vs. Internet Standards) が論点を解説するのに役立つでしょう。

歴史的な覚書: Rick Jellife は ERCS の SPREAD 実体を使うことを提案しました。

著者: マーティン J. テュールスト (Martin J. DÜRST), W3C. 翻訳: 石川 雅康 (Masayasu ISHIKAWA, W3C.)

XHTML 1.0 valide
CSS valide
Codé en UTF-8

2004年4月20日に更新された英語版に基づく翻訳; 日本語版の最終更新: 2004-07-30 11:16 GMT

For a summary of significant changes, search for o-charset in the change log.