Accesskey n ใช้เพื่อข้ามไปยัง หน้าในของ navigation. ข้ามไปยังส่วนเริ่มต้นของเนื้อหา

เอกสารฉบับนี้เป็นเอกสารฉบับแปลในกรณีที่มีข้อมูลไม่ตรงกันหรือมีข้อบกพร่อง เอกสารดั้งเดิมฉบับภาษาอังกฤษ จะถือว่าเป็นฉบับที่เป็นทางการ ลิขสิทธิ์ดั้งเดิม เป็นของ W3C, ดังที่แสดงไว้ข้างล่าง

ผู้แปล: ลาวัณย์ นันทโววาทย์ (Lawan Nuntavovat), WebStarThai

s_gotoW3cHome Internationalization
 

การ encode ภาษา

กลุ่มเป้าหมาย:ใครก็ตามที่ต้องการบทสรุปสั้นๆเกี่ยวกับข้อมูลสำคัญที่เกี่ยวข้องกับ การ encode ภาษาใน HTML และ XML สำหรับข้อมูลเพิ่มเติมสามารถอ่านได้จาก ลิงค์ในบทความหรือในส่วนอ่านเพิ่มเติม

ชุดตัวอักษรที่ใช้ในเอกสาร

ชุดตัวอักษรที่ใช้ในเอกสารสำหรับ XML และ HTML 4.0 เป็น Unicode (ซึ่งก็คือ ISO 10646) นั่นหมาย ความว่า browser ที่อ่าน html และ xml ควรจะมีการใช้ Unicode ได้ในตัว Butแต่ไม่ได้ หมายความว่าเอกสารทุกเอกสารต้องมีการแปลงค่าเป็น Unicode Asตราบใดก็ตามที่ client และ server สามารถ encode ได้ตรงกัน ทั้ง client และ server สามารถ encode ภาษาใดๆก็ตาม ที่แปลงค่าเป็น unicode ได้ อ่านเพิ่มเติมเกี่ยวกับ ชุดตัวอักษรที่ใช้ในเอกสาร

การประกาศค่า encoding

การแสดงการ encode ในเอกสาร XML หรือ (X)HTML อย่างชัดเจนนั้นมีความสำคัญอย่าง ยิ่งเพื่อที่ client สามารถแปลงค่าการ encode นี้เป็น unicode ได้อย่างง่ายดาย ซึ่งสามารถ ทำได้ด้วยวิธีดังต่อไปนี้

สำหรับข้อถกเถียงว่าวิธีการใดดีที่สุดสำหรับเอกสาร (X)HTML ประเภทใดให้ดูในคำแนะนำในส่วน ชุดตัวอักษรและการ encode ใน XHTML, HTML และ CSS

ตัวอย่างที่กล่าวมาข้างต้นเป็นการแสดงการประกาศค่าเนื้อหาที่ encode ใน UTF-8ซึ่งน่าจะเป็น ทางเลือกที่ดีที่สุดสำหรับจุดประสงค์ในการนำไปใช้โดยรวม แต่ไม่ได้เป็นเพียงทางเลือกเดียวเท่านั้น

หากไม่ได้มีการใช้ UTF-8 เราควรจะแทนที่ตัวอักษร utf-8 จากตัวอย่างข้างต้นด้วยชื่อที่เราเลือกใช้ ในการ encode สามารถดูรายชื่อทั้งหมดได้จาก ชื่อที่ใช้ในการ encode ตัวอักษรที่มีการจดทะเบียน โดย IANA (หน้ามีความยาว) ในทางปฏิบัติมีเพียงการ encode บางวิธีเท่านั้นที่นิยมใช้ส่วนใหญ่คือ ISO-8859-1 (Latin-1), US-ASCII, UTF-16, และการ encode วิธีอื่นๆในชุด ISO-8859 iso-2022-jp euc-kr และอื่นๆ

วิธีการตรวจสอบว่าการประกาศค่าได้ผล

มีความสำคัญยิ่งที่จะไม่ใช้การประกาศค่าการ encode ข้างต้นแต่เพียงในส่วน HTTP หรือเนื้อหาเท่านั้น แต่ยังรวมถึง

สำหรับข้อมูลเพิ่มเติมเกี่ยวกับหัวข้อต่างๆเหล่านี้ให้ดูจากลิงค์ในส่วน การเปลี่ยนแปลงการ encode หน้า (X)HTML เป็น UTF-8 แม้ว่าบทความดังกล่าวจะเขียนจากแง่มุมของการใช้ UTF-8 แต่สามารถนำมา ประยุกต์ใช้ได้กับการ encode ทุกภาษา

นอกจากนี้

สามารถตรวจสอบค่า values สำหรับ attribute ของการ encode ได้จาก IANA registry ควรจำไว้ว่า ค่าเหล่านี้คือชื่อ charset แม้ว่าในความเป็นจริงแล้วจะหมายถึงการ encode ไม่ใช่ชุดตัวอักษร

ถ้าต้องการทราบข้อมูลโดยละเอียดที่เกี่ยวข้องกับ'charset', สามารถดูได้จากบทความของ Dan Connolly ("Character Set" Considered Harmful) และคำตอบโดย Glenn Adams (Character Set Terminology, SC2 vs. SC18 vs. Internet Standards).

ข้อควรจำ: Rick Jellife เสนอให้ใช้ SPREAD entities จาก ERCS.

บอกเราด้วยว่าคุณคิดอย่างไร (ภาษาอังกฤษ)

ลงทะเบียนรับข่าวสาร RSS ฟีด

เว็บใหม่

โฮมเพจรายงานข่าว

Twitter (โฮมเพจรายงานข่าว)

‎@webi18n

อ่านเพิ่มเติม

ข้อแนะนำเบื้องต้นที่มีประโยชน์

ข้อมูลอ้างอิงในรายละเอียด

ลิงค์อื่นๆ

ผู้แต่ง: Bert Bos, W3C ปรับปรุงโดย: Martin J. Dürst, W3C; Richard Ishida, W3C ผู้แปล: ลาวัณย์ นันทโววาทย์ (Lawan Nuntavovat), WebStarThai

XHTML 1.0!ที่อ่านค่าได้
CSS! ที่อ่านค่าได้
ได้รับการแปลงโคดเป็น UTF-8! แล้ว

แปลมาจากบทความภาษาอังกฤษลงวันที่ 2006-07-20. เวอร์ชั่นแปลฉบับที่เปลี่ยนแปลงลครั้งล่าสุด 2011-01-26 20:10 GMT

สำหรับการเปลี่ยนแปลงเอกสารเก่า, ค้นหา article-o-charset ในบล๊อก i18n