Accesskey n ใช้เพื่อข้ามไปยัง หน้าในของ navigation. ข้ามไปยังส่วนเริ่มต้นของเนื้อหา
เอกสารฉบับนี้เป็นเอกสารฉบับแปลในกรณีที่มีข้อมูลไม่ตรงกันหรือมีข้อบกพร่อง เอกสารดั้งเดิมฉบับภาษาอังกฤษ จะถือว่าเป็นฉบับที่เป็นทางการ ลิขสิทธิ์ดั้งเดิม เป็นของ W3C, ดังที่แสดงไว้ข้างล่าง
ผู้แปล: ลาวัณย์ นันทโววาทย์ (Lawan Nuntavovat), WebStarThai
กลุ่มเป้าหมาย:ใครก็ตามที่ต้องการบทสรุปสั้นๆเกี่ยวกับข้อมูลสำคัญที่เกี่ยวข้องกับ การ encode ภาษาใน HTML และ XML สำหรับข้อมูลเพิ่มเติมสามารถอ่านได้จาก ลิงค์ในบทความหรือในส่วนอ่านเพิ่มเติม
ชุดตัวอักษรที่ใช้ในเอกสารสำหรับ XML และ HTML 4.0 เป็น Unicode (ซึ่งก็คือ ISO 10646) นั่นหมาย ความว่า browser ที่อ่าน html และ xml ควรจะมีการใช้ Unicode ได้ในตัว Butแต่ไม่ได้ หมายความว่าเอกสารทุกเอกสารต้องมีการแปลงค่าเป็น Unicode Asตราบใดก็ตามที่ client และ server สามารถ encode ได้ตรงกัน ทั้ง client และ server สามารถ encode ภาษาใดๆก็ตาม ที่แปลงค่าเป็น unicode ได้ อ่านเพิ่มเติมเกี่ยวกับ ชุดตัวอักษรที่ใช้ในเอกสาร
การแสดงการ encode ในเอกสาร XML หรือ (X)HTML อย่างชัดเจนนั้นมีความสำคัญอย่าง ยิ่งเพื่อที่ client สามารถแปลงค่าการ encode นี้เป็น unicode ได้อย่างง่ายดาย ซึ่งสามารถ ทำได้ด้วยวิธีดังต่อไปนี้
กำหนดค่า 'charset' ไว้ในส่วน Content-Type header of HTTP ดังตัวอย่าง
Content-Type: text/html; charset=utf-8วิธีการนี้เราจะต้องเข้าไปกำหนดใน server หรือ กำหนดในเอกสารโดยการใส่ script (อ่าน เพิ่มเติมได้ในเรื่อง การกำหนดค่า HTTP charset )
สำหรับ XML (ซึ่งรวมถึง XHTML), ให้ใช้การ encode ด้วย pseudo-attributeในการประกาศ ค่า XML ในส่วนเริ่มต้นของเอกสารหรือการประกาศค่าtextในส่วนเริ่มต้นของ entityดังตัวอย่าง
<?xml version="1.0" encoding="utf-8" ?> มี ประเด็นที่สำคัญ ที่ควรระวังเมื่อใช้ XHTML 1.0 เป็น HTML
สำหรับ HTML หรือ XHTML ที่ใช้เป็น HTML เราควรจะใช้ <meta> ในส่วน <head>; เสมอ ดังตัวอย่าง
<meta http-equiv="Content-Type" content="text/html;charset=utf-8" >สำหรับ XHTML ต้องใส่เครื่องหมายทับ(slash)ในส่วนท้ายดังนี้
<meta http-equiv="Content-Type" content="text/html;charset=utf-8" />สำหรับข้อถกเถียงว่าวิธีการใดดีที่สุดสำหรับเอกสาร (X)HTML ประเภทใดให้ดูในคำแนะนำในส่วน ชุดตัวอักษรและการ encode ใน XHTML, HTML และ CSS
ตัวอย่างที่กล่าวมาข้างต้นเป็นการแสดงการประกาศค่าเนื้อหาที่ encode ใน UTF-8ซึ่งน่าจะเป็น
ทางเลือกที่ดีที่สุดสำหรับจุดประสงค์ในการนำไปใช้โดยรวม แต่ไม่ได้เป็นเพียงทางเลือกเดียวเท่านั้น
หากไม่ได้มีการใช้ UTF-8 เราควรจะแทนที่ตัวอักษร utf-8 จากตัวอย่างข้างต้นด้วยชื่อที่เราเลือกใช้ ในการ encode
สามารถดูรายชื่อทั้งหมดได้จาก ชื่อที่ใช้ในการ encode ตัวอักษรที่มีการจดทะเบียน โดย IANA
(หน้ามีความยาว) ในทางปฏิบัติมีเพียงการ encode บางวิธีเท่านั้นที่นิยมใช้ส่วนใหญ่คือ ISO-8859-1 (Latin-1), US-ASCII,
UTF-16, และการ encode วิธีอื่นๆในชุด ISO-8859 iso-2022-jp euc-kr และอื่นๆ
มีความสำคัญยิ่งที่จะไม่ใช้การประกาศค่าการ encode ข้างต้นแต่เพียงในส่วน HTTP หรือเนื้อหาเท่านั้น แต่ยังรวมถึง
การเซฟข้อมูลในการ encode ที่เหมาะสมในส่วนที่ต้องมีการปรับปรุงแก้ไข
ตรวจสอบว่าไม่มีข้อขัดแย้งระหว่างการประกาศค่าในเอกสารและการแปลงค่าอัตโนมัติบน server เนื่อง การกำหนดค่าของ server จะลบการประกาศค่าที่มีอยู่ในเอกสาร
สำหรับข้อมูลเพิ่มเติมเกี่ยวกับหัวข้อต่างๆเหล่านี้ให้ดูจากลิงค์ในส่วน การเปลี่ยนแปลงการ encode หน้า (X)HTML เป็น UTF-8 แม้ว่าบทความดังกล่าวจะเขียนจากแง่มุมของการใช้ UTF-8 แต่สามารถนำมา ประยุกต์ใช้ได้กับการ encode ทุกภาษา
สามารถตรวจสอบค่า values สำหรับ attribute ของการ encode ได้จาก IANA registry ควรจำไว้ว่า ค่าเหล่านี้คือชื่อ charset แม้ว่าในความเป็นจริงแล้วจะหมายถึงการ encode ไม่ใช่ชุดตัวอักษร
ถ้าต้องการทราบข้อมูลโดยละเอียดที่เกี่ยวข้องกับ'charset', สามารถดูได้จากบทความของ Dan Connolly ("Character Set" Considered Harmful) และคำตอบโดย Glenn Adams (Character Set Terminology, SC2 vs. SC18 vs. Internet Standards).
ข้อควรจำ: Rick Jellife เสนอให้ใช้ SPREAD entities จาก ERCS.
บอกเราด้วยว่าคุณคิดอย่างไร (ภาษาอังกฤษ)
แปลมาจากบทความภาษาอังกฤษลงวันที่ 2006-07-20. เวอร์ชั่นแปลฉบับที่เปลี่ยนแปลงลครั้งล่าสุด 2011-01-26 20:10 GMT
สำหรับการเปลี่ยนแปลงเอกสารเก่า, ค้นหา article-o-charset ในบล๊อก i18n
Copyright © 31 May, 1996-2011 W3C® (MIT, ERCIM, Keio, Beihang), All Rights Reserved. W3C liability, trademark, document use and software licensing rules apply. Your interactions with this site are in accordance with our public and Member privacy statements.