2022.10.25

[ซีรีส์] เข้าใจง่าย! ฟอนต์ในตัว "เรียนรู้เกี่ยวกับชุดอักขระและรหัสอักขระ"

หัวข้อข่าว: ข้อความหลัก:

การแนะนำ

"Easy to Understand! Embedded Fonts" คือบล็อกที่อธิบายพื้นฐานและคำศัพท์เฉพาะของฟอนต์แบบฝังตัว ในฉบับนี้ เราได้สรุปคำอธิบายเกี่ยวกับชุดอักขระและรหัสอักขระ รายการรหัสทั่วไป และประเด็นที่ควรพิจารณาเมื่อพิจารณาฟอนต์

ชุดตัวละคร

ชุดอักขระคือชุดอักขระที่ถูกกำหนดเพื่อให้สามารถแสดงและแลกเปลี่ยนอักขระและสัญลักษณ์บนคอมพิวเตอร์ได้

ชุดอักขระตัวแทน

ชุดตัวอักษรภาษาญี่ปุ่น

มาตรฐานอย่างเป็นทางการ (JIS: มาตรฐานที่กำหนดโดยมาตรฐานอุตสาหกรรมญี่ปุ่น (เดิมเรียกว่ามาตรฐานอุตสาหกรรมญี่ปุ่น))

  • JISX0201: 158 ตัวอักษร (ตัวอักษร JIS ครึ่งความกว้าง)
  • JISX0208: 6,879 ตัวอักษร (JIS ไม่ใช่คันจิ, คันจิระดับ 1/ระดับ 2)
  • JISX0213: 11,223 ตัวอักษร (JISX0208 บวกตัวอักษรคันจิระดับ 3 และ 4)

มาตรฐานที่กำหนดโดยบริษัทหรือองค์กรเฉพาะ

 ชุดอักขระที่กำหนดโดย Adobe Systems สำหรับ DTP ภาษาญี่ปุ่น

  • Adobe-Japan1-3: 9,354 ตัวอักษร
  • Adobe-Japan1-4: 15,444 ตัวอักษร
  • Adobe-Japan1-5: 20,317 ตัวอักษร
  • Adobe-Japan1-6: 23,058 ตัวอักษร

 ชุดอักขระ Windows ของ Microsoft

  • ชุดอักขระมาตรฐานของ Microsoft (Windows31J): 7,881 อักขระ

  JISX0208, JISX0201, อักขระพิเศษของ NEC, อักขระขยาย IBM ที่เลือกโดย NEC, อักขระขยาย IBM
  
*นี่คือชุดอักขระภาษาญี่ปุ่นที่ Morisawa จัดเตรียมไว้สำหรับใช้แบบฝัง

ชุดอักขระภายนอก

อักขระบางตัวไม่ได้รวมอยู่ในข้อกำหนดชุดอักขระมาตรฐาน แต่ได้รับการกำหนดมาตรฐานสำหรับจุดประสงค์เฉพาะ
ด้านล่างนี้คือชุดอักขระภายนอกทั่วไป (อักขระภายนอกของ ARIB) ซึ่งเป็นอักขระภายนอกภาษาญี่ปุ่นที่จำเป็นสำหรับการใช้งานด้านการกระจายเสียงดิจิทัล นอกเหนือจากอักขระที่ระบุในมาตรฐาน JIS และได้รับการกำหนดมาตรฐานโดยสมาคมอุตสาหกรรมและธุรกิจวิทยุ (ARIB)

มาตรฐาน ARIB หลัก

  • ARIB STD-B24: มาตรฐานการเข้ารหัสและการส่งข้อมูลสำหรับการออกอากาศแบบดิจิทัล
  • ARIB STD-B3: มาตรฐานการทำงานสำหรับการออกอากาศมัลติเพล็กซ์ FM
  • ARIB STD-B62: มาตรฐานการเข้ารหัสมัลติมีเดียสำหรับการออกอากาศดิจิทัล

ชุดอักขระภายนอก ARIB

ผลิตภัณฑ์หลัก: ทีวีดิจิตอล เครื่องบันทึก ระบบนำทางรถยนต์ และเครื่องรับสัญญาณออกอากาศดิจิตอลอื่นๆ

การเข้ารหัสอักขระ

รหัสอักขระคือหมายเลขเฉพาะ (รหัสอักขระ) ที่กำหนดให้กับอักขระหรือสัญลักษณ์แต่ละตัวเพื่อจัดการชุดอักขระ (ชุดอักขระ) บนคอมพิวเตอร์
*ชุดอักขระและรหัสอักขระมักเข้าใจและใช้เป็นคำพ้องความหมาย

ต่อไปนี้เป็นรหัสอักขระมาตรฐาน (ASCII 7 บิต) สำหรับการแลกเปลี่ยนข้อมูลที่กำหนดโดย ANSI ซึ่งเป็นมาตรฐานอุตสาหกรรมของสหรัฐอเมริกา เดิมทีเป็นมาตรฐานภายในประเทศสหรัฐอเมริกา แต่ปัจจุบันเป็นมาตรฐานสากล (ISO-646) ที่กำหนดโดยองค์การระหว่างประเทศว่าด้วยการมาตรฐาน (ISO)

ตารางรหัส ASCII

การขาดดุลเรียกว่าอักขระควบคุม และเป็นอักขระที่กำหนดในรหัสอักขระที่ใช้เพื่อควบคุมการทำงานของอุปกรณ์แสดงผล เช่น จอแสดงผล เครื่องพิมพ์ และอุปกรณ์สื่อสาร แม้ว่าจะเรียกว่า "อักขระ" แต่ก็ถูกเรียกว่าอักขระที่ไม่ใช่การพิมพ์ด้วยเช่นกัน เนื่องจากไม่ได้แสดงผลบนจอแสดงผลหรือเครื่องพิมพ์

รหัสอักขระ 1 ไบต์

อักขระที่แสดงด้วยข้อมูล 1 ไบต์ (8 บิต: 0-255) ตัวอย่างที่เป็นตัวแทน ได้แก่ JISX0201 (อักขระ ANK) ซึ่งเป็นส่วนขยายของ ASCII ซึ่งประกอบด้วยตัวเลขและตัวอักษร และมีอักขระแบบครึ่งความกว้างของญี่ปุ่น และ ISO8859 ซึ่งประกอบด้วยภาษายุโรป และใช้สำหรับภาษาที่มีชนิดอักขระจำนวนน้อย

ตารางรหัสอักขระ JISX0201

รหัสอักขระแบบไบต์คู่

อักขระที่แทนด้วยข้อมูลสองไบต์ (16 บิต: 0 ถึง 65,535) ใช้ในภาษาต่างๆ เช่น ญี่ปุ่น จีน และเกาหลี ซึ่งมีอักขระจำนวนมากและไม่สามารถแสดงเป็นไบต์เดียว (0 ถึง 255) ได้

ตารางรหัสอักขระ JISX0208

รหัสอักขระตัวแทน

กะ JIS

รหัสอักขระที่จัดเรียงใหม่ (เลื่อน) JIS X 0208 เพื่อจัดการอักขระแบบผสมไบต์คู่และไบต์เดี่ยว

ยูนิโค้ด

รหัสอักขระที่ออกแบบมาเพื่อจัดการอักขระจากทั่วโลกเป็นชุดอักขระทั่วไป
 *เวอร์ชันล่าสุด 15.0.0 (กันยายน 2022): มี 149,186 อักขระ
วิธีการเข้ารหัสต่อไปนี้เป็นวิธีทั่วไป:
UTF8: วิธีการเข้ารหัสที่แสดงเป็นหน่วย 8 บิต (ความยาวแปรผันตั้งแต่ 1 ถึง 4 ไบต์)
UTF16: วิธีการเข้ารหัสที่แสดงเป็นหน่วย 16 บิต (ความยาวคงที่ 2 ถึง 4 ไบต์)

GB2312

รหัสตัวอักษรจีนแบบย่อ
ใช้ในประเทศจีน (จีนแผ่นดินใหญ่)

GB18030

รหัสตัวอักษรจีน
ประกอบไปด้วยอักขระจีนตัวย่อและตัวเต็ม รวมถึงอักขระจีนที่ใช้ในญี่ปุ่นและเกาหลี และรวมถึง GB2312

บิ๊ก5

รหัสตัวอักษรจีนดั้งเดิม
ใช้ในไต้หวัน ฮ่องกง และมาเก๊า

เคเอสเอ็กซ์1001

รหัสตัวอักษรเกาหลี
รวมถึงฮันกึลและฮันจา

■ หน้าโค้ด

รหัสอักขระจัดเรียงตามภาษา สลับหน้ารหัสเพื่อใช้แต่ละภาษา
เมื่อคอมพิวเตอร์ยังไม่ได้รับการพัฒนามากนัก ยังไม่สามารถที่จะจัดการตัวละครทั้งหมดในโลกได้ในที่เดียว จึงต้องบันทึกแยกกันสำหรับแต่ละภาษา

ISO/IEC 8859: รหัสอักขระแบบไบต์เดียวทั่วไป กำหนดภาษายุโรปเป็นหลัก

ISO8859-1 (ละติน1)อังกฤษ/เยอรมัน/ฝรั่งเศส/อิตาลี/สเปน/โปรตุเกส/
ดัตช์/เดนมาร์ก/สวีเดน/นอร์เวย์/ฟินแลนด์
อินเดีย/ไอซ์แลนด์/ไอริช/แอลเบเนีย ฯลฯ
ISO8859-2 (ละติน2)โครเอเชีย/เช็ก/สโลวัก/สโลวีเนีย/ฮังการี
โปแลนด์/โรมาเนีย ฯลฯ
ISO8859-3 (ละติน3)เอสเปรันโต/มอลตา ฯลฯ
ISO8859-4 (ละติน4)เอสโตเนีย/ลัตเวีย/ลิทัวเนีย ฯลฯ
ISO8859-5 (ซีริลลิก)รัสเซีย/ยูเครน/เซอร์เบีย/บัลแกเรีย/เบลารุส
/มาซิโดเนีย ฯลฯ
ISO8859-6 (อาหรับ)ภาษาอาหรับ
ISO8859-7 (กรีก)กรีก
ISO8859-8 (ภาษาฮีบรู)ภาษาฮีบรู
ISO8859-9 (ละติน5)ตุรกี
ISO8859-10 (ละติน6)เอสกิโม/กรีนแลนด์/ซามิ/แลปพิช ฯลฯ
ไอเอสโอ8859-11แบบไทย
ISO8859-14 (ละติน8)เวลส์/เกลิก/เซลติก ฯลฯ

WindowsCodePage (CP): กำหนดโดย Microsoft เพื่อใช้กับ Windows

CP932ภาษาญี่ปุ่น (ShiftJIS)
ซีพี936ภาษาจีนตัวย่อ (GB2312)
ซีพี949เกาหลี (KSC5601:1987)
ซีพี950จีนดั้งเดิม (Big5)
ซีพี1252อังกฤษ/เยอรมัน/ฝรั่งเศส/อิตาลี/สเปน/โปรตุเกส/ดัตช์/
สวีเดน/ฟินแลนด์/เดนมาร์ก/นอร์เวย์ ฯลฯ
*ISO8859-1 มีอักขระเพิ่มเติมบางตัว เช่น สัญลักษณ์ "€"
ซีพี1250เช็ก, สโลวัก/โปแลนด์/โรมาเนีย/ฮังการี/สโลวีเนีย
ภาษาโครเอเชียน ฯลฯ
ซีพี1251รัสเซีย/ยูเครน/เซอร์เบีย/บัลแกเรีย/เบลารุส/มาซิโดเนีย
ฯลฯ
ซีพี1253กรีก
ซีพี1255ภาษาฮีบรู
ซีพี1256ภาษาอาหรับ
ซีพี1257เอสโตเนีย/ลัตเวีย/ลิทัวเนีย ฯลฯ
ซีพี1258เวียดนาม
CP874แบบไทย

การเข้ารหัส

หมายถึงการแปลงข้อมูลตามกฎเกณฑ์บางประการ และในกรณีนี้ หมายถึงการกำหนดรหัสอักขระเฉพาะให้กับอักขระแต่ละตัว

เมื่อพิจารณาแบบอักษร โปรดตรวจสอบภาษา ชุดอักขระ และรหัสอักขระที่คุณต้องการ

  • ภาษาที่ต้องการ (ประเทศที่รองรับ): [ตัวอย่าง] ญี่ปุ่น, อังกฤษ, เยอรมนี, ฝรั่งเศส
  • ชุดอักขระที่จำเป็น: [ตัวอย่าง] JISX0208, ISO8859-1
  • รหัสอักขระ: [ตัวอย่าง] Unicode (UTF16)

ชุดอักขระที่จำเป็นอาจแตกต่างกันไป ขึ้นอยู่กับวิธีที่คุณใช้บริการ เช่น คุณป้อนข้อมูลเมื่อใช้งานหรือไม่ ดังนั้น โปรดติดต่อเราเพื่อขอข้อมูลเพิ่มเติมเกี่ยวกับการใช้งานเฉพาะของคุณ


นี่เป็นการสรุปคำอธิบายเรื่องชุดอักขระและรหัสอักขระของเรา
หากคุณมีคำถามใดๆ โปรดติดต่อเราโดยตรงทางอีเมล

ติดต่อ
แผนกนวัตกรรมการขายของบริษัท Morisawa Corporation salesinnovation@morisawa.co.jp