เมื่อภาษาไทยกลายเป็น ?????????
คัดลอกจากhttp://www.phpconcept.com/
ผมเคยติดตั้งและใช้งาน PHP และ MySQL มาหลายครั้งหลายหน ไม่ว่าจะเป็นการติดตั้งบน Linux หรือ Windows ทั้งที่ Compile เองและติดตั้งแบบ package ซึ่งการติดตั้งบน Windows ดูจะติดตั้งอย่างสะดวกและรวดเร็วมากขึ้น เพราะมีผู้ทำโปรแกรมช่วยติดตั้ง Apache PHP และ MySQL อัตโนมัติ เช่น AppServ (www.appservnetwork.com) และ XAMPP (http://www.apachefriends.org/en/index.html) เป็นต้น
แต่คราวนี้ผมเจอปัญหาหลังจากการติดตั้ง Apache PHP และ MySQL บนระบบปฏิบัติการ Windows เพราะเมื่อทดลอง query ข้อมูลที่เป็นภาษาไทยจาก MySQL กลับพบว่าได้ผลลัพธ์ในการแสดงผลภาษาไทยที่ไม่ถูกต้อง คือตัวอักษรภาษาไทยจะแสดงออกมาเป็นเครื่องหมายคำถาม (?) ทั้งหมด ในขณะที่ผมได้เพิ่ม option ที่เกี่ยวกับการ set character ให้เป็นภาษาไทยใน my.ini แล้ว ดังตัวอย่างต่อไปนี้
[mysqld]
default-character-set=tis620
หลังจากที่ได้ทำการตรวจสอบแล้วในฐานข้อมูล MySQL โดยใช้โปรแกรม เช่น MySQL-Front (http://www.mysqlfront.de/) แล้วก็พบว่าข้อมูลที่เก็บอยู่ก็เป็นภาษาไทยถูกต้อง และเมื่อลองดูตัวแปรต่างๆ ที่เกี่ยวข้องกับ character ต่างๆ ก็พบค่าต่อไปนี้
เมื่อลองไปค้นในเว็บไซท์ของ MySQL ในส่วนที่เกี่ยวข้องกับกลุ่มอักขระ (character set) ก็พบส่วนที่เกี่ยวข้องกับกลุ่มอักขระ ใน Chapter 10. Character Set Support (http://dev.mysql.com/doc/mysql/en/charset.html) ซึ่งได้อธิบายความหมายของ Character set ไว้ว่าคือ กลุ่มของสัญลักษณ์และการ encode อักขระต่างๆ ส่วน collation หมายถึง กลุ่มของกฎเกณฑ์ที่ใช้ในการเปรียบเทียบอักขระต่างๆ ใน กลุ่มอักขระหนึ่งๆ สำหรับภาษาไทยมีกลุ่มอักขระคือ tis620 และมี collation คือ tis620_thai_ci
ทั้งนี้ระดับการใช้งานของ charcter set และ collation มีอยู่ด้วยกันทั้งหมด 4 ระดับคือ server database table และ connection สำหรับปัญหาที่ผมเจอนี้ ผมมุ่งประเด็นไปที่ connection โดยตั้งสมมติฐานว่าปัญหาของการแสดงผลภาษาไทยที่ผิดพลาดน่าจะเกิดระหว่างการติดต่อระหว่าง client (php script) กับ server (MySQL server)
สิ่งที่เกิดขึ้นระหว่างการติดต่อระหว่าง client และ server คือ client จะส่ง SQL statement เช่น query ต่างๆ ให้กับ server หลังจากนั้น server ก็จะตอบกลับ เช่น การส่งผลลัพธ์ของ SQL statement นั้นๆ กลับไปให้ client ในระหว่างที่มีการติดต่อกันนี้จะมีส่วนของ character set และ collation เข้ามาเกี่ยวข้อง คือ
Character set ของ client ในขณะที่ส่ง query ให้กับ server: มีตัวแปรที่เกี่ยวข้องคือ character_set_client
Character set ที่ server แปล query หลังจากที่ได้รับจาก client: ตัวแปรที่เกี่ยวข้องคือ character_set_connection และ collation_connection โดย server จะใช้ค่าของตัวแปร character_set_connection ในการแปล character set ของ query ที่ client ส่งมา ( character_set_client) ให้เป็นตามค่าที่กำหนดไว้ในตัวแปร character_set_connection
Character set ที่ server จะทำการแปลก่อนที่จะส่งผลลัพธ์กลับไปให้แก่ client: ตัวแปรที่เกี่ยวข้องคือ character_set_results
SET NAMES 'tis620' ซึ่งมีค่าเทียบเท่ากับ
SET character_set_client='tis620'
SET character_set_results='tis620'
SET character_set_connection='tis620'
SET chracter_set_results=NULL ซึ่งมีความหมายคือ ไม่ต้องการให้ server ทำการแปลงข้อมูลก่อนที่จะทำการส่งให้กับ client
สรุปแล้วปัญหาที่เกิดขึ้นน่าจะเกิดจากค่าของตัวแปร character_set_results ซึ่งถูกกำหนดให้เป็น character set ที่ไม่ใช่ tis620 ทำให้อักขระภาษาไทยที่ส่งกลับมาให้ client นั้นแสดงผลไม่ถูกต้อง วิธีการแก้ปัญหาของผมในขณะนี้คือ ต้องแทรกคำสั่งที่กำหนดให้ character_set_results เป็น tis620 ก่อนที่จะทำการส่ง query จริงๆ ไปให้แก่ MySQL ผมเองค่อนข้างงงว่าเหตุใดการกำหนดคำสั่ง default-character-set=tis620 ไม่สามารถแก้ปัญหานี้ได้ หากมีคำแนะนำหรือมีข้อเสนอแนะสามารถเขียนแจ้งมาได้นะครับที่ webmaster [a] phpconcept.com