大家都知道從 MySQL4.1 版本開始,支持多種編碼,包括我們熟知的 latin1、gbk、utf8、big5 等等,還有一些我們聞所未聞的。
在使用 PHP 連接 MySQL 查詢出來的數據有的時候居然會是亂碼,關于亂碼的解決首先我們要了解 MySQL 的編碼機制。
拿 Discuz! 論壇為例,Discuz! 論壇在連接 MySQL 后會立即執行一個設定(見include/db_mysql.class.php ):
復制內容到剪貼板Code:
@mysql_query("SET character_set_connection=$dbcharset, character_set_results=$dbcharset, character_set_client=binary", $this->link);
此三處的字符設定很大程度上會解決亂碼問題,那么這三個設定具體有什么作用呢?如果我們了解了 MySQL 的編碼機制,就可以避免在安裝插件及平時的操作過程中產生亂碼,還可以自行對論壇的數據進行轉碼。
character_set_client 我們可以理解為 SQL 語句的編碼,如果設置為 binary,MySQL 就當二進制來處理,character_set_connection 設定的值則告訴 MySQL 用來運行 SQL 語句的時候使用的編碼,也就是說,程序發送給 MySQL 的 SQL 語句,會首先被 MySQL 從 character_set_client 指定的編碼轉換到 character_set_connection 指定的編碼,如果 character_set_clien 指定的是 binary ,則 MySQL 就會把 SQL 語句按照 character_set_connection 指定的編碼解釋執行。
當執行 SQL 語句的過程中,比如向數據庫中插入取出數據的時候,字段也有編碼設置,如果字段的編碼設置和 character_set_connection 指定的不同,則 MySQL 會把插入的數據轉換成字段設定的編碼。
當 SQL 執行完畢向客戶端返回數據的時候,會把數據從字段指定的編碼轉換為 character_set_results 指定的編碼,如果 character_set_results=NULL 則不做任何轉換動作,(注意這里設置為 NULL 不等于沒有設置,沒有設置的時候 MySQL 會繼承全局設置)。
了解了 MySQL 的編碼機制,我們就可以利用這個機制進行數據的轉碼以及避免在程序使用過程中出現亂碼了。
補充:
mysql_query("character_set_client=gbk"); 這句告訴 MySQL 我接下來要用的 SQL 語句的編碼是 GBK 的
mysql_query("character_set_connection=gbk"); 這句 告訴 MySQL 要把 SQL 語句轉換成 GBK 進行處理
mysql_query("character_set_results=gbk"); 這句告訴 MYSQL 查詢返回的結果要統一都轉換成 GBK 編碼的