大家都知道從 MySQL4.1 版本開始,支持多種編碼,包括我們熟知的 latin1、gbk、utf8、big5 等等,還有一些我們聞所未聞的。
在使用 PHP 連接 MySQL 查詢出來的數(shù)據(jù)有的時(shí)候居然會(huì)是亂碼,關(guān)于亂碼的解決首先我們要了解 MySQL 的編碼機(jī)制。
拿 Discuz! 論壇為例,Discuz! 論壇在連接 MySQL 后會(huì)立即執(zhí)行一個(gè)設(shè)定(見include/db_mysql.class.php ):
復(fù)制內(nèi)容到剪貼板Code:
@mysql_query("SET character_set_connection=$dbcharset, character_set_results=$dbcharset, character_set_client=binary", $this->link);
此三處的字符設(shè)定很大程度上會(huì)解決亂碼問題,那么這三個(gè)設(shè)定具體有什么作用呢?如果我們了解了 MySQL 的編碼機(jī)制,就可以避免在安裝插件及平時(shí)的操作過程中產(chǎn)生亂碼,還可以自行對論壇的數(shù)據(jù)進(jìn)行轉(zhuǎn)碼。
character_set_client 我們可以理解為 SQL 語句的編碼,如果設(shè)置為 binary,MySQL 就當(dāng)二進(jìn)制來處理,character_set_connection 設(shè)定的值則告訴 MySQL 用來運(yùn)行 SQL 語句的時(shí)候使用的編碼,也就是說,程序發(fā)送給 MySQL 的 SQL 語句,會(huì)首先被 MySQL 從 character_set_client 指定的編碼轉(zhuǎn)換到 character_set_connection 指定的編碼,如果 character_set_clien 指定的是 binary ,則 MySQL 就會(huì)把 SQL 語句按照 character_set_connection 指定的編碼解釋執(zhí)行。
當(dāng)執(zhí)行 SQL 語句的過程中,比如向數(shù)據(jù)庫中插入取出數(shù)據(jù)的時(shí)候,字段也有編碼設(shè)置,如果字段的編碼設(shè)置和 character_set_connection 指定的不同,則 MySQL 會(huì)把插入的數(shù)據(jù)轉(zhuǎn)換成字段設(shè)定的編碼。
當(dāng) SQL 執(zhí)行完畢向客戶端返回?cái)?shù)據(jù)的時(shí)候,會(huì)把數(shù)據(jù)從字段指定的編碼轉(zhuǎn)換為 character_set_results 指定的編碼,如果 character_set_results=NULL 則不做任何轉(zhuǎn)換動(dòng)作,(注意這里設(shè)置為 NULL 不等于沒有設(shè)置,沒有設(shè)置的時(shí)候 MySQL 會(huì)繼承全局設(shè)置)。
了解了 MySQL 的編碼機(jī)制,我們就可以利用這個(gè)機(jī)制進(jìn)行數(shù)據(jù)的轉(zhuǎn)碼以及避免在程序使用過程中出現(xiàn)亂碼了。
補(bǔ)充:
mysql_query("character_set_client=gbk"); 這句告訴 MySQL 我接下來要用的 SQL 語句的編碼是 GBK 的
mysql_query("character_set_connection=gbk"); 這句 告訴 MySQL 要把 SQL 語句轉(zhuǎn)換成 GBK 進(jìn)行處理
mysql_query("character_set_results=gbk"); 這句告訴 MYSQL 查詢返回的結(jié)果要統(tǒng)一都轉(zhuǎn)換成 GBK 編碼的