在我開始封裝MySQL C API時,真的沒有想過居然會在字符集問題上連續卡殼,折騰了一下午+一晚上,終于搞定這些問題。下面記錄一下我遇見的問題以及解決辦法,以作備忘。
首先遇見的當然是中文亂碼問題。這個問題相對來說資料比較多,文檔寫得應該也是很清楚的,但是我沒心思看,靠猜搞定。我首先設置MySQL服務器的默認字符集為UTF8,并保證我操作的表中的列字符集也是UTF8,然后重啟MySQL服務,并嘗試用mysql_query("INSERT INTO TestTable VALUES('你好')")來寫入,結果失敗在預料之中。我猜可能可以使用類似"INSERT INTO TestTable VALUES('\0x2734\0x3432')"這樣的方式寫入中文,但這樣太丑了,也沒有實用價值,我堅決不會去用。我又嘗試使用MultiByteToWideChar去做,甚至使用了Qt的QTextCodec去轉換“你好”這兩個字,結果依然失敗。這就有些蹊蹺了,我決定調用mysql_character_set_name()看看到底有沒有正確的設置成UTF8格式,讓我意料之外的是:結果是latin1,這難道是拉丁字符集??我查看了一下API函數的相關說明,發現這里獲取到的是客戶端鏈接的字符集,我突然覺得,也許MySQL可以自動的在客戶端與服務器之間的字符集進行轉化!說做就做,我查到了可以用mysql_options()或者mysql_set_character_name()函數來設置客戶端鏈接字符集,但這兩個函數用的時機分別在調用mysql_real_connect()之前或之后。我將客戶端鏈接設置成gb2312字符集,這是VC中支持中文的標準字符集之一(另一個標準是UTF16,需要用wchar_t wstring和常量字符串前的L),結果,當然是非常正確的插入中文啦,呵呵!
正當我覺得下面的封裝肯定會順湯順水之時,在封裝基本完成的時候,我發現控制臺不能輸出我從MySQL取出的中文了!這太奇怪了,輸出英文就沒有問題,而中文雖然的確被準確無誤的讀入了std::string中(通過單步調試和ofstream得到確認),然而輸出到cout中卻會出錯。為什么文件流沒問題,控制臺流會出問題呢?我跟蹤了代碼,發現在fputc()函數中出現了問題。另一個奇特的地方,就是在mysql_init()函數被調用之前,cout可以正確輸出中文,但調用之后就不能輸出,iostate被賦予4值,即badbit。我求了一下google,發現sputc()中的一個_nolock_write()函數是msvcrtd.lib中的函數,暈了,我在單步調試中也發現就是這里有問題,確切的說,mysql_init()函數被調用后,_nolock_write()函數就會出錯。哈哈,總結出了這些特點之后,我已經隱約猜到了是哪里的問題了,還記得前幾日才寫的blog里的東西,我由于想要將libmysql.lib換成mysqlclient.lib靜態庫,所以便禁掉了msvcrtd.lib庫,我肯定這里面有關聯。
到底是什么原因呢?我覺得,由于這個MySQL的SDK不是我自己編譯的,mysqlclient.lib里面調用crt函數時,對字符集的本地化做了設置,由于是歐美的字符集設置,所以一旦我調用了mysqlclient.lib里的函數,就無法再顯示中文了。
猜出了問題的根源,那么如何解決這個問題呢?我可以肯定的是,使用std::cout.imbue(std::locale())是行不通的,那么下面就是列出的幾個辦法:
1、使用人家編譯好的動態庫,libmysql.lib,并將libmysql.dll拷貝過來,由于動態庫和你的程序共享crt dll,因此字符集設置應該會是一致的。
2、如果你還是想用靜態庫,可以考慮自己下載源碼并編譯一遍,這是根本的解決辦法。
3、如果你可以自己編譯,且想用mysqlclient.lib,那么就重新編譯mysqlclient吧,動態靜態都可以。不過官網上下載的編譯好的mysqlclient.lib是靜態的,不能使用。
我最終的解決辦法是第1種,因為比較懶,不想自己再去編譯了,呵呵。