mbs: multi byte string, 用char作為存儲(chǔ)類(lèi)型, 一個(gè)字符可能對(duì)應(yīng)1個(gè)或者多個(gè)char, 不能直接確定字符邊界. charset不確定. 過(guò)去的程序都是采用mbs的.
wcs: wide character string, 用wchar_t作為存儲(chǔ)類(lèi)型, 一個(gè)字符對(duì)于一個(gè)wchar_t. 使用unicode編碼, charset與OS相關(guān), 在windows平臺(tái)中為UTF16(UCS-2), 在大多數(shù)unix平臺(tái)中為UTF32(UCS-4).
國(guó)際化的程序都應(yīng)該在內(nèi)部使用wcs, 在輸入輸出時(shí)做mbs與wcs的轉(zhuǎn)換.
mbs與wcs的轉(zhuǎn)換函數(shù):
wcstombs/mbstowcs是實(shí)現(xiàn)轉(zhuǎn)換的一對(duì)函數(shù). wcs的charset是固定不可變的, 但是mbs的charset是可變的, 可能是ASCII, 可能是gb2312, 也可能是big5. wcstombs/mbstowcs是根據(jù)locale環(huán)境設(shè)置來(lái)決定mbs采用的charset的, 在程序中可以用setlocale來(lái)設(shè)定locale, 例如 setlocale(LC_ALL, "chinese")
程序啟動(dòng)時(shí), locale設(shè)定為 LC_ALL="C", 用 setlocale(LC_ALL, "") 就可以設(shè)置成操作系統(tǒng)的locale設(shè)定.
Locale決定了當(dāng)前程序運(yùn)行的本地化設(shè)置方式, 但是在程序中可能需要作其他charset的轉(zhuǎn)換, 例如程序本身語(yǔ)言設(shè)定為簡(jiǎn)體中文, 需要做big5與unicode的轉(zhuǎn)換, 或者是其他兩種charset的mbstombs轉(zhuǎn)換, 這時(shí)wcstombs/mbstowcs就不能勝任了. 在unix平臺(tái)中可以使用iconv來(lái)做這個(gè)轉(zhuǎn)換(iconv lib也有windows版本), 在windows平臺(tái)可以用MultiByteToWideChar/WideCharToMultiByte 函數(shù).
參考資料: http://xcin.linux.org.tw/i18n/pc2000/p3/chinese-3.html
----------------------------------------------------------------
wcstombs和mbstowcs使用
#include <locale.h>
setlocale(LC_ALL, ".936");
wcstombs(char * to,wchar_t * from,size_t _maxCount);
mbstowcs(wchar_t * to,char * from,size_t _maxCount);