//========================================================================
//TITLE:
//??? MultiByteToWideChar和WideCharToMultiByte用法詳解
//AUTHOR:
//??? norains
//DATE:
//??? 第一版:Monday? 25-December -2006
//??? 增補(bǔ)版:Wednesday 27-December -2006
//??? 修訂版:Wednesday 14-March-2007 (修正之前的錯(cuò)誤例子)
//Environment:
//? EVC4.0 + Standard SDK
//========================================================================
?
1.使用方法詳解
? 在本文開(kāi)始之處,先簡(jiǎn)要地說(shuō)一下何為短字符和寬字符.
? 所謂的短字符,就是用8bit來(lái)表示的字符,典型的應(yīng)用是ASCII碼.而寬字符,顧名思義,就是用16bit表示的字符,典型的有UNICODE.關(guān)于windows下的ASCII和UNICODE的更多信息,可以參考這兩本經(jīng)典著作:《windows 程序設(shè)計(jì)》,《windows 核心編程》.這兩本書(shū)關(guān)于這兩種字符都有比較詳細(xì)的解說(shuō).
?
? 寬字符轉(zhuǎn)換為多個(gè)短字符是一個(gè)難點(diǎn),不過(guò)我們只要掌握到其中的要領(lǐng),便可如魚(yú)得水.
? 好吧,那就讓我們開(kāi)始吧.
?
? 這個(gè)是我們需要轉(zhuǎn)化的多字節(jié)字符串: ?
? char sText[20] = {"多字節(jié)字符串!OK!"};
?
? 我們需要知道轉(zhuǎn)化后的寬字符需要多少個(gè)數(shù)組空間.雖然在這個(gè)里程里面,我們可以直接定義一個(gè)20*2寬字符的數(shù)組,并且事實(shí)上將運(yùn)行得非常輕松愉快.但假如多字節(jié)字符串更多,達(dá)到上千個(gè)乃至上萬(wàn)個(gè),我們將會(huì)發(fā)現(xiàn)其中浪費(fèi)的內(nèi)存將會(huì)越來(lái)越多.所以以多字節(jié)字符的個(gè)數(shù)的兩倍作為寬字符數(shù)組下標(biāo)的聲明絕對(duì)不是一個(gè)好主意.
? 所幸,我們能夠確知所需要的數(shù)組空間.
? 我們只需要將MultiByteToWideChar()的第四個(gè)形參設(shè)為-1,即可返回所需的短字符數(shù)組空間的個(gè)數(shù):
? DWORD dwNum = MultiByteToWideChar (CP_ACP, 0, sText, -1, NULL, 0);
?
? 接下來(lái),我們只需要分配響應(yīng)的數(shù)組空間:
? wchar_t *pwText;
? pwText = new wchar_t[dwNum];
? if(!pwText)
? {
?? delete []pwText;
? }
?
? 接著,我們就可以著手進(jìn)行轉(zhuǎn)換了.在這里以轉(zhuǎn)換成ASCII碼做為例子:
? MultiByteToWideChar (CP_ACP, 0, psText, -1, sText, dwSize);
?
? 最后,使用完畢當(dāng)然要記得釋放占用的內(nèi)存:
? delete []psText;
?
?
? 同理,寬字符轉(zhuǎn)為多字節(jié)字符的代碼如下: ?
? wchar_t wText[20] = {L"寬字符轉(zhuǎn)換實(shí)例!OK!"};
? DWORD dwNum = WideCharToMultiByte(CP_OEMCP,NULL,lpcwszStr,-1,NULL,0,NULL,FALSE);
? char *psText;
? psText = new char[dwNum];
? if(!psText)
? {
?? delete []psText;
? }
? WideCharToMultiByte (CP_OEMCP,NULL,lpcwszStr,-1,psText,dwNum,NULL,FALSE);
? delete []psText;
?
?? 如果之前我們已經(jīng)分配好空間,并且由于字符串較短,可以不理會(huì)浪費(fèi)的空間,僅僅只是想簡(jiǎn)單地將短字符和寬字符相互轉(zhuǎn)換,那有沒(méi)有什么簡(jiǎn)便的方法呢?
?? WIN32 API里沒(méi)有符合這種要求的函數(shù),但我們可以自己進(jìn)行封裝:
??? ?
? //-------------------------------------------------------------------------------------
? //Description:
? // This function maps a character string to a wide-character (Unicode) string
? //
? //Parameters:
? // lpcszStr: [in] Pointer to the character string to be converted
? // lpwszStr: [out] Pointer to a buffer that receives the translated string.
? // dwSize: [in] Size of the buffer
? //
? //Return Values:
? // TRUE: Succeed
? // FALSE: Failed
? //
? //Example:
? // MByteToWChar(szA,szW,sizeof(szW)/sizeof(szW[0]));
? //---------------------------------------------------------------------------------------
? BOOL MByteToWChar(LPCSTR lpcszStr, LPWSTR lpwszStr, DWORD dwSize)
? {
??? // Get the required size of the buffer that receives the Unicode
??? // string.
??? DWORD dwMinSize;
??? dwMinSize = MultiByteToWideChar (CP_ACP, 0, lpcszStr, -1, NULL, 0);
?
??? if(dwSize < dwMinSize)
??? {
???? return FALSE;
??? }
?
?? ?
??? // Convert headers from ASCII to Unicode.
??? MultiByteToWideChar (CP_ACP, 0, lpcszStr, -1, lpwszStr, dwMinSize); ?
??? return TRUE;
? }
?
? //-------------------------------------------------------------------------------------
? //Description:
? // This function maps a wide-character string to a new character string
? //
? //Parameters:
? // lpcwszStr: [in] Pointer to the character string to be converted
? // lpszStr: [out] Pointer to a buffer that receives the translated string.
? // dwSize: [in] Size of the buffer
? //
? //Return Values:
? // TRUE: Succeed
? // FALSE: Failed
? //
? //Example:
? // MByteToWChar(szW,szA,sizeof(szA)/sizeof(szA[0]));
? //---------------------------------------------------------------------------------------
? BOOL WCharToMByte(LPCWSTR lpcwszStr, LPSTR lpszStr, DWORD dwSize)
? {
?? DWORD dwMinSize;
?? dwMinSize = WideCharToMultiByte(CP_OEMCP,NULL,lpcwszStr,-1,NULL,0,NULL,FALSE);
?? if(dwSize < dwMinSize)
?? {
??? return FALSE;
?? }
?? WideCharToMultiByte(CP_OEMCP,NULL,lpcwszStr,-1,lpszStr,dwSize,NULL,FALSE);
?? return TRUE;
? }
?
?
? 使用方法也很簡(jiǎn)單,示例如下:
? wchar_t wText[10] = {L"函數(shù)示例"};
? char sText[20]= {0};
? WCharToMByte(wText,sText,sizeof(sText)/sizeof(sText[0]));
? MByteToWChar(sText,wText,sizeof(wText)/sizeof(wText[0]));
?
? 這兩個(gè)函數(shù)的缺點(diǎn)在于無(wú)法動(dòng)態(tài)分配內(nèi)存,在轉(zhuǎn)換很長(zhǎng)的字符串時(shí)可能會(huì)浪費(fèi)較多內(nèi)存空間;優(yōu)點(diǎn)是,在不考慮浪費(fèi)空間的情況下轉(zhuǎn)換較短字符串非常方便.
?
2.MultiByteToWideChar()函數(shù)亂碼的問(wèn)題
? 有的朋友可能已經(jīng)發(fā)現(xiàn),在標(biāo)準(zhǔn)的WinCE4.2或WinCE5.0 SDK模擬器下,這個(gè)函數(shù)都無(wú)法正常工作,其轉(zhuǎn)換之后的字符全是亂碼.及時(shí)更改MultiByteToWideChar()參數(shù)也依然如此.
? 不過(guò)這個(gè)不是代碼問(wèn)題,其結(jié)癥在于所定制的操作系統(tǒng).如果我們定制的操作系統(tǒng)默認(rèn)語(yǔ)言不是中文,也會(huì)出現(xiàn)這種情況.由于標(biāo)準(zhǔn)的SDK默認(rèn)語(yǔ)言為英文,所以肯定會(huì)出現(xiàn)這個(gè)問(wèn)題.而這個(gè)問(wèn)題的解決,不能在簡(jiǎn)單地更改控制面板的"區(qū)域選項(xiàng)"的"默認(rèn)語(yǔ)言",而是要在系統(tǒng)定制的時(shí)候,選擇默認(rèn)語(yǔ)言為"中文".
? 系統(tǒng)定制時(shí)選擇默認(rèn)語(yǔ)言的位置于:
? Platform -> Setting... -> locale -> default language ,選擇"中文",然后編譯即可.