◆ 常用的字符串處理函數(shù),具體信息見MSDN:
字符串長度:
● Ansi:strlen(char *str);
● Unicode:wcslen(wchar_t *str);
● 通用函數(shù):_tcslen(TCHAR *str);
● Ansi:int atoi(const char *str);
● Unicode:int _wtoi(const wchar_t *str);
● 通用函數(shù):_tstoi(const TCHAR *str);
字符串拷貝:
● Ansi:strcpy(char *strDestination, const char *strSource);
● Unicode:wcscpy(wchar_t *strDestination, const wchar_t *strSource);
● 通用函數(shù):_tcscpy(TCHAR *strDestination, const TCHAR *strSource);
以上函數(shù)不安全,在vs2003等以上版本的編譯器中會有warnning警告提示,以下為安全函數(shù)(vc++6.0不支持):
● Ansi:strcpy_s(char *strDestination, size_t numberOfElements, const char *strSource);
● Unicode:wcscpy_s(wchar_t *strDestination, size_t numberOfElements, const wchar_t *strSource);
● 通用函數(shù):_tcscpy_s(TCHAR *strDestination, size_t numberOfElements, const TCHAR *strSource);
numberOfElements Size of the destination string buffer. 目的緩沖區(qū)的大小,以字節(jié)為單位,不是字符!
size_t unsigned integer,在MSDN中的解釋:Result of sizeof operator,也就是說 size_t 是 unsigned integer 即無符號整數(shù)。那為什么會有size_t這個類型呢? 因為不同平臺的操作系統(tǒng)(32/64)中 int/long 等類型所占的字節(jié)并不一樣,而 size_t 在不同的平臺下有不同的定義。有點類似于TCHAR類型:
#ifndef _SIZE_T_DEFINED
#ifdef _WIN64
typedef unsigned __int64 size_t; //8個字節(jié),64位
#else
typedef _W64 unsigned int size_t; //4個字節(jié),32位
#endif
#define _SIZE_T_DEFINED
#endif
◆轉(zhuǎn)換用到的最根本的 API 函數(shù):
WideCharToMultiByte 實現(xiàn)寬字節(jié)轉(zhuǎn)換到窄字節(jié) //函數(shù)參數(shù)自行查詢MSDN。
MultiByteToWideChar 實現(xiàn)窄字節(jié)轉(zhuǎn)換到寬字節(jié)
WideCharToMultiByte 的代碼頁用來標記與新轉(zhuǎn)換的字符串相關(guān)的代碼頁;
MultiByteToWideChar 的代碼頁用來標記與一個多字節(jié)字符串相關(guān)的代碼頁,
[1]、常用的代碼頁有 CP_ACP 和 CP_UTF8 兩個: 使用 CP_ACP 代碼頁就實現(xiàn)了 ANSI 與 Unicode 之間的轉(zhuǎn)換;
使用 CP_UTF8 代碼頁就實現(xiàn)了 UTF-8 與 Unicode 之間的轉(zhuǎn)換。
[2]、dwFlags 參數(shù)允許我們進行額外的控制,但是,一般情況下都不使用這個標志,直接傳遞 0 就行了。
[3]、lpDefaultChar和pfUsedDefaultChar:
只有當WideCharToMultiByte函數(shù)遇到一個寬字節(jié)字符,而該字符在uCodePage參數(shù)標識的代碼頁中并沒有它的表示法時,WideCharToMultiByte函數(shù)才使用這兩個參數(shù)。如果寬字節(jié)字符不能被轉(zhuǎn)換,該函數(shù)便使用lpDefaultChar參數(shù)指向的字符。如果該參數(shù)是NULL(這是大多數(shù)情況下的參數(shù)值),那么該函數(shù)使用系統(tǒng)的默認字符。該默認字符通常是個問號。這對于文件名來說是危險的,因為問號是個通配符。pfUsedDefaultChar參數(shù)指向一個布爾變量,如果Unicode字符串中至少有一個字符不能轉(zhuǎn)換成等價多字節(jié)字符,那么函數(shù)就將該變量置為TRUE。如果所有字符均被成功地轉(zhuǎn)換,那么該函數(shù)就將該變量置為FALSE。當函數(shù)返回以便檢查寬字節(jié)字符串是否被成功地轉(zhuǎn)換后,可以測試該變量。
● 兩個轉(zhuǎn)換函數(shù)的使用舉例:
char *cctryWideCharToAnsi(wchar_t *pWideChar)
{
if (!pWideChar) return NULL;
char *pszBuf = NULL;
int needBytes = WideCharToMultiByte(CP_ACP, 0, pWideChar, -1, NULL, 0, NULL, NULL);
if (needBytes > 0){
pszBuf = new char[needBytes+1];
ZeroMemory(pszBuf, (needBytes+1)*sizeof(char));
WideCharToMultiByte(CP_ACP, 0, pWideChar, -1, pszBuf, needBytes, NULL, NULL);
}
return pszBuf;
}
wchar_t *cctryAnsiCharToWide(char *pChar)
{
if (!pChar) return NULL;
wchar_t *pszBuf = NULL;
int needWChar = MultiByteToWideChar(CP_ACP, 0, pChar, -1, NULL, 0);
if (needWChar > 0){
pszBuf = new wchar_t[needWChar+1];
ZeroMemory(pszBuf, needWChar+1);
MultiByteToWideChar(CP_ACP, 0, pChar, -1, pszBuf, needWChar);
}
return pszBuf;
}
使用過后千萬別忘記釋放空間