UNICODE:它是用兩個(gè)字節(jié)表示一個(gè)字符的方法。比如字符'A'在ASCII下面是一個(gè)字符,可'A'在UNICODE下面是兩個(gè)字符,高字符用0填充,而且漢字'程'在ASCII下面是兩個(gè)字節(jié),而在UNICODE下仍舊是兩個(gè)字節(jié)。UNICODE的用處就是定長(zhǎng)表示世界文字,據(jù)統(tǒng)計(jì),用兩個(gè)字節(jié)可以編 現(xiàn)存的所有文字而沒(méi)有二義。
MBCS,它是多字節(jié)字符集,它是不定長(zhǎng)表示世界文字的編 。MBCS表示英文字母時(shí)就和ASCII一 (這也是我們?nèi)菀装袽BCS和ASCII搞混的原 ),但表示其他文字時(shí)就需要用多字節(jié)。
WINDOWS下面的程序設(shè)計(jì)可以支持MBCS和UNICODE兩種編碼的字符串,具體用哪種就看定義了MBCS宏還是UNICODE宏。MBCS宏對(duì)應(yīng)的字符串指針是char*也就是LPSTR,UNICODE對(duì)應(yīng)的指針是unsigned short*也就是LPWSTR,為了寫程序方便微軟定義了類型LPTSTR,在MBCS下他就是char*,在UNICODE下它是unsigned char*,這 就可以重定義一個(gè)宏進(jìn)行不同字符集的轉(zhuǎn)換了。
LPTSTR、LPCSTR、LPCTSTR、LPSTR的意義:
LPSTR: 32bit指針指向一個(gè)字符串,每個(gè)字符占1字節(jié)
LPCSTR: 32-bit指針指向一個(gè)常字符串,每個(gè)字符占1字節(jié)
LPCTSTR: 32-bit指針指向一個(gè)常字符串,每字符可能占1字節(jié)或2字節(jié),取決于Unicode是否定義
LPTSTR: 32-bit指針每字符可能占1字節(jié)或2字節(jié),取決于Unicode是否定義
Windows使用兩種字符集ANSI和UNICODE,前者就是通常使用的單字節(jié)方式,但這種方式處理象中文這樣的雙字節(jié)字符不方便,容易出現(xiàn)半個(gè)漢字的情況。而后者是雙字節(jié)方式,方便處理雙字節(jié)字符。WindowsNT的所有與字符有關(guān)的函數(shù)都提供兩種方式的版本,而Windows9x只支持ANSI方式。_T一般同字常數(shù)相關(guān),如_T("Hello"。如果你編譯一個(gè)程序?yàn)锳NSI方式,_T實(shí)際不起任何作用。而如果編譯一個(gè)程序?yàn)閁NICODE方式,則編譯器會(huì)把"Hello"字符串以UNICODE方式保存。_T和_L的區(qū)別在于,_L不管你是以什么方式編譯,一律以UNICODE方式保存.
Windows核心編程的第一章。
L是表示字符串資源為Unicode的。
比如
wchar_t Str[] = L"Hello World!";
這個(gè)就是雙子節(jié)存儲(chǔ)字符了。
_T是一個(gè)適配的宏~
當(dāng)
#ifdef _UNICODE的時(shí)候
_T就是L
沒(méi)有#ifdef _UNICODE的時(shí)候
_T就是ANSI的。
比如
LPTSTR lpStr = new TCHAR[32];
TCHAR* szBuf = _T("Hello");
以上兩句使得無(wú)論是在UNICODE編譯條件下都是正確編譯的。
而且MS推薦你使用相匹配的字符串函數(shù)。
比如處理LPTSTR或者LPCTSTR 的時(shí)候,不要用strlen ,而是要用_tcslen
否則在UNICODE的編譯條件下,strlen不能處理 wchar_t*的字符串。
T是非常有意思的一個(gè)符號(hào)(TCHAR、LPCTSTR、LPTSTR、_T()、_TEXT()...),它表示使用一種中間類型,既不明確表示使用 MBCS,也不明確表示使用 UNICODE。那到底使用哪種字符集?編譯的時(shí)候才決定
本文轉(zhuǎn)自:
http://littlecity.blog.163.com/blog/static/3577802620093895941438/
posted on 2012-09-04 17:38
王海光 閱讀(682)
評(píng)論(0) 編輯 收藏 引用 所屬分類:
MFC