提供相應(yīng)的API函數(shù)(如SysAllocString)來管理它以及一些默認的調(diào)度代碼。因此BSTR實際上就是一個COM字符串,但它卻在自動化技術(shù)以外的多種場合下得到廣泛使用。
為什么需要BSTR
COM是一種跨編程語言的平臺,需要提供語言無關(guān)的數(shù)據(jù)類型。多數(shù)編程語言有自己的字符串表示。
●C++ 字符串是以0結(jié)束的ASCII或Unicode字符數(shù)組。
●Visual Basic字符串是一個ASCII字符數(shù)組加上表示長度的前綴。
●Java字符串是以0結(jié)束的Unicode字符數(shù)組。
需要定義一種通用的字符串類型,可以很容易的匹配到不同編程語言。
在C++中,就是BSTR。
什么是BSTR
BSTR是“Basic STRing”的簡稱,
微軟在COM/OLE中定義的標(biāo)準(zhǔn)字符串?dāng)?shù)據(jù)類型。
對于C++,Windows頭文件wtypes.h中定義如下:
typedef
wchar_t WCHAR;
typedef WCHAR OLECHAR;
typedef OLECHAR __RPC_FAR *BSTR;;
使用以Null結(jié)尾的簡單字符串在COM component間傳遞不太方便。因此,
標(biāo)準(zhǔn)BSTR是一個有長度前綴和null結(jié)束符的OLECHAR數(shù)組。BSTR的前4字節(jié)是一個表示字符串長度的前綴。BSTR長度域的值是字符串的字節(jié)數(shù),并且不包括0結(jié)束符。
由于是Unicode串,所以字符數(shù)是字節(jié)數(shù)的一半。這種方式的優(yōu)點是允許程序員在BSTR串中間嵌入NULL字符。但是,BSTR的前四個字節(jié)表示長度,而OLECHAR數(shù)組的前四字節(jié)表示前兩個字符。這種情況下,對于C++程序,如何實現(xiàn)BSTR和OLECHAR的交換?答案是COM提供了兩個BSTR分配用的API:SysAllocString / SysReallocString。函數(shù)返回的指針指向BSTR的第一個字符,而不是BSTR在內(nèi)存的第一個字節(jié)。
什么時候使用BSTR
只有在你不得不用的時候。
使用BSTR一般有以下幾種情況:
●COM interface接口定義,并且不希望額外提供custom marshaling庫(MDIL生成或開發(fā)人員自己訂制),必須使用BSTR傳遞字符串。使用C/C++類型的字符串在COM DLL傳遞字符串,表面上可以使用,但違背了COM的基本規(guī)則,并且給以后的擴展留下了隱患。例如,把一個In-process COM Object(簡單說COM DLL)改成out-of-process object(COM EXE)。理論上,
客戶端的代碼應(yīng)該不做任何改變。但如果是用了C/C++字符串,又希望只使用系統(tǒng)的automation mashaller(Oleaut32.dll),就會出錯。
●如果可以提供custom marshaling,也推薦使用BSTR。
●客戶要求接口必須使用BSTR,和客戶討論后,不能修改。
●使用的外部庫的接口使用BSTR
不使用的情況:
●
不推薦在IDL結(jié)構(gòu)體中定義BSTR成員,會給結(jié)構(gòu)體的復(fù)制和釋放帶來麻煩。最好直接使用限定最大長度的TCHAR數(shù)組。如果確實需要傳遞變長字符串,BSTR應(yīng)該被定義成獨立的參數(shù)或者使用獨立的get/set接口。
●
盡可能縮小的BSTR及相關(guān)類型的作用域范圍。類的成員變量和函數(shù)參數(shù)不使用BSTR。
局部變量要盡快釋放類的內(nèi)部不使用BSTR。代碼處理邏輯中只在接口直接相關(guān)部分使用BSTR。接收到一個BSTR時,盡量立刻變成C/C++的字符串副本進行處理。在需要傳遞BSTR參數(shù)前產(chǎn)生BSTR,用過立即釋放。
BSTR、char*和CString轉(zhuǎn)換
(1) char*轉(zhuǎn)換成CString
若將char*轉(zhuǎn)換成CString,除了直接賦值外,還可使用CString::Format進行。例如:
char chArray[] = "This is a test";
char * p = "This is a test";
或
LPSTR p = "This is a test";
或在已定義Unicode應(yīng)的用程序中
TCHAR * p = _T("This is a test");
或
LPTSTR p = _T("This is a test");
CString theString = chArray;
theString.Format(_T("%s"), chArray);
theString = p;
(2) CString轉(zhuǎn)換成char*
若將CString類轉(zhuǎn)換成char*(LPSTR)類型,常常使用下列三種方法:
方法一,使用強制轉(zhuǎn)換。例如:
CString theString( "This is a test" );
LPTSTR lpsz =(LPTSTR)(LPCTSTR)theString;
方法二,使用strcpy。例如:
CString theString( "This is a test" );
LPTSTR lpsz = new TCHAR[theString.GetLength()+1];
_tcscpy(lpsz, theString);
需要說明的是,strcpy(或可移值Unicode/MBCS的_tcscpy)的第二個參數(shù)是 const wchar_t* (Unicode)或const char* (ANSI),系統(tǒng)編譯器將會自動對其進行轉(zhuǎn)換。
方法三,使用CString::GetBuffer。例如:
CString s(_T("This is a test "));
LPTSTR p = s.GetBuffer();
// 在這里添加使用p的代碼
if(p != NULL) *p = _T('\0');
s.ReleaseBuffer();
// 使用完后及時釋放,以便能使用其它的CString成員函數(shù)
(3) BSTR轉(zhuǎn)換成char*
方法一,使用ConvertBSTRToString。例如:
#include
#pragma comment(lib, "comsupp.lib")
int _tmain(int argc, _TCHAR* argv[]){
BSTR bstrText = ::SysAllocString(L"Test");
char* lpszText2 = _com_util::ConvertBSTRToString(bstrText);
SysFreeString(bstrText); // 用完釋放
delete[] lpszText2;
return 0;
}
方法二,使用_bstr_t的賦值運算符重載。例如:
_bstr_t b = bstrText;
char* lpszText2 = b;
(4) char*轉(zhuǎn)換成BSTR
方法一,使用SysAllocString等API函數(shù)。例如:
BSTR bstrText = ::SysAllocString(L"Test");
BSTR bstrText = ::SysAllocStringLen(L"Test",4);
BSTR bstrText = ::SysAllocStringByteLen("Test",4);
方法二,使用COleVariant或_variant_t。例如:
//COleVariant strVar("This is a test");
_variant_t strVar("This is a test");
BSTR bstrText = strVar.bstrVal;
方法三,使用_bstr_t,這是一種最簡單的方法。例如:
BSTR bstrText = _bstr_t("This is a test");
方法四,使用CComBSTR。例如:
BSTR bstrText = CComBSTR("This is a test");
或
CComBSTR bstr("This is a test");
BSTR bstrText = bstr.m_str;
方法五,使用ConvertStringToBSTR。例如:
char* lpszText = "Test";
BSTR bstrText = _com_util::ConvertStringToBSTR(lpszText);
(5) CString轉(zhuǎn)換成BSTR
通常是通過使用CStringT::AllocSysString來實現(xiàn)。例如:
CString str("This is a test");
BSTR bstrText = str.AllocSysString();
…
SysFreeString(bstrText); // 用完釋放
(6) BSTR轉(zhuǎn)換成CString
一般可按下列方法進行:
BSTR bstrText = ::SysAllocString(L"Test");
CStringA str;
str.Empty();
str = bstrText;
或
CStringA str(bstrText);
(7) ANSI、Unicode和寬字符之間的轉(zhuǎn)換
方法一,使用MultiByteToWideChar將ANSI字符轉(zhuǎn)換成Unicode字符,使用WideCharToMultiByte將Unicode字符轉(zhuǎn)換成ANSI字符。
方法二,使用“_T”將ANSI轉(zhuǎn)換成“一般”類型字符串,使用“L”將ANSI轉(zhuǎn)換成Unicode,而在托管C++環(huán)境中還可使用S將ANSI字符串轉(zhuǎn)換成String*對象。例如:
TCHAR tstr[] = _T("this is a test");
wchar_t wszStr[] = L"This is a test";
String* str = S”This is a test”;
方法三,使用ATL 7.0的轉(zhuǎn)換宏和類。ATL7.0在原有3.0基礎(chǔ)上完善和增加了許多字符串轉(zhuǎn)換宏以及提供相應(yīng)的類,它具有如圖3所示的統(tǒng)一形式:
其中,第一個C表示“類”,以便于ATL 3.0宏相區(qū)別,第二個C表示常量,2表示“to”,EX表示要開辟一定大小的緩沖。SourceType和DestinationType可以是A、T、W和OLE,其含義分別是ANSI、Unicode、“一般”類型和OLE字符串。例如,CA2CT就是將ANSI轉(zhuǎn)換成一般類型的字符串常量。下面是一些示例代碼:
LPTSTR tstr= CA2TEX<16>("this is a test");
LPCTSTR tcstr= CA2CT("this is a test");
wchar_t wszStr[] = L"This is a test";
char* chstr = CW2A(wszStr);
六、結(jié)語
幾乎所有的程序都要用到字符串,而Visual C++.NET由于功能強大、應(yīng)用廣泛,因而字符串之間的轉(zhuǎn)換更為頻繁。本文幾乎涉及到目前的所有轉(zhuǎn)換方法。當(dāng)然對于.NET框架來說,還可使用Convert和Text類進行不同數(shù)據(jù)類型以及字符編碼之間的相互轉(zhuǎn)換。