標準C++中的string中的函數不多,沒有CString的功能強大,但是如果想在Unicode編碼下使用多字節,就不能使用CString,于是自己寫了一個類似于CString的Replace函數。
string replace( const string& inStr, const char* pSrc, const char* pReplace )
{
string str = inStr;
string::size_type stStart = 0;
string::iterator iter = str.begin();
while( iter != str.end() )
{
// 從指定位置 查找下一個要替換的字符串的起始位置。
string::size_type st = str.find( pSrc, stStart );
if ( st == str.npos )
{
break;
}
iter = iter + st - stStart;
// 將目標字符串全部替換。
str.replace( iter, iter + strlen( pSrc ), pReplace );
iter = iter + strlen( pReplace );
// 替換的字符串下一個字符的位置
stStart = st + strlen( pReplace );
}
return str;
}
上述方法在執行replace( "h h h h h h h h h h h h h h h h h h h ", " ", " " )時出現問題。
下面再列出一種方法:
string CComFunc::replace( const string& inStr, const char* pSrc, const char* pReplace )
{
string strSrc = inStr;
string::size_type pos=0;
string::size_type srclen = strlen( pSrc );
string::size_type dstlen = strlen( pReplace );
while( (pos=strSrc.find(pSrc, pos)) != string::npos)
{
strSrc.replace(pos, srclen, pReplace);
pos += dstlen;
}
return strSrc;
}
補充,經過測試,上面方法再執行,replace( “暴”, "\\","==" )時,依然會遇到問題。
在日文系統上,因為“暴”占兩個字節,而"\\"只占一個字節,但與“暴”的低位字節ASCII碼相同。
而string的Find函數,是按照字節比較的,所以,將這個字節替換了,導致文本替換出現問題。
于是考慮到不應該按字節比較,應該按字符比較,測試發現,CString的替換函數沒有問題,于是考慮按照CString的方法重新寫一個replace函數。
代碼如下:
因為CString在_MBCS和_UNICODE下是變寬的,而我寫的replace函數,只針對string。
string CComFunc::replace( const string& inStr, const char* pSrc, const char* pReplace )
{
string strSrc = inStr;
LPSTR lpch = ( CHAR* )strSrc.c_str();
int nOldLength = strlen( lpch );
int nSourceLen = strlen(pSrc);
if (nSourceLen == 0)
{
return lpch;
}
int nReplacementLen = strlen(pReplace);
LPSTR lpszStart = lpch;
LPSTR lpszEnd = lpszStart + nOldLength;
LPSTR lpszTarget;
// 先列出判斷替換字符是否存在的方法, 但在此函數中不使用這段代碼。
/*
// judge whether exist
while (lpszStart < lpszEnd)
{
while ((lpszTarget = (CHAR*)_mbsstr(( const unsigned char * )lpszStart, ( const unsigned char * )pSrc)) != NULL)
{
nCount++;
lpszStart = lpszTarget + nSourceLen;
}
lpszStart += strStart.length() + 1;
}
*//
// 下面是替換的代碼。
while (lpszStart < lpszEnd)
{
while ((lpszTarget = (CHAR*)_mbsstr(( const unsigned char * )lpszStart, ( const unsigned char * )pSrc)) != NULL)
{
int nBalance = nOldLength - (lpszTarget - lpch + nSourceLen);
memmove(lpszTarget + nReplacementLen, lpszTarget + nSourceLen,
nBalance * sizeof(CHAR));
memcpy(lpszTarget, pReplace, nReplacementLen*sizeof(CHAR));
lpszStart = lpszTarget + nReplacementLen;
lpszStart[nBalance] = '\0';
nOldLength += (nReplacementLen - nSourceLen);
}
lpszStart += strlen(lpszStart) + 1;
}
return lpch;
}
此方法最關鍵的是_mbsstr函數,在"MBSTRING.H"頭文件中聲明。