中文三種內(nèi)碼轉換(zz)
關鍵詞: gb2312 gbk big5 文章出處:
http://www.ccrun.com/article/go.asp?i=634&d=04g63p
這里轉載一下是為了以后用到時能方便查找
常見的中文內(nèi)碼一般有GB2312(簡體中文),GBK和臺灣那邊用的BIG5(繁體中文),有時候看一些臺灣編程論壇里的資料,都是亂碼,如果在IE中瀏覽,則要求安裝繁體字庫的支持。網(wǎng)上也有很多中文內(nèi)碼的轉換工具,什么專家,大師,巨匠之類所有光輝燦爛的名字都被使用了,但是在自己的程序中集成這些功能豈不是更好。以前曾廣泛流傳過使用碼表來轉換中文內(nèi)碼的Code,但畢竟不完美,而且還要攜帶或內(nèi)置一個巨大的表,浪費資源。Windows中提供了MultiByteToWideChar和WideCharToMultiByte兩兄弟函數(shù),足可以搞定這些功能了。在我以前寫的一個小工具InfoCode里曾用到過類似代碼。
以下代碼經(jīng)過ccrun(老妖)收集整理調(diào)試編譯測試安裝售后升級除錯打包發(fā)行(現(xiàn)在都流行吹牛,我也時髦一下吧,此處省略廢話4000余字。。。),呵呵。雖然今天倉促發(fā)到偶的站上,也許明天就被別人以迅雷不及掩耳盜鈴之勢轉載并署上自己名字并冠之以xxx超級無敵大無畏神六級別中文內(nèi)碼轉換工具到處招搖撞騙了。
以下四個函數(shù)分別實現(xiàn):
大五碼轉GBK碼/GBK轉大五碼
GB2312碼轉GBK碼/GBK碼轉GB2312碼
于是有人要問了,為什么沒有GB2312轉BIG5和BIG5轉GB2312呢,我們有GBK,可以做一下中轉啊。可以將GB2312轉成GBK,再將GBK轉成BIG5,反之亦然。如果你嫌麻煩,可以自己寫一個GB2BIG5/BIG52GB,并且歡迎你將你的代碼給我一份:info@ccrun.com
//---------------------------------------------------------------------------
// 大五碼轉GBK碼:
// い地チ㎝瓣 --> 中華人民共和國
void __fastcall BIG52GBK(char *szBuf)
{
if(!strcmp(szBuf, ""))
return;
int nStrLen = strlen(szBuf);
wchar_t *pws = new wchar_t[nStrLen + 1];
try
{
int nReturn = MultiByteToWideChar(950, 0, szBuf, nStrLen, pws, nStrLen + 1);
BOOL bValue = false;
nReturn = WideCharToMultiByte(936, 0, pws, nReturn, szBuf, nStrLen + 1, "?", &bValue);
szBuf[nReturn] = 0;
}
__finally
{
delete[] pws;
}
}
//---------------------------------------------------------------------------
// GBK轉大五碼
// 中華人民共和國 --> い地チ㎝瓣
void __fastcall GBK2BIG5(char *szBuf)
{
if(!strcmp(szBuf, ""))
return ;
int nStrLen = strlen(szBuf);
wchar_t *pws = new wchar_t[nStrLen + 1];
try
{
MultiByteToWideChar(936, 0, szBuf, nStrLen, pws, nStrLen + 1);
BOOL bValue = false;
WideCharToMultiByte(950, 0, pws, nStrLen, szBuf, nStrLen + 1, "?", &bValue);
szBuf[nStrLen] = 0;
}
__finally
{
delete[] pws;
}
}
//----------------------------------------------------------------------------
// 抱歉,這個提示又來了,為了防止不負責任的轉載者,只好在此留些信息。
// 作者:ccrun(老妖) info@ccrun.com
// 本文轉自 C++Builder 研究 - http://www.ccrun.com/article/go.asp?i=634&d=04g63p
//---------------------------------------------------------------------------
// GB2312碼轉GBK碼
// 中華人民共和國 --> 中華人民共和國
void __fastcall GB2GBK(char *szBuf)
{
if(!strcmp(szBuf, ""))
return;
int nStrLen = strlen(szBuf);
WORD wLCID = MAKELCID(MAKELANGID
(LANG_CHINESE, SUBLANG_CHINESE_SIMPLIFIED), SORT_CHINESE_PRC);
int nReturn = LCMapString(wLCID, LCMAP_TRADITIONAL_CHINESE, szBuf, nStrLen, NULL, 0);
if(!nReturn)
return;
char *pcBuf = new char[nReturn + 1];
try
{
wLCID = MAKELCID(MAKELANGID
(LANG_CHINESE, SUBLANG_CHINESE_SIMPLIFIED), SORT_CHINESE_PRC);
LCMapString(wLCID, LCMAP_TRADITIONAL_CHINESE, szBuf, nReturn, pcBuf, nReturn + 1);
strncpy(szBuf, pcBuf, nReturn);
}
__finally
{
delete[] pcBuf;
}
}
//---------------------------------------------------------------------------
// GBK碼轉GB2312碼
// 中華人民共和國 --> 中華人民共和國
void __fastcall GBK2GB(char *szBuf)
{
if(!strcmp(szBuf, ""))
return;
int nStrLen = strlen(szBuf);
WORD wLCID = MAKELCID(MAKELANGID
(LANG_CHINESE, SUBLANG_CHINESE_SIMPLIFIED), SORT_CHINESE_BIG5);
int nReturn = LCMapString(wLCID, LCMAP_SIMPLIFIED_CHINESE, szBuf, nStrLen, NULL, 0);
if(!nReturn)
return;
char *pcBuf = new char[nReturn + 1];
try
{
wLCID = MAKELCID(MAKELANGID
(LANG_CHINESE, SUBLANG_CHINESE_SIMPLIFIED), SORT_CHINESE_BIG5);
LCMapString(wLCID, LCMAP_SIMPLIFIED_CHINESE, szBuf, nReturn, pcBuf, nReturn + 1);
strncpy(szBuf, pcBuf, nReturn);
}
__finally
{
delete []pcBuf;
}
}
//---------------------------------------------------------------------------
// 測試代碼
void __fastcall TForm1::Button1Click(TObject *Sender)
{
char szBuf[255];
// 從GB2312轉到GBK
strcpy(szBuf, Edit1->Text.c_str());
GB2GBK(szBuf);
Edit2->Text = String(szBuf);
// 從GB2312轉到BIG5,通過GBK中轉
strcpy(szBuf, Edit1->Text.c_str());
GB2GBK(szBuf);
GBK2BIG5(szBuf);
Edit3->Text = String(szBuf);
}
注意,請不要使用String類的c_str()作為上述幾個函數(shù)的傳入?yún)?shù)。
posted on 2010-09-15 14:09
saha 閱讀(175)
評論(0) 編輯 收藏 引用