• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            追逐夢想

            臨淵羨魚,不如退而結(jié)網(wǎng)
            posts - 8, comments - 18, trackbacks - 0, articles - 0

            [轉(zhuǎn)]wchar_t與char轉(zhuǎn)換

            Posted on 2008-01-08 11:07 寒蟬 閱讀(36126) 評論(11)  編輯 收藏 引用 所屬分類: C++讀書筆記
            環(huán)境:Dev cpp 平臺i386 
                C++標(biāo)準(zhǔn)中,wchar_t是寬字符類型,每個wchar_t類型占2個字節(jié),16位寬。漢字的表示就要用到wchar_t 。char,我們都知道,占一個字節(jié),8位寬。
            其實知道了這個以后,要在wchar_t 和 char兩種類型之間轉(zhuǎn)換就不難實現(xiàn)了。wchar_t 轉(zhuǎn)換為char 的代碼如下: 
            有如下的wchar_t和char變量:
            wchar_t w_cn = '中'; char c_cn[2] = {'0'} ;
            char *C2W(wchar_t w_cn , char c_cn[2])
            {    //following code convert wchar to char 
                  c_cn[0] = w_cn >> 8 ;
                  c_cn[1] = w_cn ;
                  c_cn[2] = '\0';
                  return c_cn ;
            }
              其中需要注意的是一個16位的wchar_t需要用兩個8位的char來存儲之。我們可以發(fā)現(xiàn)另外一個問題,wchar_t的高位字節(jié)應(yīng)該存儲在char數(shù)組的低位字節(jié)。
            (這里沒有仔細(xì)研究了,覺得怪怪的)。
             這是完成了wchar_t到char的轉(zhuǎn)化,char到wchar_t的轉(zhuǎn)換類似。






            C++中,你要想這樣:cout<<w_cn<<endl;打印wchar_t,那是不行的。why?我想是wchar_t類型沒有重載<<運算符吧。要顯示,我的方法是:
            string cn(c_cn);

            cout<<cn<<endl;
            這樣就能正確的打印wchar_t字符了。是不是感覺好像做了好多事,但是完成的卻是很簡單的事情?呵呵,其實我也有同感,但是沒有辦法。更簡單的辦法,當(dāng)然是直接用API(我一個是懶的去找了,二一個自己動手轉(zhuǎn)換有些東西看的更清楚咯),但是這樣的轉(zhuǎn)換更靈活,
            在實際中應(yīng)該會用到的。 有了以上的基礎(chǔ),下面給出wchar_t字符串到char字符串的轉(zhuǎn)換代碼:
            char *W2C(const wchar_t *pw , char *pc)







            {
            //cout<<*pw<<endl;    //這樣是不能正確顯示的,你可以試試看顯示的是什么
                  *pc++ = *pw >> 8 ;
                  *pc = *pw ;
                  return 0 ;

            char *wstr2cstr(const wchar_t *pwstr , char *pcstr, size_t len)
            {     char *ptemp = pcstr ;
                  if(pwstr!=NULL && pcstr!=NULL)
                  {  size_t wstr_len = wcslen(pwstr) ;
                      len = (len > wstr_len ) ?    wstr_len : len ;
                  while( len -- > 0)
                  {
                      W2C(pwstr , pcstr);
                      pwstr++ ;
                      pcstr +=2 ;      //和我們開始說的一樣+2,不是+1
                  }
                      *pcstr = '\0';
                      return ptemp ;
                  }
                  return 0 ;
            }    
            對上面的代碼進(jìn)行測試:
            int main(int arg , char *argv[])
            {
                  wchar_t pwstr[] = {'我' , '是' , '中' , '國' , '人'};
                  char *pcstr = (char *)new char[2 * wcslen(pwstr)+1] ;
                  memset(pcstr , 0 , 2 * wcslen(pwstr)+1 );
                  wstr2cstr(pwstr , pcstr , wcslen(pwstr)) ;
                  str.assign (pcstr);
                  cout<<str<<endl;
                  delete []pcstr ;
            }

            Feedback

            # re: [轉(zhuǎn)]wchar_t與char轉(zhuǎn)換  回復(fù)  更多評論   

            2008-01-08 16:40 by <a href=http://minidx.com>minidxer</a>
            相同的編碼的這樣轉(zhuǎn)沒問題,不同的話就有問題的
            比如gb的轉(zhuǎn)UTF16

            # re: [轉(zhuǎn)]wchar_t與char轉(zhuǎn)換  回復(fù)  更多評論   

            2008-01-20 19:41 by jsjkandy
            對于編碼還剛剛處于學(xué)習(xí)階段,不知道您是否可以給我介紹幾篇文章,或者給講一些不同的 編碼在不同的平臺上進(jìn)行移植的一些問題。呵呵。

            # re: [轉(zhuǎn)]wchar_t與char轉(zhuǎn)換  回復(fù)  更多評論   

            2009-03-02 15:29 by biangji
            你好,我在c++中傳遞char*類型到j(luò)ava的時候出現(xiàn)如下問題
            #
            # An unexpected error has been detected by Java Runtime Environment:
            #
            # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x102156f9, pid=5280, tid=5672
            #
            # Java VM: Java HotSpot(TM) Client VM (11.0-b15 mixed mode, sharing windows-x86)
            # Problematic frame:
            # C [MSVCR71D.dll+0x156f9]
            #
            # An error report file with more information is saved as:
            # D:\Program Files\eclipse\workspace\jnaTestProject1\hs_err_pid5280.log
            #
            # If you would like to submit a bug report, please visit:
            # http://java.sun.com/webapps/bugreport/crash.jsp
            # The crash happened outside the Java Virtual Machine in native code.
            # See problematic frame for where to report the bug.
            #
            不知道是怎么回事,麻煩您解答,謝謝

            # re: [轉(zhuǎn)]wchar_t與char轉(zhuǎn)換  回復(fù)  更多評論   

            2009-03-02 15:30 by biangji
            不好意思,我發(fā)錯了

            # re: [轉(zhuǎn)]wchar_t與char轉(zhuǎn)換  回復(fù)  更多評論   

            2009-03-05 21:19 by 寒蟬
            @biangji
            不好意思,呵呵,我java不會啊。

            # re: [轉(zhuǎn)]wchar_t與char轉(zhuǎn)換[未登錄]  回復(fù)  更多評論   

            2010-10-18 15:51 by me
            setlocale...
            std::wcout << ..?

            # re: [轉(zhuǎn)]wchar_t與char轉(zhuǎn)換  回復(fù)  更多評論   

            2011-11-17 11:43 by todd
            wchar_t w_cn = '中' 這樣寫至少也應(yīng)該有個警告, 應(yīng)該用 wchar_t w_cn = L'中'

            輸出wchar_t字符串可以用 wcout

            char c_cn[2] .... c_cn[2] = ... 理論上是索引超出范圍

            wchar_t 的長度與編譯器實現(xiàn)有關(guān), 可能是2個字節(jié), 也可能是4個字節(jié)

            這個轉(zhuǎn)化方案有問題,理論上是錯誤的,至少是靠不住的。

            char sz[] = "中"; 導(dǎo)致 sizeof(sz) 結(jié)果為4, 除掉結(jié)尾的'\0' 字符, 中字用了3個字符, (但這也可能是因為我的代碼文件用的 utf-8 保存的, 不確定)

            unicode可以說只是一個字符集, 收 utf-8, utf-16, ucs4 等等編碼方式的支持。
            gb18030定義模糊, 其把字符集與編碼方式混為一談(也或者我讀得文檔表述有問題)

            utf-8, utf-16, ucs4 之間轉(zhuǎn)換只需解碼再編碼就可以了。 而與gb18030之間的轉(zhuǎn)化解碼后還要進(jìn)行字符集轉(zhuǎn)換后在編碼。

            比如給定漢字x, 其 unicode 對應(yīng) code point 是 xu, 其 utf-8 編碼是 utf8(xu);
            其gb18030的 code point 是 xk , 編碼是 gb18030(xk), 而 utf8(xu) 與 gb18030(xk) 可能想去甚遠(yuǎn)

            # re: [轉(zhuǎn)]wchar_t與char轉(zhuǎn)換[未登錄]  回復(fù)  更多評論   

            2012-06-22 12:28 by JK
            char *pcstr = (char *)new char[2 * wcslen(pwstr)+1] ;
            memset(pcstr , 0 , 2 * wcslen(pwstr)+1);
            wstr2cstr(pwstr , pcstr , wcslen(pwstr));

            三句代碼把 wcslen 調(diào)用了三次,為什么不先算出來,調(diào)三次不浪費嗎?況且,你這里直接用 sizeof 更好,連函數(shù)調(diào)用都省去了。

            # re: [轉(zhuǎn)]wchar_t與char轉(zhuǎn)換  回復(fù)  更多評論   

            2012-11-27 07:28 by Martian
            可笑,完全錯誤,錯的沒邊了

            # re: [轉(zhuǎn)]wchar_t與char轉(zhuǎn)換  回復(fù)  更多評論   

            2012-11-29 17:05 by ikillmeba
            確實,有很多的錯誤,編譯器的問題,還有平臺的問題,都有可能

            # re: [轉(zhuǎn)]wchar_t與char轉(zhuǎn)換  回復(fù)  更多評論   

            2013-02-19 10:56 by ligand
            此文錯得太離譜。

            C++語言標(biāo)準(zhǔn)沒有規(guī)定wchar_t是多少比特寬度!!!

            在類Unix/Linux系統(tǒng)中,wchar_t是32比特寬。

            即使在Windows平臺上,一個wchar_t漢字字符轉(zhuǎn)為DBCS(雙字節(jié)表示,簡體中文即指gb2312/gbk/gb18030,三者可視為同一),也不能直接靠移位操作、字節(jié)復(fù)制之類,而必須去查表。因為wchar_t漢字字符保存的是Unicode的碼值的UTF-16小尾表示,與gb2312/gbk/gb18030完全不同。這就好比gb2312/gbk/gb18030與繁體的Big5轉(zhuǎn)換,也必須只能去查表。
            久久亚洲AV成人出白浆无码国产| 久久久中文字幕日本| 久久久久久午夜成人影院| 久久亚洲欧美国产精品| 久久久久国产一级毛片高清版| 91精品国产综合久久香蕉 | 欧洲国产伦久久久久久久| 香蕉久久夜色精品国产2020| 国产成人久久AV免费| 日韩久久久久中文字幕人妻| 久久人妻少妇嫩草AV无码专区| 久久精品国产黑森林| 久久精品国产亚洲av日韩 | 无码国内精品久久综合88| 久久久久久久久久久久中文字幕| 一级做a爰片久久毛片16| 亚洲午夜久久久久久噜噜噜| 99久久精品免费观看国产| 亚洲精品无码专区久久久| 色偷偷91久久综合噜噜噜噜| 久久本道伊人久久| 久久久久亚洲精品无码蜜桃| 久久国产亚洲精品| 久久人人爽人爽人人爽av| 久久91精品久久91综合| 久久久久人妻精品一区| 亚洲国产精品无码久久久蜜芽| 日韩久久无码免费毛片软件 | 久久综合狠狠色综合伊人| 亚洲精品乱码久久久久久久久久久久 | 亚洲欧美成人综合久久久| 久久无码高潮喷水| 色99久久久久高潮综合影院 | 色综合久久最新中文字幕| 久久精品国产99国产精品澳门| 色欲av伊人久久大香线蕉影院 | 久久精品国产精品国产精品污 | 国产精品久久一区二区三区| 7777久久亚洲中文字幕| 久久午夜电影网| 99久久综合狠狠综合久久止|