• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            追逐夢想

            臨淵羨魚,不如退而結網
            posts - 8, comments - 18, trackbacks - 0, articles - 0

            [轉]wchar_t與char轉換

            Posted on 2008-01-08 11:07 寒蟬 閱讀(36116) 評論(11)  編輯 收藏 引用 所屬分類: C++讀書筆記
            環境:Dev cpp 平臺i386 
                C++標準中,wchar_t是寬字符類型,每個wchar_t類型占2個字節,16位寬。漢字的表示就要用到wchar_t 。char,我們都知道,占一個字節,8位寬。
            其實知道了這個以后,要在wchar_t 和 char兩種類型之間轉換就不難實現了。wchar_t 轉換為char 的代碼如下: 
            有如下的wchar_t和char變量:
            wchar_t w_cn = '中'; char c_cn[2] = {'0'} ;
            char *C2W(wchar_t w_cn , char c_cn[2])
            {    //following code convert wchar to char 
                  c_cn[0] = w_cn >> 8 ;
                  c_cn[1] = w_cn ;
                  c_cn[2] = '\0';
                  return c_cn ;
            }
              其中需要注意的是一個16位的wchar_t需要用兩個8位的char來存儲之。我們可以發現另外一個問題,wchar_t的高位字節應該存儲在char數組的低位字節。
            (這里沒有仔細研究了,覺得怪怪的)。
             這是完成了wchar_t到char的轉化,char到wchar_t的轉換類似。






            C++中,你要想這樣:cout<<w_cn<<endl;打印wchar_t,那是不行的。why?我想是wchar_t類型沒有重載<<運算符吧。要顯示,我的方法是:
            string cn(c_cn);

            cout<<cn<<endl;
            這樣就能正確的打印wchar_t字符了。是不是感覺好像做了好多事,但是完成的卻是很簡單的事情?呵呵,其實我也有同感,但是沒有辦法。更簡單的辦法,當然是直接用API(我一個是懶的去找了,二一個自己動手轉換有些東西看的更清楚咯),但是這樣的轉換更靈活,
            在實際中應該會用到的。 有了以上的基礎,下面給出wchar_t字符串到char字符串的轉換代碼:
            char *W2C(const wchar_t *pw , char *pc)







            {
            //cout<<*pw<<endl;    //這樣是不能正確顯示的,你可以試試看顯示的是什么
                  *pc++ = *pw >> 8 ;
                  *pc = *pw ;
                  return 0 ;

            char *wstr2cstr(const wchar_t *pwstr , char *pcstr, size_t len)
            {     char *ptemp = pcstr ;
                  if(pwstr!=NULL && pcstr!=NULL)
                  {  size_t wstr_len = wcslen(pwstr) ;
                      len = (len > wstr_len ) ?    wstr_len : len ;
                  while( len -- > 0)
                  {
                      W2C(pwstr , pcstr);
                      pwstr++ ;
                      pcstr +=2 ;      //和我們開始說的一樣+2,不是+1
                  }
                      *pcstr = '\0';
                      return ptemp ;
                  }
                  return 0 ;
            }    
            對上面的代碼進行測試:
            int main(int arg , char *argv[])
            {
                  wchar_t pwstr[] = {'我' , '是' , '中' , '國' , '人'};
                  char *pcstr = (char *)new char[2 * wcslen(pwstr)+1] ;
                  memset(pcstr , 0 , 2 * wcslen(pwstr)+1 );
                  wstr2cstr(pwstr , pcstr , wcslen(pwstr)) ;
                  str.assign (pcstr);
                  cout<<str<<endl;
                  delete []pcstr ;
            }

            Feedback

            # re: [轉]wchar_t與char轉換  回復  更多評論   

            2008-01-08 16:40 by <a href=http://minidx.com>minidxer</a>
            相同的編碼的這樣轉沒問題,不同的話就有問題的
            比如gb的轉UTF16

            # re: [轉]wchar_t與char轉換  回復  更多評論   

            2008-01-20 19:41 by jsjkandy
            對于編碼還剛剛處于學習階段,不知道您是否可以給我介紹幾篇文章,或者給講一些不同的 編碼在不同的平臺上進行移植的一些問題。呵呵。

            # re: [轉]wchar_t與char轉換  回復  更多評論   

            2009-03-02 15:29 by biangji
            你好,我在c++中傳遞char*類型到java的時候出現如下問題
            #
            # An unexpected error has been detected by Java Runtime Environment:
            #
            # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x102156f9, pid=5280, tid=5672
            #
            # Java VM: Java HotSpot(TM) Client VM (11.0-b15 mixed mode, sharing windows-x86)
            # Problematic frame:
            # C [MSVCR71D.dll+0x156f9]
            #
            # An error report file with more information is saved as:
            # D:\Program Files\eclipse\workspace\jnaTestProject1\hs_err_pid5280.log
            #
            # If you would like to submit a bug report, please visit:
            # http://java.sun.com/webapps/bugreport/crash.jsp
            # The crash happened outside the Java Virtual Machine in native code.
            # See problematic frame for where to report the bug.
            #
            不知道是怎么回事,麻煩您解答,謝謝

            # re: [轉]wchar_t與char轉換  回復  更多評論   

            2009-03-02 15:30 by biangji
            不好意思,我發錯了

            # re: [轉]wchar_t與char轉換  回復  更多評論   

            2009-03-05 21:19 by 寒蟬
            @biangji
            不好意思,呵呵,我java不會啊。

            # re: [轉]wchar_t與char轉換[未登錄]  回復  更多評論   

            2010-10-18 15:51 by me
            setlocale...
            std::wcout << ..?

            # re: [轉]wchar_t與char轉換  回復  更多評論   

            2011-11-17 11:43 by todd
            wchar_t w_cn = '中' 這樣寫至少也應該有個警告, 應該用 wchar_t w_cn = L'中'

            輸出wchar_t字符串可以用 wcout

            char c_cn[2] .... c_cn[2] = ... 理論上是索引超出范圍

            wchar_t 的長度與編譯器實現有關, 可能是2個字節, 也可能是4個字節

            這個轉化方案有問題,理論上是錯誤的,至少是靠不住的。

            char sz[] = "中"; 導致 sizeof(sz) 結果為4, 除掉結尾的'\0' 字符, 中字用了3個字符, (但這也可能是因為我的代碼文件用的 utf-8 保存的, 不確定)

            unicode可以說只是一個字符集, 收 utf-8, utf-16, ucs4 等等編碼方式的支持。
            gb18030定義模糊, 其把字符集與編碼方式混為一談(也或者我讀得文檔表述有問題)

            utf-8, utf-16, ucs4 之間轉換只需解碼再編碼就可以了。 而與gb18030之間的轉化解碼后還要進行字符集轉換后在編碼。

            比如給定漢字x, 其 unicode 對應 code point 是 xu, 其 utf-8 編碼是 utf8(xu);
            其gb18030的 code point 是 xk , 編碼是 gb18030(xk), 而 utf8(xu) 與 gb18030(xk) 可能想去甚遠

            # re: [轉]wchar_t與char轉換[未登錄]  回復  更多評論   

            2012-06-22 12:28 by JK
            char *pcstr = (char *)new char[2 * wcslen(pwstr)+1] ;
            memset(pcstr , 0 , 2 * wcslen(pwstr)+1);
            wstr2cstr(pwstr , pcstr , wcslen(pwstr));

            三句代碼把 wcslen 調用了三次,為什么不先算出來,調三次不浪費嗎?況且,你這里直接用 sizeof 更好,連函數調用都省去了。

            # re: [轉]wchar_t與char轉換  回復  更多評論   

            2012-11-27 07:28 by Martian
            可笑,完全錯誤,錯的沒邊了

            # re: [轉]wchar_t與char轉換  回復  更多評論   

            2012-11-29 17:05 by ikillmeba
            確實,有很多的錯誤,編譯器的問題,還有平臺的問題,都有可能

            # re: [轉]wchar_t與char轉換  回復  更多評論   

            2013-02-19 10:56 by ligand
            此文錯得太離譜。

            C++語言標準沒有規定wchar_t是多少比特寬度!!!

            在類Unix/Linux系統中,wchar_t是32比特寬。

            即使在Windows平臺上,一個wchar_t漢字字符轉為DBCS(雙字節表示,簡體中文即指gb2312/gbk/gb18030,三者可視為同一),也不能直接靠移位操作、字節復制之類,而必須去查表。因為wchar_t漢字字符保存的是Unicode的碼值的UTF-16小尾表示,與gb2312/gbk/gb18030完全不同。這就好比gb2312/gbk/gb18030與繁體的Big5轉換,也必須只能去查表。
            一本大道久久东京热无码AV| 狠狠色噜噜色狠狠狠综合久久 | 精品久久久久久久久免费影院| 性做久久久久久久久老女人| 久久精品人人做人人爽电影蜜月| 狠狠精品久久久无码中文字幕| 久久精品综合网| 亚洲国产精品久久久久网站| 久久久久久久久久久久久久| 激情久久久久久久久久| 久久久久久午夜成人影院| 精品久久久久久中文字幕| 久久久久久精品免费看SSS | 国产成年无码久久久久毛片| 久久国产亚洲精品| 丁香狠狠色婷婷久久综合| 性欧美丰满熟妇XXXX性久久久 | 麻豆亚洲AV永久无码精品久久| 一本综合久久国产二区| 精品国产一区二区三区久久久狼| 狠狠干狠狠久久| 国产激情久久久久久熟女老人 | 囯产精品久久久久久久久蜜桃| 久久99热狠狠色精品一区| 香蕉久久夜色精品国产尤物| 91精品久久久久久无码| 久久久久亚洲av无码专区| 国产aⅴ激情无码久久| 亚洲欧美国产精品专区久久| 99久久国产综合精品成人影院| 欧美一区二区三区久久综合| 伊人久久五月天| 伊人久久精品影院| 青青久久精品国产免费看| 久久久久久青草大香综合精品| 亚洲国产精品无码久久久秋霞2| 久久青青草原精品国产| 一级做a爰片久久毛片看看| 国产精品激情综合久久| 免费一级做a爰片久久毛片潮| 狠狠人妻久久久久久综合|