• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            隨筆 - 96  文章 - 255  trackbacks - 0
            <2008年4月>
            303112345
            6789101112
            13141516171819
            20212223242526
            27282930123
            45678910

            E-mail:zbln426@163.com QQ:85132383 長期尋找對戰略游戲感興趣的合作伙伴。

            常用鏈接

            留言簿(21)

            隨筆分類

            隨筆檔案

            SDL相關網站

            我的個人網頁

            我的小游戲

            資源下載

            搜索

            •  

            積分與排名

            • 積分 - 492114
            • 排名 - 38

            最新評論

            閱讀排行榜

            評論排行榜

            <本文PDF文檔下載>

            locale和facet

            C++的locale框架比C更完備。C++除了一個籠統本地策略集locale,還可以為locale指定具體的策略facet,甚至可以用自己定義的facet去改造一個現有的locale產生一個新的locale。如果有一個facet類NewFacet需要添加到某個old_loc中形成新new_loc,需要另外一個構造函數,通常的做法是:
            std::locale new_loc(old_loc, new NewFacet);
            標準庫里的標準facet都具有自己特有的功能,訪問一個locale對象中特定的facet需要使用模板函數use_facet:
            template <class Facet> const Facet& use_factet(const locale&);
            換一種說法,use_facet把一個facet類實例化成了對象,由此就可以使用這個facet對象的成員函數。

            codecvt

            codecvt就是一個標準facet。在C++的設計框架里,這是一個通用的代碼轉換模板——也就是說,并不是僅僅為寬窄轉換制定的。
            templat <class I, class E, class State> class std::codecvt: public locale, public codecvt_base{...};
            I表示內部編碼,E表示外部編碼,State是不同轉換方式的標識,如果定義如下類型:
            typedef std::codecvt<wchar_t, char, mbstate_t> CodecvtFacet;
            那么CodecvtFacet就是一個標準的寬窄轉換facet,其中mbstate_t是標準寬窄轉換的State。

            內部編碼和外部編碼

            我們考慮第1節中提到的C++編譯器讀取源文件時候的情形,當讀到L"中文abc"的時候,外部編碼,也就是源文件的編碼,是GB2312或者UTF-8的char,而編譯器必須將其翻譯為UCS-2BE或者UTF-32BE的wchar_t,這也就是程序的內部編碼。如果不是寬字符串,內外編碼都是char,也就不需要轉換了。類似的,當C++讀寫文件的時候 ,就會可能需要到內外編碼轉換。事實上,codecvt就正是被文件流緩存basic_filebuf所使用的。理解這一點很重要,原因會在下一小節看到。

            CodecvtFacet的in()和out()
            因為在CodecvtFacet中,內部編碼設置為wchar_t,外部編碼設置為char,轉換模式是標準寬窄轉換mbstate_t,所以,類方法in()就是從char標準轉換到wchar_t,out()就是從wchar_t標準轉換到char。這就成了我們正需要的內外轉換函數。
            result in(State& s, const E* from, const E* from_end, const E*& from_next, I* to,  I* to_end, I*& to_next) const;
            result out(State& s, const I* from, const I* from_end, const I*& from_next, E* to, E* to_end, E*& to_next) const;
            其中,s是非const引用,保存著轉換位移狀態信息。這里需要重點強調的是,因為轉換的實際工作交給了運行時庫,也就是說,轉換可能不是在程序的主進程中完成的,而轉換工作依賴于查詢s的值,因此,如果s在轉換結束前析構,就可能拋出運行時異常。所以,最安全的辦法是,將s設置為全局變量!
            const的3個指針分別是待轉換字符串的起點,終點,和出現錯誤時候的停點(的下一個位置);另外3個指針是轉換目標字符串的起點,終點以及出現錯誤時候的停點(的下一個位置)。

            代碼如下:
            頭文件
            //Filename string_wstring_cppcvt.hpp

            #ifndef STRING_WSTRING_CPPCVT_HPP
            #define STRING_WSTRING_CPPCVT_HPP

            #include 
            <iostream>
            #include 
            <string>

            const std::wstring s2ws(const std::string& s);
            const std::string ws2s(const std::wstring& s);

            #endif
            實現:
            #include "string_wstring_cppcvt.hpp"

            mbstate_t in_cvt_state;
            mbstate_t out_cvt_state;

            const std::wstring s2ws(const std::string& s)
            {
                std::locale sys_loc(
            "");

                
            const char* src_str = s.c_str();
                
            const size_t BUFFER_SIZE = s.size() + 1;

                wchar_t
            * intern_buffer = new wchar_t[BUFFER_SIZE];
                wmemset(intern_buffer, 
            0, BUFFER_SIZE);

                
            const char* extern_from = src_str;
                
            const char* extern_from_end = extern_from + s.size();
                
            const char* extern_from_next = 0;
                wchar_t
            * intern_to = intern_buffer;
                wchar_t
            * intern_to_end = intern_to + BUFFER_SIZE;
                wchar_t
            * intern_to_next = 0;

                typedef std::codecvt
            <wchar_t, char, mbstate_t> CodecvtFacet;

                CodecvtFacet::result cvt_rst 
            =
                    std::use_facet
            <CodecvtFacet>(sys_loc).in(
                        in_cvt_state,
                        extern_from, extern_from_end, extern_from_next,
                        intern_to, intern_to_end, intern_to_next);
                
            if (cvt_rst != CodecvtFacet::ok) {
                    
            switch(cvt_rst) {
                        
            case CodecvtFacet::partial:
                            std::cerr 
            << "partial";
                            
            break;
                        
            case CodecvtFacet::error:
                            std::cerr 
            << "error";
                            
            break;
                        
            case CodecvtFacet::noconv:
                            std::cerr 
            << "noconv";
                            
            break;
                        
            default:
                            std::cerr 
            << "unknown";
                    }
                    std::cerr    
            << ", please check in_cvt_state."
                                
            << std::endl;
                }
                std::wstring result 
            = intern_buffer;

                delete []intern_buffer;

                
            return result;
            }

            const std::string ws2s(const std::wstring& ws)
            {
                std::locale sys_loc(
            "");

                
            const wchar_t* src_wstr = ws.c_str();
                
            const size_t MAX_UNICODE_BYTES = 4;
                
            const size_t BUFFER_SIZE =
                            ws.size() 
            * MAX_UNICODE_BYTES + 1;

                
            char* extern_buffer = new char[BUFFER_SIZE];
                memset(extern_buffer, 
            0, BUFFER_SIZE);

                
            const wchar_t* intern_from = src_wstr;
                
            const wchar_t* intern_from_end = intern_from + ws.size();
                
            const wchar_t* intern_from_next = 0;
                
            char* extern_to = extern_buffer;
                
            char* extern_to_end = extern_to + BUFFER_SIZE;
                
            char* extern_to_next = 0;

                typedef std::codecvt
            <wchar_t, char, mbstate_t> CodecvtFacet;

                CodecvtFacet::result cvt_rst 
            =
                    std::use_facet
            <CodecvtFacet>(sys_loc).out(
                        out_cvt_state,
                        intern_from, intern_from_end, intern_from_next,
                        extern_to, extern_to_end, extern_to_next);
                
            if (cvt_rst != CodecvtFacet::ok) {
                    
            switch(cvt_rst) {
                        
            case CodecvtFacet::partial:
                            std::cerr 
            << "partial";
                            
            break;
                        
            case CodecvtFacet::error:
                            std::cerr 
            << "error";
                            
            break;
                        
            case CodecvtFacet::noconv:
                            std::cerr 
            << "noconv";
                            
            break;
                        
            default:
                            std::cerr 
            << "unknown";
                    }
                    std::cerr    
            << ", please check out_cvt_state."
                                
            << std::endl;
                }
                std::
            string result = extern_buffer;

                delete []extern_buffer;

                
            return result;
            }
            最后補充說明一下std::use_facet<CodecvtFacet>(sys_loc).in()和std::use_facet<CodecvtFacet>(sys_loc).out()。sys_loc是系統的locale,這個locale中就包含著特定的codecvt facet,我們已經typedef為了CodecvtFacet。用use_facet對CodecvtFacet進行了實例化,所以可以使用這個facet的方法in()和out()。
            posted on 2010-06-26 13:39 lf426 閱讀(8792) 評論(2)  編輯 收藏 引用 所屬分類: 語言基礎、數據結構與算法

            FeedBack:
            # re: 徹底解密C++寬字符:4、利用codecvt和use_facet轉換 2011-09-14 21:09 jjk
            useful  回復  更多評論
              
            # re: 徹底解密C++寬字符:4、利用codecvt和use_facet轉換 2015-07-12 17:17 csxy
            好文章 頂一個  回復  更多評論
              
            国产99久久久国产精免费| 品成人欧美大片久久国产欧美...| 久久久久久久久久久免费精品| 久久亚洲中文字幕精品一区| 亚洲精品无码久久久| 国产精品久久毛片完整版| 久久免费观看视频| 亚洲va中文字幕无码久久不卡| 久久精品国产精品青草| 国产成人无码精品久久久性色 | 久久婷婷是五月综合色狠狠| 久久夜色精品国产欧美乱| 久久电影网| 77777亚洲午夜久久多喷| 无码人妻少妇久久中文字幕| 久久超乳爆乳中文字幕| 婷婷久久综合九色综合绿巨人| 伊人色综合久久天天| 久久精品国产亚洲综合色| 亚洲第一极品精品无码久久| 香港aa三级久久三级老师2021国产三级精品三级在 | 久久天天躁狠狠躁夜夜avapp | 久久无码人妻一区二区三区午夜| 狠狠久久综合| 久久精品a亚洲国产v高清不卡| 中文精品久久久久人妻不卡| 欧美色综合久久久久久| 久久不见久久见免费影院www日本| 国产成人综合久久综合| 97久久超碰国产精品2021| 国产亚洲欧美精品久久久| 久久久久久午夜成人影院 | 色综合久久久久网| 国产综合久久久久久鬼色| 久久国产精品一国产精品金尊| 色婷婷综合久久久久中文一区二区 | 亚洲中文久久精品无码| 亚洲精品无码久久千人斩| 久久人人妻人人爽人人爽| 久久91精品国产91久久小草 | 亚洲精品无码久久久久sm|