• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            franksunny的個(gè)人技術(shù)空間
            獲得人生中的成功需要的專(zhuān)注與堅(jiān)持不懈多過(guò)天才與機(jī)會(huì)。 ——C.W. Wendte

            Symbian OS平臺(tái)簡(jiǎn)體漢字編程編碼處理

             

            相信大家都在處理symbian中文顯示的時(shí)候遇到了編碼的問(wèn)題,我現(xiàn)在就給總結(jié)一下這種問(wèn)題的解決方法:

            字符串編碼中文表示常用的有:GB2312,GBK,Unicode,UTF-8

            其中GBKGB2312的超集,也就是涵蓋了GB2312編碼的所有內(nèi)容;

            UTF-8Unicode的在網(wǎng)絡(luò)傳輸中的一種編碼格式。

            如果我們使用vc做為開(kāi)發(fā)工具,在win下面進(jìn)行開(kāi)發(fā),那么win的默認(rèn)字符集是GBK的;由于中文資源文件采用UTF-8存儲(chǔ),所以也有種情況是將代碼文件也采用用UTF-8編碼(目前我們?cè)?/span>Carbide上就是這樣做的)。然而symbian系統(tǒng)默認(rèn)的編碼方式卻是Unicode,所以說(shuō)直接寫(xiě)在程序里面的漢字在手機(jī)上顯示的時(shí)候,就會(huì)變成亂碼。

            以下對(duì)S60應(yīng)用處理簡(jiǎn)體漢字編碼情況分為兩大類(lèi)即UTF-8和非UTF-8(通稱(chēng)GBK):

            UTF-8編碼字串
            1.資源文件中的UTF-8編碼字串

            理論上,從資源文件中獲取的字串可以直接用于顯示(直接寫(xiě)屏、應(yīng)用標(biāo)題、按鈕、菜單及各種UI控件)和寫(xiě)文件等操作。但關(guān)鍵是:由于 Symbian OS默認(rèn)編碼與Windows等操作系統(tǒng)默認(rèn)編碼不同,所以在Windows等環(huán)境中編輯資源源文件(.rss.rls.loc)時(shí)必須將文件的頭部加入CHARACTER_SET UTF8設(shè)置,并以UTF-8編碼保存,如此編譯后的資源文件字串才能得到正常處理。特別是對(duì)于漢字這種非ASCII標(biāo)準(zhǔn)字符(這里的ASCII標(biāo)準(zhǔn)字符是指單字節(jié)編碼字符,漢字是擴(kuò)展的多字節(jié)編碼字符,一般為GBK/GB2312編碼)。

            能將文件以UTF-8編碼保存的編輯器有許多(例如Windows的記事本),但最好是用一些16位的編輯器將以UTF-8編碼保存的文件開(kāi)頭的3個(gè)字節(jié)長(zhǎng)的字節(jié)序標(biāo)記(Byte Order Mark)刪除以便編譯系統(tǒng)識(shí)別(例如Windows中命令行的Edit),這一點(diǎn)對(duì)于S60 3.0平臺(tái)更是如此。(在這里做下延伸,本人在編程中就遇到過(guò)類(lèi)似問(wèn)題,代碼原先用Utf8的,后來(lái)用記事本打開(kāi)修改了下,之后存儲(chǔ)就多了3個(gè)字節(jié)序的標(biāo)記,編譯時(shí)就問(wèn)題多多了)

            2.程序文件中的UTF-8編碼字串

            同樣,程序源文件(.cpp)中的字串默認(rèn)情況下也不是UTF-8編碼,如要直接使用也必須以UTF-8編碼保存程序源文件。例如某程序源文件中:

            LIT( KUTF8String, "簡(jiǎn)體漢字串");

            CAknInformationNote* InfoNote;

            InfoNote = new ( ELeave ) CAknInformationNote;

            InfoNote->ExecuteLD( KUTF8String);

            用記事本將此源文件保存為UTF-8編碼,這樣編譯后可正常顯示,無(wú)需編碼轉(zhuǎn)換,不過(guò)由于編譯環(huán)境的識(shí)別問(wèn)題需要注意的是:

            1).模擬器平臺(tái)應(yīng)用(WINSWINSCW等)不可將文件開(kāi)頭的字節(jié)序標(biāo)記(Byte Order Mark)刪除;

            2).真機(jī)平臺(tái)應(yīng)用(THUMBARMIGCCE等)必須將文件開(kāi)頭的字節(jié)序標(biāo)記(Byte Order Mark)刪除。

            順便提一下Carbide中簡(jiǎn)體漢字的處理,重點(diǎn)是修改工程或文件的文本編碼方式。對(duì)于通過(guò).inf.mmp導(dǎo)入的工程(這種方法比較好),只要導(dǎo)入前源文件符合前面以UTF-8編碼保存的那些要求,就不必修改文本編碼方式。而對(duì)于新工程,資源源文件中除了加入CHARACTER_SET UTF8設(shè)置,最好將源文件的文本編碼方式改為UTF-8,否則Carbide將不按UTF-8編碼處理文本,顯示將不正常。具體方法如下:

            1).右鍵點(diǎn)擊工程文件夾的某個(gè)資源源文件->properties->Info,將Text file ecoding改為others中的UTF-8

            2).右鍵點(diǎn)擊工程文件夾->properties->Info,將Text file encoding改為others中的UTF-8

            兩者取一即可,只是后一種將使工程所有源文件的文本編碼方式變?yōu)?/span>UTF-8。另外需要注意,Carbide中一旦有文本編碼方式的修改,特別是資源源文件,最好重新寫(xiě)入字串,清除(clean)之后再建立應(yīng)用或運(yùn)行(buildrun,否則上一次的結(jié)果仍可能會(huì)存在而影響這一次的建立。

            .UTF-8編碼字串

            如前所述,如果不以UTF-8編碼保存程序源文件,則程序源文件(.cpp)中的字串即為非UTF-8 編碼字串。要想正常操作,則必須進(jìn)行編碼轉(zhuǎn)換,但不是轉(zhuǎn)換為UTF-8編碼,而是必須轉(zhuǎn)換成Unicode(標(biāo)準(zhǔn)的Unicode也稱(chēng)UTF-16)編碼。例如:

            _LIT8( KNonUnicodeString, "簡(jiǎn)體漢字串");

            TPtrC8 point8( KNonUnicodeString );

            CCnvCharacterSetConverter* converter = CCnvCharacterSetConverter::NewLC();

             

            //一般簡(jiǎn)體中文Windows使用的簡(jiǎn)體漢字編碼是Gb2312GbkASCII字符集的擴(kuò)展,

            //也稱(chēng)ASCI字符集),所以如果既不是這兩者則直接報(bào)異常KErrNotSupported

            if(converter ->PrepareToConvertToOrFromL(KCharacterSetIdentifierGbk,

                iEikonEnv->FsSession()) == CCnvCharacterSetConverter::EAvailable )

               {

               }

            else if(converter->PrepareToConvertToOrFromL(KCharacterSetIdentifierGb2312,

               iEikonEnv->FsSession()) != CCnvCharacterSetConverter::EAvailable)

              {

               CleanupStack::PopAndDestroy();

               User::Leave( KErrNotSupported ); 

              }

             

            //進(jìn)行GBKUnicode的轉(zhuǎn)換

            TInt state=CCnvCharacterSetConverter::KStateDefault;

            HBufC* UnicodeString = HBufC::NewL( point8 );

            TPtr16 point16 = UnicodeString->Des();

            if(CCnvCharacterSetConverter::EErrorIllFormedInput ==

                converter->ConvertToUnicode(point16, point8, state ) )

               {

                CleanupStack::PopAndDestroy();

                User::Leave(KErrArgument); 

               }

            CleanupStack::PopAndDestroy(2); // converter UnicodeString

             

            UnicodeString即為Unicode編碼的字串,可以直接用于顯示及寫(xiě)文件等操作。簡(jiǎn)體漢字串的顯示除了編碼問(wèn)題,還要注意字體的選擇,特別是對(duì)UI控件,最好是用LatinBold12()2版),AknLayoutUtils::FontFromId( ELatinBold12 )3版)。簡(jiǎn)體漢字串顯示的相關(guān)文檔,例程很多,在這里就不多說(shuō)了。至于文件中讀寫(xiě)簡(jiǎn)體漢字串則要提幾點(diǎn)注意:

            1.自己寫(xiě)自己讀

            借助Symbian的文件服務(wù)將字串寫(xiě)入文件,一般都是帶格式的,文件的首字符用來(lái)表示緊跟字串的長(zhǎng)度和編碼,所以不是什么文件都可以讀的,例如用記事本編輯的文件一般就無(wú)法正確讀出,除非寫(xiě)對(duì)了格式,而這種格式手工寫(xiě)是很煩瑣的。所以對(duì)于程序內(nèi)部文件讀寫(xiě),最好是:拿什么寫(xiě)就用什么讀,要拿什么讀就用什么寫(xiě)。

            2.UTF-8編碼簡(jiǎn)體漢字串讀寫(xiě)文件

            無(wú)論是從資源文件中讀取的,還是.cpp中定義的UTF-8編碼字串,都可以直接寫(xiě)直接讀,無(wú)需編碼轉(zhuǎn)換。例如:

            //寫(xiě)文件

            _LIT( KFileName, "\\private\\xxxxxxxx\\aTextFile.txt" );

            _LIT( KUTF8String, "簡(jiǎn)體漢字串");

            //或者HBufC* UTF8String=StringLoader::LoadLC(R_UTF8_RESOURCE_STRING );

             

            RFs  FileServerSession;

            User::LeaveIfError(FileServerSession.Connect());

            RFile file;

            if ( file.Replace(FileServerSession, KFileName, EFileWrite ) != KErrNone )

                {

                return;

                }

            CleanupClosePushL( file );

             

            RFileWriteStream StreamWriteToFile(file);

            CleanupClosePushL( StreamWriteToFile );

            StreamWriteToFile << KUTF8String;//或者StreamWriteToFile << *UTF8String

            CleanupStack::PopAndDestroy(2); //file StreamWriteToFile

             

            //讀文件

            RFs FileServerSession;

            RFile file;

            User::LeaveIfError(FileServerSession.Connect());

            CleanupClosePushL(FileServerSession);

            User::LeaveIfError(file.Open(FileServerSession,KHelloFileName, EFileStreamText));

            CleanupClosePushL(file);

            RFileReadStream StreamReadFromFile(file);

            CleanupClosePushL(StreamReadFromFile);

            HBufC* StreamData= HBufC::NewLC(StreamReadFromFile, 32);

            CleanupStack::PopAndDestroy(3); //file StreamReadFromFile StreamData

            FileServerSession.Close();

             

            以上得到的StreamData可以通過(guò):

            CAknInformationNote* InfoNote;

            InfoNote = new ( ELeave ) CAknInformationNote;

            InfoNote->ExecuteLD( *StreamData )

            加以顯示驗(yàn)證。

            3.UTF-8編碼簡(jiǎn)體漢字串讀寫(xiě)文件

            如前所述,非UTF8編碼簡(jiǎn)體漢字串必須進(jìn)行編碼轉(zhuǎn)換,主要有兩種方法:

            1).將字串轉(zhuǎn)換為Unicode編碼寫(xiě)入文件后直接讀取

            //轉(zhuǎn)換后寫(xiě)文件 前面部分代碼跟之前GBK轉(zhuǎn)Unicode的轉(zhuǎn)換是一樣的

            _LIT( KFileName, "\\private\\xxxxxxxx\\aTextFile.txt" );

            RFs FileServerSession;

            User::LeaveIfError(FileServerSession.Connect());

            RFile file;

            if ( file.Replace(FileServerSession, KFileName, EFileWrite ) != KErrNone )

               {

               return;

               }

            CleanupClosePushL( file );

             

            _LIT8( KNonUnicodeString, "簡(jiǎn)體漢字串");

            TPtrC8 point8( KNonUnicodeString );

            CCnvCharacterSetConverter* converter=CCnvCharacterSetConverter::NewLC();

            if( converter->PrepareToConvertToOrFromL(KCharacterSetIdentifierGbk,

               iEikonEnv->FsSession()) == CCnvCharacterSetConverter::EAvailable )

               {

               }

            elseif ( converter->PrepareToConvertToOrFromL(KCharacterSetIdentifierGb2312,

               iEikonEnv->FsSession())!= CCnvCharacterSetConverter::EAvailable  )

              {

               CleanupStack::PopAndDestroy();

               User::Leave( KErrNotSupported ); 

              }

             

            TInt state=CCnvCharacterSetConverter::KStateDefault;

            HBufC* UnicodeString = HBufC::NewL( point8 );

            TPtr16 point16 = UnicodeString->Des();

            if( CCnvCharacterSetConverter::EErrorIllFormedInput ==

              converter->ConvertToUnicode(point16, point8, state ) )

              {

               CleanupStack::PopAndDestroy();

               User::Leave(KErrArgument); 

              }

             

            RFileWriteStream StreamWriteToFile( file );

            CleanupClosePushL( StreamWriteToFile );

            StreamWriteToFile << *UnicodeString;

            CleanupStack::PopAndDestroy(4);//file StreamWriteToFile converter UnicodeString

            FileServerSession.Close();

            直接讀取的方法與UTF-8編碼簡(jiǎn)體漢字串讀寫(xiě)文件的讀文件操作相同。

            2).將字串直接寫(xiě)入文件后再讀取轉(zhuǎn)換

            直接寫(xiě)文件的方法與UTF-8編碼簡(jiǎn)體漢字串讀寫(xiě)文件的寫(xiě)文件操作相同。

            //讀取后轉(zhuǎn)換 先寫(xiě)文件,GBK也是8位的編碼

            RFs FileServerSession;

            RFile file;

            User::LeaveIfError(FileServerSession.Connect());

            CleanupClosePushL(FileServerSession);

            User::LeaveIfError(file.Open(FileServerSession,KHelloFileName, EFileStreamText));

            CleanupClosePushL(file);

            RFileReadStream StreamReadFromFile(file);

            CleanupClosePushL(StreamReadFromFile);

            HBufC* StreamData = HBufC::NewLC(StreamReadFromFile, 32);

            HBufC8* StreamData8 = HBufC8::NewLC( StreamData->Length() );

            StreamData8->Des().Copy(*StreamData);

             

            //轉(zhuǎn)換 GBK轉(zhuǎn)Unicode,代碼跟之前的一樣

            TPtrC8 point8( *StreamData8 );

            CCnvCharacterSetConverter* converter=CCnvCharacterSetConverter::NewLC();

            if(converter->PrepareToConvertToOrFromL(KCharacterSetIdentifierGbk,

               iEikonEnv->FsSession()) == CCnvCharacterSetConverter::EAvailable )

              {

              }

            else  if ( converter->PrepareToConvertToOrFromL(KCharacterSetIdentifierGb2312,

              iEikonEnv->FsSession())!= CCnvCharacterSetConverter::EAvailable  )

              {

               CleanupStack::PopAndDestroy();

               User::Leave( KErrNotSupported ); 

              }

            TInt state=CCnvCharacterSetConverter::KStateDefault;

            HBufC* UnicodeString = HBufC::NewL( point8 );

            TPtr16 point16 = UnicodeString->Des();

            if( CCnvCharacterSetConverter::EErrorIllFormedInput ==

              converter->ConvertToUnicode(point16, point8, state ) )

              {

               CleanupStack::PopAndDestroy();

               User::Leave(KErrArgument); 

              }

             

            CleanupStack::PopAndDestroy(6); //file StreamReadFromFile StreamData StreamData8 converter UnicodeString

            FileServerSession.Close();

            得到的UnicodeString也可以通過(guò):

            CAknInformationNote* InfoNote;

            InfoNote = new ( ELeave ) CAknInformationNote;

            InfoNote->ExecuteLD( *UnicodeString );

            加以顯示驗(yàn)證。()

             

            以上代碼的集成開(kāi)發(fā)環(huán)境為:

            Active Perl 5.6.1 build 631

            Java Runtime Enviroment v1.5.0_07

            CodeWarrior Personal Edition 3.1

            S60 3RD EDITION SDK FOR SYMBIAN OS, FOR C++

            在以命令行建立的應(yīng)用中驗(yàn)證正常(WINSCWGCCE)。如果是其它的建立應(yīng)用方式或IDE可能需要做相應(yīng)的變化,或根本不可行,在這里只是給大家提供一種思路和方法。

            總之,簡(jiǎn)體漢字的處理,最重要的在于對(duì)字符編碼的掌握,說(shuō)到底就是要依據(jù)不同的編碼情況進(jìn)行相應(yīng)的編碼轉(zhuǎn)換操作。最為理想和不受開(kāi)發(fā)環(huán)境影響的方法個(gè)人認(rèn)為是:資源文件法,也就是將字符串以UTF-8編碼保存在資源源文件中,并設(shè)置以UTF-8編碼去處理。它最為簡(jiǎn)便,也最為有效,且便于本地化的移植。其它方法只是提供一種參考,一個(gè)可行的方案。

            其實(shí),本文所討論的方法不僅僅對(duì)簡(jiǎn)體漢字有效,理論上對(duì)所有非ANSII標(biāo)準(zhǔn)字符都適用。

            補(bǔ)記一:字節(jié)序標(biāo)記(Byte Order Mark

            BOM(Byte Order Mark),是在Unicode標(biāo)準(zhǔn)(UTF-16)引入后,對(duì)于Unicode純文本文件判斷其比特順序的標(biāo)記,在UTF-16 Little Endian字節(jié)序下為(0xFF0xFE),在UTF-16 Big Endian下為(0xFE0xFF);如果進(jìn)行相應(yīng)的UTF-16UTF-8轉(zhuǎn)換,該處兩個(gè)字節(jié)會(huì)被處理成為三個(gè)字節(jié)的UTF-8編碼字節(jié)序標(biāo)記。(在Windows系統(tǒng)中是小端字節(jié)序的,所以保存為UTF16BOM的前面字節(jié)序?yàn)?/span>0xFF 0xFE;同理UTF-8Windows小端字節(jié)序下為0xEF 0xBB 0xBF)。

             

            補(bǔ)記二:網(wǎng)上流傳的GBKUnicode互轉(zhuǎn)函數(shù)

            代碼中添加頭文件

            #include <charconv.h>        //  for char set convert GBK - Unicode

            mmp里面添加

            LIBRARY         charconv.lib    // for GBK to Unicode converter

            這兩步完成后,將下面的這兩個(gè)函數(shù)就可以正常編譯和使用了。

            //GBK轉(zhuǎn)Unicode

            void ConvGbk2Uni(TDesC8& original, TDes& res)

                   {

                   RFs fileServerSession;

                   aFileServerSession.Connect();

                   CCnvCharacterSetConverter* converter=CCnvCharacterSetConverter::NewLC();

                  

                   if(converter->PrepareToConvertToOrFromL(KCharacterSetIdentifierGbk, aFileServerSession) != CCnvCharacterSetConverter::EAvailable)

                          {

                          User::Leave(KErrNotSupported);

                          }

                  

                   TInt state=CCnvCharacterSetConverter::KStateDefault;

                   TPtrC8 str(original);

                   HBufC* iInfoText = HBufC::NewL(str.Length());

                   TPtr16 ptr = iInfoText->Des();

                   if(CCnvCharacterSetConverter::EErrorIllFormedInput == converter->ConvertToUnicode(ptr, str, state))

                          {

                          User::Leave(KErrArgument);

                          }

                  

                   res.Zero();

                   res.Copy(ptr);

                   fileServerSession.Close();

                   CleanupStack::PopAndDestroy();

                   delete iInfoText;

                   }

             

            //Unicode 轉(zhuǎn)GBK,也許有些人覺(jué)得沒(méi)必要轉(zhuǎn)GBK但是數(shù)據(jù)庫(kù)中文排序之類(lèi)的就需要

            void ConvUni2Gbk(TDesC& original, TDes8& res)

                   {

                   TInt state=CCnvCharacterSetConverter::KStateDefault ;

                   CCnvCharacterSetConverter* iConv ;

                   iConv = CCnvCharacterSetConverter::NewLC();

                   if(iConv->PrepareToConvertToOrFromL(KCharacterSetIdentifierGbk,

                                 iEikonEnv->FsSession())!=CCnvCharacterSetConverter::EAvailable)

                          {

                          User::Leave(KErrNotSupported);

                          }

                   iConv->ConvertFromUnicode(res, original, state) ;

                   CleanupStack::PopAndDestroy();

                   }

             

            具體的使用方法:

            TBuf8<20> title8 ;

            TBuf<20>  title16 ;

            TBuf8<20>  msg8 ;

            TBuf<20>   msg16 ;

            title8.Format(_L8("友情提示")) ;

            ConvGbk2Uni(title8, title16) ;

            msg8.Format(_L8(" 謝謝您的使用")) ;

            ConvGbk2Uni(msg8, msg16) ;

            現(xiàn)在title16msg16里面都存放的是16位的unicode中文字符串了,

             

            本文是對(duì)網(wǎng)上兩篇文檔的合并,具體見(jiàn)下面鏈接

            http://my.sdlgame.com/programming/116-symbian/3175-s60

            http://soft6.com/tech/6/60568.html

             

            posted on 2008-09-10 20:11 frank.sunny 閱讀(4094) 評(píng)論(1)  編輯 收藏 引用 所屬分類(lèi): symbian 開(kāi)發(fā)

            FeedBack:
            # re: [整理]Symbian OS平臺(tái)簡(jiǎn)體漢字編程編碼處理
            2008-09-17 17:08 | frank.sunny
            自己再來(lái)添點(diǎn)東西
            中秋上來(lái)兩天因?yàn)檫@個(gè)轉(zhuǎn)換的事情郁悶到了現(xiàn)在,由于開(kāi)發(fā)時(shí)用到了2nd版本,而且是C/S架構(gòu)的,Server在3rd跑得好好的,到了2nd上運(yùn)行到PrepareToConvertToOrFromL老是崩潰,后來(lái)將mmp中的EPOCSTACKSIZE設(shè)成為0x5000程序就ok了,與真正的CCnvCharacterSetConverter沒(méi)有關(guān)系  回復(fù)  更多評(píng)論
              

            常用鏈接

            留言簿(13)

            隨筆分類(lèi)

            個(gè)人其它博客

            基礎(chǔ)知識(shí)鏈接

            最新評(píng)論

            閱讀排行榜

            評(píng)論排行榜

            久久精品国产亚洲AV电影| 国产成人精品综合久久久| 2021最新久久久视精品爱| 麻豆精品久久久久久久99蜜桃| 亚洲?V乱码久久精品蜜桃| 欧美久久久久久| 少妇人妻88久久中文字幕| 久久国产精品一国产精品金尊| 久久99精品国产麻豆宅宅| 久久久久久久国产免费看| 久久综合鬼色88久久精品综合自在自线噜噜 | 思思久久精品在热线热| 中文字幕日本人妻久久久免费| 久久人人爽人人爽人人片av高请| 久久成人国产精品二三区| 色偷偷88欧美精品久久久| 色综合久久综合中文综合网| 久久夜色精品国产亚洲| 久久久午夜精品| 狠狠色婷婷综合天天久久丁香| 久久99精品国产99久久6| 亚洲午夜久久久久妓女影院 | 国产成人AV综合久久| 欧美无乱码久久久免费午夜一区二区三区中文字幕 | 国产亚洲美女精品久久久久狼| 久久精品亚洲欧美日韩久久| 777午夜精品久久av蜜臀| 伊人久久综合热线大杳蕉下载| 国产99久久久国产精品小说 | 欧美日韩精品久久久免费观看| www性久久久com| 人妻无码精品久久亚瑟影视| 国产69精品久久久久777| 亚洲国产成人久久综合野外| 久久久久久狠狠丁香| 午夜精品久久久久久毛片| 久久久99精品成人片中文字幕| 精品久久久久香蕉网| 久久久一本精品99久久精品88| 精品无码久久久久久久动漫| 国内精品久久久久影院优|