久久久这里只有精品加勒比,精品国产91久久久久久久 ,免费久久人人爽人人爽av

多國語言惹得禍

        上面下指令說要做多國語言版的程序，這可是個不小的改動呀。于是我就拿當前的程序運行，一系列的問題隨之出現了。
        話分兩頭，先說跑在Windows上的，最基本的就是讀各種語言的文件名，正常英文還是正常的，但遇到俄文，法文，德文時就出現問題，正常的字符都變成了"?"，跟蹤內存發現讀入內存的字符已經變成了3f00，也就是"?"的unicode，可見是讀入目錄到內存的函數出了問題，如下代碼：
   long filehandle;
    //the structure of file
    struct _finddata_t entry;
    //"*" means get all the file and directory
    // Get the first file
    if((filehandle = _findfirst( "*", &entry )) != -1)    //-1 means the directory is null
    {
        tree* child;
        do{
            if(entry.attrib&FILE_ATTRIBUTE_DIRECTORY){
                if ( strcmp("..", entry.name) != 0 && strcmp(".", entry.name) != 0){
                    //printf("%*s%s\\\n", depth, "", entry.name);
                    if(treenode)
                    {
                        char name[MAX_LOCALPATH_FOLDERNAME_LENGTH+1];
                        strncpy(name,entry.name,MAX_LOCALPATH_FOLDERNAME_LENGTH-1);
                        strcat(name,"\\");
                        child=new tree(name);
                        treenode->AddChild(child);
                    }
                    //Recursively processes directories
                    //printdir(entry.name, depth + 4,child);
                }
            } else{
                //printf("%*s%s\n", depth, "", entry.name);
                if(treenode)
                {
                    child=new tree(entry.name);
                    treenode->AddChild(child);
                }
            }
        }while( (_findnext(filehandle,&entry)) ==0 );
    }

    chdir("..");
    _findclose(filehandle);
        通過查證MSDN得知類似于_findfirst，findnext都是針對ASCII碼的，要讀unicode（windows默認字符集），就得用_wfindfirst，_wfindnext等讀寬字符的操作函數，最終解決問題，但我沒有松氣，因為程序主要是運行在linux中的，Linux真不知道怎么整了。
        Linux上讀多國語言的文件和目錄就需要對Linux系統深入了解，因為我要讀的文件是usb上的文件，所以得先掛載到一個目錄，
        mount -t vfat /dev/sda1 /mnt/usb，然后readdir讀入文件，與Windows上同樣的錯，讀入的是"?"，我想和windows一樣去找一個類似wreaddir，但是沒有。于是應該從掛載著手，目前在NTFS和FAT32/VFAT下的文件系統上都使用了Unicode,這就需要系統在讀取這些文件名時動態將其轉換為相應的語言編碼，也就是說掛載的時候要把usb上的編碼轉化成16位的Unicode編碼，改命令如下后成功。
        mount -o iocharset = utf8 /dev/sda1 /mnt/usb.
        Linux對iocharset的解釋如下：
        Character set to use for converting between 8 bit characters and 16 bit unicode charaters.The default is iso8859-1. Long filenames are stored on disk in Unicode format.
        至此終于解決了多國語言的問題，接著我無法想象還有什么問題會出來，但我準備好了。

posted on 2007-11-09 18:53 攀升閱讀(1713) 評論(5) 編輯收藏引用所屬分類: Linux

# re: 多國語言惹得禍回復 更多評論

不錯不錯，大問題解決了，現在出問題可能會在由于是UNICODE，字串處理函數全部換掉，字符串變長，用于保存字串的數組要仔細檢查，小心溢出

2007-11-09 20:51 | netdigger

# re: 多國語言惹得禍[未登錄] 回復 更多評論

Did you try boost.filesystem? It providesa convenient directory iterator(as easy as like walk() in python) and supports wide characters well

2007-11-09 21:00 | tom

# re: 多國語言惹得禍回復 更多評論

先把代碼風格解決了吧

2007-11-10 20:13 | 123

# re: 多國語言惹得禍回復 更多評論

這個可是個不曉得工程吧。

2007-11-10 20:23 | <a href=http://minidx.com>minidxer</a>

# re: 多國語言惹得禍 回復 更多評論

@netdigger
你說的很有道理

2007-11-13 11:15 | 攀升

刷新評論列表

只有注冊用戶登錄后才能發表評論。
【推薦】100%開源！大型工業跨平臺軟件C++源碼提供，建模，組態！

相關文章: (轉)MongoDB與內存 ./configure -build,-host,-target設置 UDP"打洞"原理 (轉)P2P之UDP穿透NAT的原理與實現（附源代碼） (轉)P2P之UDP穿透NAT的原理與實現（附源代碼）（轉）UNIX IO---再談文件描述符 dup與賦值語句用于文件描述符的區別（聚合） Linux進程通信:管道要點 firmware是什么 glibc: getopt()

網站導航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

# re: 多國語言惹得禍回復 更多評論

# re: 多國語言惹得禍[未登錄] 回復 更多評論

# re: 多國語言惹得禍回復 更多評論

# re: 多國語言惹得禍回復 更多評論

# re: 多國語言惹得禍 回復 更多評論

攀升·Uranus

多國語言惹得禍

評論

導航

隨筆分類

相冊

PASSION團隊

圈子

最新隨筆

最新評論

攀升·Uranus

多國語言惹得禍

評論

# re: 多國語言惹得禍 回復 更多評論

# re: 多國語言惹得禍[未登錄] 回復 更多評論

# re: 多國語言惹得禍 回復 更多評論

# re: 多國語言惹得禍 回復 更多評論

# re: 多國語言惹得禍 回復 更多評論

導航

隨筆分類

相冊

PASSION團隊

圈子

最新隨筆

最新評論

# re: 多國語言惹得禍回復更多評論

# re: 多國語言惹得禍[未登錄] 回復更多評論

# re: 多國語言惹得禍回復更多評論

# re: 多國語言惹得禍回復更多評論

# re: 多國語言惹得禍回復更多評論