青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

Codejie's C++ Space

Using C++

LingosHook:自己造的輪子對路面要求太高了~


    為了搞定HTML,這幾天在學著用Tidylib,終于搞明白了,喜滋滋地合并到代碼中一測試,傻眼了--字符集問題。。。
    Tidylib的輸入流似乎只支持const char*, 因此不的不將std::wstring從‘寬字節’轉換為‘多字節。轉換了幾次,時好時壞,搞到半夜才發現自己所用的幾個測試HTML頁面都各種包含著不同的字符集,于是字符集問題就出來了,也搞死我了~最后一咬牙,一跺腳,老子我不轉了,都用‘RAW’數據好了,‘寬’到‘多’直接用UTF8了。。。于是就有了下面的代碼。

int CHtmlTidyObject::Tidy(const std::wstring &input, std::wstring &output)
{
    
int codepage = CP_UTF8;//54936;//CP_UTF8;

    
int ret = -1;

    TidyDoc tdoc 
= tidyCreate();
    
if(tidyOptSetBool(tdoc, TidyMark, no) != yes)
        
return -1;
    
if(tidyOptSetInt(tdoc, TidyDoctypeMode, TidyDoctypeOmit) != yes)
        
return -1;
    
if(tidyOptSetBool(tdoc, TidyHideComments, yes) != yes)
        
return -1;
    
if(tidyOptSetInt(tdoc, TidyWrapLen, 0!= yes)
        
return -1;
    
//if(tidyOptSetBool(tdoc, TidyMakeClean, yes) != yes)//css
    
//    return -1;
  
    
if(tidyOptSetBool(tdoc, TidyUpperCaseTags, yes) != yes)
        
return -1;
    
if(tidyOptSetBool(tdoc, TidyHtmlOut, yes) != yes)
        
return -1;
    
if(tidySetCharEncoding(tdoc, "raw"!= 0)
        
return -1;
    
    
if(tidyOptSetBool(tdoc, TidyShowWarnings, no) != yes)
        
return -1;
    
if(tidyOptSetInt(tdoc, TidyShowErrors, 0!= yes)
        
return -1;

    
if(tidyOptSetBool(tdoc, TidyForceOutput, yes) != yes)
        
return -1;

    
int sz = WideCharToMultiByte(codepage, 0, input.c_str(), input.size(), NULL, 0, NULL, NULL);
    
if(sz == -1)
        
return -1;
    
char* buf = new char[sz + 1];
    sz 
= WideCharToMultiByte(codepage, 0, input.c_str(), input.size(), buf, sz, NULL, NULL);
    
    
if(tidyParseString(tdoc, buf) >= 0)
    
{
        
//TidyBuffer errbuf = {0};
        
//tidySetErrorBuffer( tdoc, &errbuf );
        if(tidyCleanAndRepair(tdoc) >= 0)
        
{
            
//tidyRunDiagnostics( tdoc ); 

            TidyBuffer outbuf 
= 0 };
            
if(tidySaveBuffer(tdoc, &outbuf) >= 0)
            
{
                
//std::cout << "OUTPUT->\n" << outbuf.bp << std::endl;
                int wsz = MultiByteToWideChar(codepage, 0, (const char*)outbuf.bp, outbuf.size, NULL, 0);
                wchar_t
* wbuf = new wchar_t[wsz + 1];
                wsz 
= MultiByteToWideChar(codepage, 0, (const char*)outbuf.bp, outbuf.size, wbuf, wsz);
                output 
= wbuf;
                delete [] wbuf;
                ret 
= 0;
            }

            tidyBufFree(
&outbuf);
        }

        
//std::cout << "ERROR->\n" << errbuf.bp << std::endl;
        
//tidyBufFree(&errbuf);
    }


    delete [] buf;

    tidyRelease(tdoc);

    
return ret;
}


    感覺還有問題,但經過Tidy處理,TinyHtmlParser確實能解析原來解不開的HTML數據了,就先放著吧,測試看看先~唉,HTML從頭到尾都是最影響LingosHook的部分,早知道應該多好好找找穩定的Parser,自己造的輪子對路面要求太高了。。。

posted on 2010-05-12 18:06 codejie 閱讀(558) 評論(2)  編輯 收藏 引用 所屬分類: C++LingosHook

評論

# re: LingosHook:自己造的輪子對路面要求太高了~ 2010-05-13 11:42 陳梓瀚(vczh)

HTML這種一個字符串可以由多個字符集構成的東西,根本就是結構化的二進制文件,而不是文本文件……  回復  更多評論   

# re: LingosHook:自己造的輪子對路面要求太高了~ 2010-05-13 12:12 codejie

@陳梓瀚(vczh)
這個‘結構化’放到XML文件上比較合適,HTML就不合適了。。不然哪有‘瀏覽器容錯能力‘之說呢。。所以,還是當文本處理比較方便點。  回復  更多評論   

公告

Using C++

導航

統計

留言簿(73)

隨筆分類(513)

積分與排名

最新評論

閱讀排行榜

評論排行榜

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            国产亚洲精品久久久| 欧美一区激情| 欧美怡红院视频| 亚洲一区国产| 亚洲欧美日韩精品在线| 亚洲欧美日韩一区在线| 亚洲一区在线看| 午夜日韩在线观看| 欧美电影在线| 欧美粗暴jizz性欧美20| 亚洲日本va午夜在线电影| 麻豆成人小视频| 亚洲人午夜精品免费| 99国产精品视频免费观看| 午夜免费久久久久| 亚洲日韩成人| 久久影音先锋| 国产日韩亚洲欧美综合| 日韩视频在线免费| 美日韩精品免费| 亚洲欧美在线一区二区| 欧美日韩1234| 亚洲日本欧美天堂| 久久久久久久久久久久久女国产乱 | 国产精品久久久久久久久久尿 | 欧美1区视频| 午夜精品一区二区三区在线视| 美女诱惑黄网站一区| 欧美视频一区二区| 亚洲破处大片| 久久嫩草精品久久久精品一| 亚洲大片在线| 亚洲三级免费| 亚洲欧洲视频在线| 亚洲成色最大综合在线| 蜜桃久久av| 日韩系列在线| 亚洲精品在线免费| 久久久国产一区二区| 国产乱码精品一区二区三区五月婷| 91久久极品少妇xxxxⅹ软件| 亚洲深夜福利视频| 欧美激情网友自拍| 久久综合影音| 国产资源精品在线观看| 亚洲一区二区三区午夜| 欧美成人福利视频| 欧美精品麻豆| 久久亚洲综合色一区二区三区| 久久精品99国产精品| 亚洲九九爱视频| 亚洲欧美国产精品va在线观看 | 亚洲精品国精品久久99热| 一区二区三区精品在线| 久久9热精品视频| 欧美激情综合色| 久久久九九九九| 欧美日韩在线播放一区| 欧美一区二区三区日韩视频| 欧美一区二区免费| 亚洲精品视频一区| 亚洲精品综合精品自拍| 欧美丝袜一区二区三区| 午夜一级久久| 毛片一区二区| 午夜免费电影一区在线观看| 欧美色精品在线视频| 亚洲天堂av高清| 欧美黄色小视频| 欧美成人免费在线| 国产日韩成人精品| 亚洲老司机av| 日韩午夜剧场| 久久精品亚洲| 亚洲欧美日韩视频二区| 欧美在线一二三区| 一区二区不卡在线视频 午夜欧美不卡'| 亚洲理论在线| 伊人精品成人久久综合软件| 久热成人在线视频| 亚洲精选中文字幕| 夜夜嗨av色一区二区不卡| 免费日韩成人| 久久精品女人天堂| 国产一区二区久久精品| 亚洲精品在线二区| 91久久精品www人人做人人爽| 亚洲欧美国产高清| 午夜精品久久久久久久99黑人 | 91久久精品国产| 欧美激情综合在线| 亚洲人在线视频| 国内精品久久久| 午夜视频一区二区| 亚洲视频免费看| 欧美日韩亚洲一区二区三区在线| 亚洲春色另类小说| 国产视频在线观看一区| 欧美三区在线视频| 欧美成人免费视频| 亚洲一区二区三区三| 免费看亚洲片| 国产精品99久久久久久久vr| 一区二区欧美日韩视频| 国产精品va在线播放| 亚洲一二三级电影| 午夜国产不卡在线观看视频| 黄色成人av网站| 激情成人中文字幕| 国产视频在线观看一区二区| 国产精品美女xx| 亚洲欧美国产三级| 亚洲裸体视频| 国内精品久久久久久影视8| 久久欧美肥婆一二区| 亚洲精品国产精品国自产在线| 午夜精品久久久久久久久| 国产亚洲一区二区精品| 狠狠色综合色区| 亚洲成人资源网| 国产午夜精品在线| 国产精品夜夜夜| 国产精品久久久久免费a∨大胸| 久久漫画官网| 欧美一区二区成人| 亚洲精品日韩综合观看成人91| 牛人盗摄一区二区三区视频| 亚洲人成在线免费观看| 99综合在线| 日韩网站在线观看| 日韩一区二区福利| 亚洲激情成人| 在线视频精品| 99热这里只有成人精品国产| 蜜桃av一区二区| 欧美韩国日本综合| 久久av一区二区三区| 麻豆久久精品| 国产精品久久婷婷六月丁香| 国产一区二区三区无遮挡| 国产日韩一区欧美| 免费亚洲电影| 久久久久这里只有精品| 久久精视频免费在线久久完整在线看| 午夜精品一区二区三区在线视| 欧美日韩一区高清| 亚洲激情电影在线| 亚洲视屏一区| 欧美大片免费观看| 亚洲欧美视频| 欧美日韩dvd在线观看| 欧美日韩视频免费播放| 欧美婷婷六月丁香综合色| 欧美日韩中文精品| 亚洲欧美制服中文字幕| 美女日韩欧美| 中日韩男男gay无套| 久久综合伊人77777| 国产精品盗摄久久久| 亚洲电影av| 久久亚裔精品欧美| 欧美色大人视频| 欧美国产亚洲视频| 欧美精品xxxxbbbb| 一区二区高清在线| 亚洲精品国产精品国自产在线| 欧美日本韩国一区| 国产欧美日韩中文字幕在线| 国产欧美亚洲视频| 久久久青草青青国产亚洲免观| 欧美在线观看视频一区二区三区| 国产精品综合色区在线观看| 欧美在线在线| 欧美精品www在线观看| 亚洲午夜日本在线观看| 亚洲免费在线精品一区| 亚洲国产成人tv| 99精品视频一区| 激情综合在线| 亚洲神马久久| 亚洲激情电影中文字幕| 亚洲欧美中日韩| 9色porny自拍视频一区二区| 亚洲一区二区网站| 一本色道久久综合精品竹菊| 欧美一区二区三区播放老司机| 欧美一区二区成人6969| 欧美日韩一区二区在线| 136国产福利精品导航网址应用| 亚洲一级网站| 欧美在线视频观看免费网站| 亚洲高清免费| 欧美日韩成人免费| 在线精品国产欧美| 亚洲一区区二区| 亚洲欧美在线网| 亚洲一区二区三区视频播放| 蜜桃久久精品乱码一区二区| 久久九九久精品国产免费直播 | 亚洲国产高清aⅴ视频|