• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            海邊沫沫

            相濡以沫,不如相忘于江湖
            posts - 9, comments - 113, trackbacks - 0, articles - 0
              C++博客 :: 首頁(yè) :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理
            Visual Studio 2010發(fā)布有幾個(gè)月了,但是中文版一直到5月底才有。軟件一拿到手,我就迫不及待地安裝,想一睹Visual C++ 2010的風(fēng)采。

            對(duì)于Visual C++,我比較關(guān)心的幾個(gè)問(wèn)題有:一、對(duì)新的C++ 0x支持如何?二、能否順利編譯和使用Boost?說(shuō)到底,這兩個(gè)問(wèn)題差不多是一個(gè)問(wèn)題,因?yàn)榇蠹叶贾繠oost和C++0x的關(guān)系,C++0x中的很多特性,其實(shí)都是從Boost中來(lái)的。

            首先來(lái)說(shuō)Visual C++對(duì)C++0x的新特性的支持,主要有四點(diǎn):一、auto關(guān)鍵字的新意義,有了該特性,我們就不用再在使用STL 的iterator時(shí)寫(xiě)一長(zhǎng)串代碼了,編譯器可以自動(dòng)推斷其類型;二、static_assert關(guān)鍵字,該特性不稀奇,Boost里面早就有了;三、右值引用,這個(gè)很好,主要解決了移動(dòng)語(yǔ)意和完美轉(zhuǎn)發(fā)的問(wèn)題,在Visual Studio的歡迎頁(yè)中鏈接了一篇文檔就是講的這個(gè)東西,還有一篇文檔講了我們?cè)谠O(shè)計(jì)類時(shí),怎么編寫(xiě)移動(dòng)構(gòu)造函數(shù)和移動(dòng)賦值運(yùn)算符,值得一看。(這里的移動(dòng)指的是move,和copy相對(duì),可不是指中國(guó)移動(dòng)哦)四、lambda表達(dá)式,這個(gè)也是Boost中早就有的功能。

            畢竟C++0x標(biāo)準(zhǔn)還沒(méi)有發(fā)布,Visual C++支持到這一步,已經(jīng)很不錯(cuò)了,還差的幾個(gè)方面是:Concepts、可變模板參數(shù)、多線程內(nèi)存模型。。。說(shuō)實(shí)話,具體還有多少我也說(shuō)不清楚。

            至于納入Visual C++的標(biāo)準(zhǔn)庫(kù)的東西,還是只有tr1,這在Visual Studio 2008時(shí)代已經(jīng)有了,沒(méi)什么新意。要想找激情,還是去深度探索Boost吧。安裝好Visual Studio 2010后,我馬上就下載了最近的Boost,按照文檔的說(shuō)明進(jìn)行安裝,安裝非常的順利。

            為了使用Visual C++ 2010和Boost,我給自己找了點(diǎn)事,那就是編程去提取新浪讀書(shū)頻道上的小說(shuō)。程序進(jìn)行得很順利,只有區(qū)區(qū)150行,請(qǐng)看:
              1 #include <iostream>
              2 #include <string>
              3 #include <boost\lexical_cast.hpp>
              4 #include <boost\asio.hpp>
              5 #include <boost\regex.hpp>
              6 
              7 using namespace std;
              8 using namespace boost;
              9 
             10 string clearUp(stringstream& input){
             11     /*
             12     下面的代碼使用boost::regex庫(kù)進(jìn)行字符串的替換
             13     */
             14     regex patternOfTitle("(.*)<h1>(.*)</h1>(.*)");
             15     regex patternOfBody("(.*)<div id=\"contTxt\" class=\"contTxt1\"><p>(.*)</p></div>(.*)");
             16 
             17     string line;
             18     string output;
             19     smatch results;
             20     int status = 0;
             21     while(getline(input,line)){
             22         if(status == 0){//還沒(méi)有碰到標(biāo)題
             23             if(regex_match(line,results,patternOfTitle)){
             24                 output += results[2];
             25                 output += "\r\n";
             26                 status = 1//處理完標(biāo)題
             27             }
             28         }else{//處理正文
             29             if(regex_match(line,results,patternOfBody)){
             30                 output += results[2];
             31                 status = 2
             32                 break;
             33             }
             34         }
             35     }
             36     //將output中的</p><p>替換成回車換行符
             37     regex patternToReplace("</p><p>");
             38     return regex_replace(output,patternToReplace,"\r\n");
             39 }
             40 
             41 void getChapter(ostream& ostream,vector<int>& args){
             42     /*
             43     以下代碼使用boost::asio庫(kù)
             44     具體用法請(qǐng)參考boost文檔
             45     */
             46     asio::io_service io_service;
             47     asio::ip::tcp::resolver resolver(io_service);
             48     asio::ip::tcp::resolver::query query("vip.book.sina.com.cn","http");
             49     asio::ip::tcp::resolver::iterator endpoint_iterator = resolver.resolve(query);
             50     asio::ip::tcp::resolver::iterator end;
             51     system::error_code error = asio::error::host_not_found;
             52     asio::ip::tcp::socket socket(io_service);
             53     while (error && endpoint_iterator != end)
             54     {
             55       socket.close();
             56       socket.connect(*endpoint_iterator++, error);
             57     }
             58     if (error)
             59       throw system::system_error(error);
             60 
             61     asio::streambuf request;
             62     std::ostream request_stream(&request);
             63     
             64     request_stream << "GET " << "/book/chapter_"<< args[0<< "_" << args[1<< ".html" << " HTTP/1.0\r\n";
             65     request_stream << "Host: " << "vip.book.sina.com.cn" << "\r\n";
             66     request_stream << "Accept: */*\r\n";
             67     request_stream << "Connection: close\r\n\r\n";
             68 
             69     asio::write(socket, request);
             70 
             71     asio::streambuf response;
             72     asio::read_until(socket, response, "\r\n");
             73 
             74     std::istream response_stream(&response);
             75     string http_version;
             76     response_stream >> http_version;
             77     unsigned int status_code;
             78     response_stream >> status_code;
             79     string status_message;
             80     getline(response_stream, status_message);
             81     if (!response_stream || http_version.substr(05!= "HTTP/")
             82     {
             83       cout << "Invalid response\n";
             84       throw system::system_error(error);
             85     }
             86     if (status_code != 200)
             87     {
             88       ostream << "Response returned with status code " << status_code << "\n";
             89       throw system::system_error(error);
             90     }
             91 
             92     // 讀取數(shù)據(jù),并把數(shù)據(jù)放入一個(gè)string中,這里用到std::stringstream
             93     stringstream content;
             94     while (asio::read(socket, response,
             95           asio::transfer_at_least(1), error))
             96       content << & response;
             97     if (error != asio::error::eof)
             98       throw system::system_error(error);
             99 
            100     //調(diào)用clearUp函數(shù),從雜亂的HTML文件中提取純文本的小說(shuō)
            101     ostream << clearUp(content);
            102 }
            103 
            104 void getBook(ostream& ostream,vector<int>& args){
            105     /*
            106     如果沒(méi)有到最后一章,則執(zhí)行循環(huán)
            107     以下載所有章節(jié)
            108     */
            109     while(args[1<= args[2]){
            110         getChapter(ostream,args);
            111         args[1]++;
            112     }
            113 }
            114 
            115 int _tmain(int argc, _TCHAR* argv[])
            116 {
            117     /*
            118     新浪讀書(shū)頻道的URL地址為“http://vip.book.sina.com.cn/book/chapter_120954_83221.html”的形式
            119     其中的兩個(gè)數(shù)字一個(gè)代表書(shū)的ID,一個(gè)代表章節(jié)的ID
            120     所以我們的程序需要接受的參數(shù)有三個(gè),分別為書(shū)的ID,第一章的ID和最后一章的ID,該程序自動(dòng)下載從
            121     第一章到最后一章的內(nèi)容,并整理
            122     該程序的使用方法為:
            123     GetBookFromSina bookId firstChapterId lastChapterId
            124     */
            125 
            126     /*
            127     下面的程序片段使用lexical_cast庫(kù)來(lái)將命令行輸入的參數(shù)轉(zhuǎn)換為整數(shù)
            128     */
            129     if(argc != 4){
            130         cout << "輸入不正確!正確的輸入為:GetBookFromSina bookId firstChapterId lastChapterId" << endl;
            131         return 0;
            132     }
            133     vector<int> args;
            134     try{
            135         for(int i=1; i < 4; i++){
            136             args.push_back(lexical_cast<int>(argv[i]));
            137         }
            138     }catch(bad_lexical_cast &){
            139         cout << "輸入不正確!正確的輸入為:GetBookFromSina bookId firstChapterId lastChapterId" << endl;
            140         cout << "請(qǐng)確定輸入的參數(shù)為整數(shù)" << endl;
            141         return 0;
            142     }
            143 
            144     /*
            145     調(diào)用getBook函數(shù),輸入一個(gè)ostream &類型的參數(shù)和一個(gè)vector<int>&參數(shù)
            146     如果輸入的是cout,則輸出到控制臺(tái)
            147     也可以把輸出流輸出到文件或字符串,只需要傳入不同的參數(shù)即可
            148 
            149     之所以不讓getBook函數(shù)返回字符串,而是接受一個(gè)流對(duì)象作為參數(shù),是因?yàn)間etBook中有一個(gè)循環(huán)
            150     如果要返回字符串的話,需要把很多字符串連接成一個(gè)更大的字符串,影響效率
            151     */
            152     try{
            153         getBook(cout,args);
            154     }catch(system::system_error&){
            155         cout << "獲取文章的過(guò)程中發(fā)生錯(cuò)誤" << endl;
            156     }
            157 }
            158 

            下面奉上一個(gè)截圖,讓大家看看提取小說(shuō)的效果:
             

            以上的代碼大家不要從頭開(kāi)始讀,要從最底下的main函數(shù)一個(gè)一個(gè)往上讀。在main函數(shù)中,使用了Boost的lexical_cast將命令行的參數(shù)從字符串轉(zhuǎn)化成int,如果輸入的參數(shù)非法,程序就會(huì)退出。在main中調(diào)用getBook函數(shù),也許大家覺(jué)得給getBook函數(shù)傳入一個(gè)cout流對(duì)象不妥,侵入性太大,但是這確實(shí)最有效率的辦法,因?yàn)槿绻実etBook函數(shù)返回字符串的話,那將是一個(gè)非常大的字符串,而且要在getBook里面講一百多個(gè)字符串組裝成這個(gè)大字符串,效率很低。在getBook中調(diào)用getChapter函數(shù),在getChapter函數(shù)中使用Boost的ASIO庫(kù),從網(wǎng)絡(luò)上讀取數(shù)據(jù)后,再調(diào)用clearUp函數(shù)進(jìn)行處理,在clearUp函數(shù)中,使用了Boost的Regex庫(kù)。

            在這個(gè)程序中,因?yàn)橐粩嗟貙?duì)字符串進(jìn)行處理,所以內(nèi)存的分配和效率方面就需要特別注意,我做了一些努力以盡量減少字符串的復(fù)制,但是有兩個(gè)地方還是做得不過(guò)好。一個(gè)地方是從response中把數(shù)據(jù)讀入到了一個(gè)stringstream中,這里發(fā)生了一次復(fù)制,response是一個(gè)streambuffer對(duì)象,如果能直接從response對(duì)象中提取數(shù)據(jù)進(jìn)行處理就更好了,但是問(wèn)題是,streambuffer中數(shù)據(jù)是從網(wǎng)絡(luò)中讀取的,而從網(wǎng)絡(luò)讀取數(shù)據(jù)時(shí)一次傳輸多少誰(shuí)也不知道,其中的數(shù)據(jù)不一定是完整的,所以程序中用了一個(gè)循環(huán)。當(dāng)然,肯定有辦法讓response中盡量包含完整的數(shù)據(jù),只不過(guò)要更耐心地去讀ASIO的文檔。(我的程序使用ASIO的部分是直接從Boost ASIO的示例代碼抄的,沒(méi)有仔細(xì)讀文檔。)

            另外一個(gè)不好的地方就是clearUp函數(shù),該函數(shù)返回的時(shí)候,發(fā)生了一次字符串復(fù)制。(其實(shí)編譯器會(huì)優(yōu)化掉)
            如果不考慮編譯器優(yōu)化的話,最好的辦法是把clearUp函數(shù)寫(xiě)成下面的樣子:
            string&& clearUp(stringstream& input){
            .
            .
            return std::move(regex_replace(output,patternToReplace,"\r\n"));
            }

            這就用到了親愛(ài)的右值引用,其實(shí)上面的代碼可以不要std::move,因?yàn)閞egex_replace函數(shù)返回的就是一個(gè)右值。

            不過(guò)可惜,上面的代碼編譯可以通過(guò),但是程序運(yùn)行的時(shí)候會(huì)報(bào)錯(cuò)。我很郁悶,也不知道為什么,希望高手指點(diǎn)。

            我的代碼是使用x64平臺(tái)作為目標(biāo)編譯的,生成的程序在我的Windows 7 64位版本下運(yùn)行良好。這進(jìn)一步說(shuō)明Boost庫(kù)在64位的程序中使用很順利。

            友情提示一下,如果要把提取的小說(shuō)保存到文件,只需要使用一個(gè)文件重定向即可,如下:
            getbookfromsina 39534 23601 23783 > 天使不在線.txt

            最后祝大家端午節(jié)快樂(lè)!

            Feedback

            # re: 一個(gè)工具、一個(gè)庫(kù)和一部小說(shuō)  回復(fù)  更多評(píng)論   

            2010-06-12 21:55 by 空明流轉(zhuǎn)
            Concept已經(jīng)不是0x的內(nèi)容了。
            我建議樓主了解一下新的0x的標(biāo)準(zhǔn)內(nèi)容。

            # re: 一個(gè)工具、一個(gè)庫(kù)和一部小說(shuō)  回復(fù)  更多評(píng)論   

            2010-06-12 22:09 by 海邊沫沫
            @空明流轉(zhuǎn)
            謝謝指正!
            不是我不想了解,而是有很多東西我看不懂。我文章中列出的,是我稍微看得懂一點(diǎn)點(diǎn)的,呵呵。
            對(duì)于C++0x的了解,我主要是看的劉未鵬的博客,還有一些通過(guò)搜索引擎搜到的零散碎片。
            你能給我一些更好的資料嗎?

            # re: 一個(gè)工具、一個(gè)庫(kù)和一部小說(shuō)  回復(fù)  更多評(píng)論   

            2010-06-13 08:48 by 欣萌
            學(xué)習(xí)了。

            # re: 一個(gè)工具、一個(gè)庫(kù)和一部小說(shuō)  回復(fù)  更多評(píng)論   

            2010-06-13 11:26 by 空明流轉(zhuǎn)
            http://www.open-std.org/jtc1/sc22/wg21/
            這里是C++0x標(biāo)準(zhǔn)工作組的官方網(wǎng)站,你可以找到任意的更新。
            http://gcc.gnu.org/projects/cxx0x.html
            這里是GCC對(duì)新標(biāo)準(zhǔn)Support的程度參考。

            # re: 一個(gè)工具、一個(gè)庫(kù)和一部小說(shuō)  回復(fù)  更多評(píng)論   

            2010-06-13 14:17 by 莫失莫忘
            我對(duì)劇情也比較好奇,那個(gè)一類人是什么一類人

            # re: 一個(gè)工具、一個(gè)庫(kù)和一部小說(shuō)  回復(fù)  更多評(píng)論   

            2010-06-15 13:45 by linnet
            關(guān)注
            欧洲成人午夜精品无码区久久| 久久婷婷色香五月综合激情| 久久精品中文无码资源站| 伊人久久综在合线亚洲2019| 精品久久久久久久久午夜福利| 久久久久99这里有精品10| 久久国产影院| 久久久艹| 久久性生大片免费观看性| 91精品国产色综久久 | 亚洲国产精品综合久久一线| 国产99久久久国产精免费| 亚洲狠狠综合久久| 亚洲国产精品久久久久| 久久精品无码一区二区三区| 久久久久国产一级毛片高清版| 国产亚洲婷婷香蕉久久精品| 青青青青久久精品国产| 色综合久久中文色婷婷| 久久99精品国产麻豆婷婷| 久久天天日天天操综合伊人av| 久久久久久一区国产精品| 欧美久久久久久| 影音先锋女人AV鲁色资源网久久| 麻豆成人久久精品二区三区免费| 麻豆一区二区99久久久久| 免费精品99久久国产综合精品| 久久狠狠一本精品综合网| 伊人久久大香线蕉综合影院首页 | 亚洲精品高清久久| 伊人丁香狠狠色综合久久| 狠狠久久综合| 久久久久久精品免费看SSS| 91久久婷婷国产综合精品青草 | 久久无码人妻精品一区二区三区| 亚洲一级Av无码毛片久久精品| 99精品国产免费久久久久久下载| 日产精品99久久久久久| 亚洲成人精品久久| 模特私拍国产精品久久| 久久精品国产精品国产精品污|