青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

hdqqq

  C++博客 :: 首頁 :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理 ::
  35 隨筆 :: 0 文章 :: 104 評論 :: 0 Trackbacks

這幾天在寫一個linux下的統(tǒng)計程序,主要是將一個文本文件讀取后,按行進行分類統(tǒng)計.
用C++加 Stl實現(xiàn),在windows平臺下用vc編寫,然后上傳到linux機器上用gcc編譯.

在處理上,我用了一個list<string>作為讀取行的緩沖,讀了一定的行數(shù)后就進行處理.
在讀取文件的函數(shù)中是這樣寫的.

 

while (!infile.eof()) {
      memset(buf, 
0, sizeof(char)*2048);
      infile.getline(buf, 
2048);
      tt 
= buf;
      
if (tt.length()) {
        log_list.push_back(tt);
      }

      
//if the file is too big, so we do statistic per 5000 lines
      
if (log_list.size() >= 5000) {
        line_statistic(result, log_list);
        log_list.clear();
      }
}


一切ok, 但是這幾天要處理的文件變地很大,有100多M,我沒有多想,隨便的把
      if (log_list.size() >= 5000) {
改成了
      if (log_list.size() >= 50000) {
想在50000行后再進行計算處理.不料想,在linux下運行效率居然出奇的慢.
原先統(tǒng)計5萬行大概要20秒左右,現(xiàn)在居然要2分多.應該是list::size()這個函數(shù)出了問題.
我以前看過vc中的list的實現(xiàn),是用一個成員變量進行記數(shù)的,在size()中就直接返回這個
值,應該不會有問題.

接著我看了gcc使用的stl的list::size()的實現(xiàn),它是用
std::distance(begin(), end())
來計算的.
但是在std::distance的實現(xiàn)中,它按照iterator類型的不同,實現(xiàn)的方式也不同.
而list的iterator,是屬于雙向iterator,而非隨機iterator,因此,在std::distance()
中使用了一個循環(huán)來計算值.也就是說在gcc的stl庫中,每次調(diào)用list::size()函數(shù),它都會從頭
到尾遍歷一遍.再看看我的代碼,循環(huán)里面每一步size()都要遍歷一遍list,難怪會變得
如此的慢.


沒想到stl的不同實現(xiàn)還會有這種陷阱,一不留神就撞上了.

總之 gcc中l(wèi)ist的size()是不能隨便用的,list越大,size()函數(shù)花的時間越長.

posted on 2007-12-11 11:56 hdqqq 閱讀(10612) 評論(19)  編輯 收藏 引用 所屬分類: c/c++

評論

# re: gcc 中std::list 的size()成員函數(shù) 2007-12-11 12:44 海邊沫沫
呵呵,為什么要用list?為什么不用vector?

還有,讀取文件的代碼寫得太不C++了,像C的代碼。

C++的代碼,要么是
ifstream inputfile("filename);
string tmpstr;
vector<string> log_vector;
while(inputfile >> tmpstr)
{
log_vector.push_back(tmpstr);
}

要么是
ifstream inputfile("filename);
istream_iterator input_begin(inputfile);
istream_iterator input_end();
vector<string> log_vector(input_begin,input_end);  回復  更多評論
  

# re: gcc 中std::list 的size()成員函數(shù)[未登錄] 2007-12-11 13:20 hdqqq
不用vector是考慮到在大數(shù)據(jù)量的情況下,vector會進行內(nèi)存的拷貝復制,所以采用了list  回復  更多評論
  

# re: gcc 中std::list 的size()成員函數(shù) 2007-12-11 14:03 金慶
@海邊沫沫
用istream_iterator<string>不行啊?好象是vector不能接受istream_iterator。貼個調(diào)試能過的代碼讓我們瞧瞧吧。  回復  更多評論
  

# re: gcc 中std::list 的size()成員函數(shù) 2007-12-11 14:20 歲月流冰
可以考慮使用deque。  回復  更多評論
  

# re: gcc 中std::list 的size()成員函數(shù) 2007-12-11 14:43
#include<iostream>
#include<vector>
#include<iterator>
#include<string>
#include<fstream>
using namespace std;
int main()
{
ifstream inputfile("q.cpp");
vector<string> vec;
string str;
while( getline(inputfile,str) )
vec.push_back(str);
copy(vec.begin(),vec.end(),ostream_iterator<string>(cout,"\n"));
return 0;
}  回復  更多評論
  

# re: gcc 中std::list 的size()成員函數(shù) 2007-12-11 15:09 海邊沫沫
#include <iostream>
#include <fstream>
#include <string>
#include <vector>
#include <iterator>
#include <algorithm>

int main()
{
std::ifstream input_file("D:\\emails100w.txt");
std::istream_iterator<std::string> input_begin(input_file);
std::istream_iterator<std::string> input_end;

std::vector<std::string> log_vector(input_begin,input_end);

//寫入到另外一個文件
std::ofstream output_file("D:\\emails100w_copy.txt");
std::ostream_iterator<std::string> output_begin(output_file,"\n");
std::copy(log_vector.begin(),log_vector.end(),output_begin);
}

上面的代碼是可以編譯通過的,其中的D:\\emails100w.txt是一個包含一百萬條記錄的文本。

剛才我給出的代碼通不過編譯,確實是我的問題,主要是
std::istream_iterator<std::string> input_end;
這一行,最后應該沒有括號。如果加上括號,編譯器就不會認為這是一個iterator,就會調(diào)用vector的錯誤構(gòu)造函數(shù),就會出現(xiàn)博主所敘的錯誤。  回復  更多評論
  

# re: gcc 中std::list 的size()成員函數(shù) 2007-12-11 17:10 winsty
自己拿個變量統(tǒng)計?
雖然這樣不太好...  回復  更多評論
  

# re: gcc 中std::list 的size()成員函數(shù) 2007-12-12 11:02 金慶
@海邊沫沫
可惜istream_iterator<string>是按string輸入的,以空白符分隔,而不是以'\n'分隔。好像沒有辦法改變這個分隔符的吧?  回復  更多評論
  

# re: gcc 中std::list 的size()成員函數(shù) 2007-12-13 14:21 海邊沫沫
不錯,是沒有辦法改變分隔符。
不過可以重載operator << 和自定義一個自己的string來實現(xiàn)這樣的功能。

不過這樣搞劃不來,不如使用getline  回復  更多評論
  

# re: gcc 中std::list 的size()成員函數(shù) 2007-12-14 13:10 lymons
bz里描述的問題是 關于list容器的size函數(shù)帶來的效率的問題,而不是
怎么提高讀寫效率的問題,大家不要跑題啊。

而且,在讀取的過程中,還要對超過固定行數(shù)之后的容器進行統(tǒng)計處理。

各位高手們,請仔細看bz的source的機能要求吧。  回復  更多評論
  

# re: gcc 中std::list 的size()成員函數(shù) 2007-12-16 20:14 TD
re: gcc 中std::list 的size()成員函數(shù)[未登錄] 2007-12-11 13:20 hdqqq
不用vector是考慮到在大數(shù)據(jù)量的情況下,vector會進行內(nèi)存的拷貝復制,所以采用了list 回復 更多評論

vector構(gòu)造的時候指定一個大小,比如你程序中的5000之類的,就不會有內(nèi)存的拷貝復制了吧  回復  更多評論
  

# re: gcc 中std::list 的size()成員函數(shù)[未登錄] 2007-12-16 21:36 hdqqq
@TD
是的,如果開始的時候指定vector是可以的,但是限定了vector的大小。  回復  更多評論
  

# re: gcc 中std::list 的size()成員函數(shù) 2008-01-31 21:29 abettor
真沒想到,list會有這種弊端。  回復  更多評論
  

# re: gcc 中std::list 的size()成員函數(shù) 2008-09-19 23:12 hgyxb
list怎么會這樣啊,設計的怎么搞的  回復  更多評論
  

# re: gcc 中std::list 的size()成員函數(shù) 2008-12-12 16:00 bianshj
呵呵,真是太感謝了。
最近在寫一個linux的服務器程序,用了list,剛開始的時候我自己處理list的元素數(shù)量,后來想stl既然這么優(yōu)秀,它肯定會用成員變量來計數(shù),使用size不回影響效率。結(jié)果用了size后果然出了很多問題。  回復  更多評論
  

# re: gcc 中std::list 的size()成員函數(shù) 2009-04-22 10:51 abettor
以前發(fā)現(xiàn)過這種情況,而且只在gcc中發(fā)現(xiàn),不知gcc4有沒有把這個問題修正過來。
  回復  更多評論
  

# re: gcc 中std::list 的size()成員函數(shù) 2010-12-15 12:15 qci133
@abettor
這個不是gcc的問題,而是c++標準中確實沒有規(guī)定list的size函數(shù)需要O(1)時間,反而規(guī)定了list的分割和合并需要O(1)時間。在后面一個限制之下,前面的要求是達不到的。網(wǎng)上有人貼過具體的分析  回復  更多評論
  

# re: gcc 中std::list 的size()成員函數(shù)[未登錄] 2011-08-29 17:14 Chipset
關std::list屁事,是你自己沒有用明白。每個string的字符個數(shù)相等嗎?如果不等的話,那行數(shù)有什么用?如果一定要用行數(shù)標記,那就設置一個變量啊。

list::size本來就沒有規(guī)定是O(1)還是O(n),純屬依賴于實現(xiàn)。  回復  更多評論
  

# re: gcc 中std::list 的size()成員函數(shù)[未登錄] 2016-04-25 10:01 hdqqq
@Chipset
麻煩看清楚文章再噴  回復  更多評論
  

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            久久香蕉国产线看观看av| 国内揄拍国内精品久久| 久久久亚洲欧洲日产国码αv| 欧美 日韩 国产 一区| 欧美一区二区精品| 欧美伦理视频网站| 欧美国产精品一区| 雨宫琴音一区二区在线| 亚洲欧美日韩第一区| 99re这里只有精品6| 久久先锋资源| 久色成人在线| 国产区二精品视| 中文国产成人精品久久一| 亚洲三级视频在线观看| 久久都是精品| 久久久一区二区| 国产欧美精品日韩精品| 亚洲性色视频| 亚洲欧美一区在线| 欧美午夜宅男影院| 一本一本久久a久久精品牛牛影视| 亚洲三级网站| 欧美www在线| 亚洲大片在线| 亚洲韩国青草视频| 老**午夜毛片一区二区三区| 麻豆精品在线观看| 在线不卡视频| 免费国产自线拍一欧美视频| 欧美黑人多人双交| 亚洲精品免费网站| 欧美国产先锋| aa级大片欧美三级| 亚洲免费视频观看| 国产精品实拍| 欧美一区二区三区在线视频| 久久久久久夜精品精品免费| 狠狠色丁香婷婷综合影院| 久久精品国产成人| 欧美1区2区视频| 亚洲伦理网站| 欧美三级韩国三级日本三斤| 亚洲一区二区免费| 久久久久久久一区二区| 亚洲成人原创| 欧美日本国产精品| 亚洲专区免费| 久久一区二区三区av| 亚洲国产99精品国自产| 欧美日本二区| 亚洲一区综合| 欧美α欧美αv大片| 在线亚洲免费视频| 国产色产综合产在线视频| 麻豆精品一区二区av白丝在线| 亚洲激情中文1区| 小嫩嫩精品导航| 欲香欲色天天天综合和网| 欧美另类亚洲| 性欧美大战久久久久久久免费观看 | 在线免费观看日本一区| 欧美美女操人视频| 先锋影音久久| 亚洲欧洲日产国产网站| 性久久久久久| 亚洲三级观看| 国产日韩精品视频一区二区三区| 久久综合九色综合欧美就去吻| 99re6热在线精品视频播放速度 | 久久中文精品| 一本色道久久综合| 国产又爽又黄的激情精品视频| 欧美激情综合在线| 久久精品人人做人人爽| 一本色道久久综合亚洲精品不| 久久亚洲综合网| 亚洲性图久久| 亚洲人成在线观看网站高清| 国产乱肥老妇国产一区二 | 欧美日韩国产另类不卡| 欧美专区第一页| 在线视频亚洲欧美| 亚洲黄色毛片| 麻豆久久精品| 久久精品主播| 午夜欧美大片免费观看| 亚洲乱亚洲高清| 亚洲高清色综合| 国产午夜精品一区二区三区视频| 欧美区二区三区| 蜜桃av一区二区| 久久久免费精品视频| 亚洲欧美日韩国产成人| 亚洲最新合集| 亚洲伦理网站| 亚洲人成亚洲人成在线观看| 你懂的视频欧美| 久久久久久久久久久久久女国产乱| 亚洲午夜国产成人av电影男同| 亚洲人成绝费网站色www| 一区二区三区在线看| 国产日本欧美一区二区三区| 国产精品美女一区二区| 国产精品videosex极品| 欧美日韩一区二区三| 欧美日韩精品在线| 欧美人与禽猛交乱配视频| 欧美精品成人一区二区在线观看| 欧美成人一区在线| 欧美ed2k| 欧美激情一二三区| 欧美喷潮久久久xxxxx| 欧美精品电影| 欧美视频中文字幕| 国产精品久久二区二区| 国产精品久久久久aaaa九色| 国产精品国产亚洲精品看不卡15| 国产精品地址| 国产色产综合产在线视频| 国产午夜精品理论片a级大结局| 国产欧美日韩综合一区在线观看| 国产伦精品一区二区三区免费迷| 国产深夜精品| 亚洲成人资源| 99精品视频一区| 亚洲欧美久久久| 久久精品国产亚洲aⅴ| 噜噜噜躁狠狠躁狠狠精品视频| 另类激情亚洲| 亚洲日本欧美天堂| 亚洲校园激情| 久久久精品国产一区二区三区| 蜜桃伊人久久| 欧美日韩亚洲综合一区| 国产精品一页| 亚洲国产精品久久91精品| 夜夜嗨av一区二区三区免费区| 亚洲欧美日韩一区二区三区在线观看| 欧美一进一出视频| 模特精品裸拍一区| aa级大片欧美| 久久精品视频在线| 欧美日韩国产在线看| 国产日韩在线看| 亚洲肉体裸体xxxx137| 亚洲字幕在线观看| 免费成年人欧美视频| 夜夜夜久久久| 老牛影视一区二区三区| 欧美日韩一区二区三区免费| 国产一区二区精品| 在线视频欧美一区| 久久久久久尹人网香蕉| 亚洲精品你懂的| 欧美伊人久久大香线蕉综合69| 欧美黑人国产人伦爽爽爽| 国产精品私人影院| 亚洲另类在线一区| 久久人人爽国产| 亚洲午夜激情| 欧美高清在线一区二区| 国产午夜亚洲精品不卡| 亚洲视频每日更新| 欧美国产精品v| 久久av一区二区三区| 欧美午夜精品电影| 亚洲精品九九| 免费日韩av| 欧美一区二区黄色| 欧美午夜性色大片在线观看| 亚洲人成在线播放网站岛国| 久久亚洲综合网| 午夜精品福利电影| 国产精品mv在线观看| 亚洲精品国久久99热| 美女精品视频一区| 欧美一区二区性| 国产精品亚洲视频| 亚洲欧美视频在线观看视频| 亚洲美女在线一区| 欧美激情中文不卡| 亚洲精品中文字幕在线| 欧美大片免费| 久久综合中文| 亚洲国产精品专区久久| 巨乳诱惑日韩免费av| 欧美在线视频一区| 国产一区二区| 久久久久久欧美| 久久精品国产欧美亚洲人人爽| 国产日韩在线不卡| 久久精品道一区二区三区| 亚洲免费伊人电影在线观看av| 国产精品第三页| 欧美一二三区在线观看| 亚洲综合国产| 国产性猛交xxxx免费看久久| 久久精品成人一区二区三区| 欧美一区二区三区在线看|