• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            學(xué)著站在巨人的肩膀上

            金融數(shù)學(xué),InformationSearch,Compiler,OS,

              C++博客 :: 首頁(yè) :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理 ::
              12 隨筆 :: 0 文章 :: 8 評(píng)論 :: 0 Trackbacks

            這里介紹正向索引的建立,如果直接建立倒排索引效率上可能會(huì)很低,所以可以先產(chǎn)生正向索引為后面的倒排索引打下基礎(chǔ)。

             

            詳細(xì)的文件功能和介紹都在這里有了介紹自頂向下學(xué)搜索引擎——北大天網(wǎng)搜索引擎TSE分析及完全注釋[5]倒排索引的建立及文件介紹

             

            CrtForwardIdx.cpp文件

             

            int main(int argc, char* argv[])    //./CrtForwardIdx Tianwang.raw.***.seg > moon.fidx
            {
                ifstream ifsImgInfo(argv[1]);
                if (!ifsImgInfo) 
                {
                    cerr << "Cannot open " << argv[1] << " for input\n";
                    return -1;
                }

                string strLine,strDocNum;
                int cnt = 0;
                while (getline(ifsImgInfo, strLine)) 
                {
                    string::size_type idx;

                    cnt++;
                    if (cnt%2 == 1) //奇數(shù)行為文檔編號(hào)
                    {
                        strDocNum = strLine.substr(0,strLine.size());
                        continue;
                    }
                    if (strLine[0]=='\0' || strLine[0]=='#' || strLine[0]=='\n')
                    {
                        continue;
                    }

                    while ( (idx = strLine.find(SEPARATOR)) != string::npos ) //指定查找分界符
                    {
                        string tmp1 = strLine.substr(0,idx);
                        cout << tmp1 << "\t" << strDocNum << endl;
                        strLine = strLine.substr(idx + SEPARATOR.size());
                    }

                    //if (cnt==100) break;
                }

                return 0;
            }

             

            author:http://hi.baidu.com/jrckkyy

            author:http://blog.csdn.net/jrckkyy

             

             

            posted on 2009-12-10 23:02 學(xué)者站在巨人的肩膀上 閱讀(1192) 評(píng)論(1)  編輯 收藏 引用 所屬分類: 中文文本信息處理

            評(píng)論

            # re: 自頂向下學(xué)搜索引擎——北大天網(wǎng)搜索引擎TSE分析及完全注釋[6]倒排索引的建立的程序分析(3) 2009-12-12 13:16 樂(lè)蜂網(wǎng)
            卡洛斯代課老師卡的  回復(fù)  更多評(píng)論
              


            只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。
            網(wǎng)站導(dǎo)航: 博客園   IT新聞   BlogJava   博問(wèn)   Chat2DB   管理


            国产精品99久久久久久董美香| 久久久久久无码Av成人影院| 狠狠色综合久久久久尤物| 国产精品久久久久久久久久免费| 91精品久久久久久无码| 一本色道久久综合狠狠躁篇| 色狠狠久久AV五月综合| 亚洲国产成人久久精品影视| 四虎国产精品成人免费久久| 青青青青久久精品国产| 国内精品久久久久久久久电影网 | 日本免费一区二区久久人人澡| 99久久99久久精品国产片果冻| 亚洲成av人片不卡无码久久| av午夜福利一片免费看久久| 久久婷婷是五月综合色狠狠| 一本大道久久a久久精品综合| 99久久香蕉国产线看观香| 日本精品久久久久中文字幕| 伊人久久精品无码二区麻豆| 久久久久久久综合综合狠狠| 狠狠88综合久久久久综合网| 久久精品国产色蜜蜜麻豆| 久久影视综合亚洲| 国产免费久久精品丫丫| av无码久久久久不卡免费网站| 国产精品久久新婚兰兰| 亚洲精品tv久久久久| 国产午夜福利精品久久| 青青草原综合久久大伊人精品| 丰满少妇高潮惨叫久久久| 色综合久久久久无码专区 | 99精品伊人久久久大香线蕉| 精品久久久久久无码中文字幕一区 | 国产成人无码精品久久久性色 | 久久午夜羞羞影院免费观看| 免费久久人人爽人人爽av| 久久毛片一区二区| 东方aⅴ免费观看久久av| 五月丁香综合激情六月久久| 亚洲国产精品无码久久98|