• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            學著站在巨人的肩膀上

            金融數(shù)學,InformationSearch,Compiler,OS,

              C++博客 :: 首頁 :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理 ::
              12 隨筆 :: 0 文章 :: 8 評論 :: 0 Trackbacks

            這里介紹正向索引的建立,如果直接建立倒排索引效率上可能會很低,所以可以先產(chǎn)生正向索引為后面的倒排索引打下基礎。

             

            詳細的文件功能和介紹都在這里有了介紹自頂向下學搜索引擎——北大天網(wǎng)搜索引擎TSE分析及完全注釋[5]倒排索引的建立及文件介紹

             

            CrtForwardIdx.cpp文件

             

            int main(int argc, char* argv[])    //./CrtForwardIdx Tianwang.raw.***.seg > moon.fidx
            {
                ifstream ifsImgInfo(argv[1]);
                if (!ifsImgInfo) 
                {
                    cerr << "Cannot open " << argv[1] << " for input\n";
                    return -1;
                }

                string strLine,strDocNum;
                int cnt = 0;
                while (getline(ifsImgInfo, strLine)) 
                {
                    string::size_type idx;

                    cnt++;
                    if (cnt%2 == 1) //奇數(shù)行為文檔編號
                    {
                        strDocNum = strLine.substr(0,strLine.size());
                        continue;
                    }
                    if (strLine[0]=='\0' || strLine[0]=='#' || strLine[0]=='\n')
                    {
                        continue;
                    }

                    while ( (idx = strLine.find(SEPARATOR)) != string::npos ) //指定查找分界符
                    {
                        string tmp1 = strLine.substr(0,idx);
                        cout << tmp1 << "\t" << strDocNum << endl;
                        strLine = strLine.substr(idx + SEPARATOR.size());
                    }

                    //if (cnt==100) break;
                }

                return 0;
            }

             

            author:http://hi.baidu.com/jrckkyy

            author:http://blog.csdn.net/jrckkyy

             

             

            posted on 2009-12-10 23:02 學者站在巨人的肩膀上 閱讀(1195) 評論(1)  編輯 收藏 引用 所屬分類: 中文文本信息處理

            評論

            # re: 自頂向下學搜索引擎——北大天網(wǎng)搜索引擎TSE分析及完全注釋[6]倒排索引的建立的程序分析(3) 2009-12-12 13:16 樂蜂網(wǎng)
            卡洛斯代課老師卡的  回復  更多評論
              

            精品久久久久久综合日本| 国产∨亚洲V天堂无码久久久| 97久久精品国产精品青草| 久久免费高清视频| 免费精品久久天干天干| 99久久精品午夜一区二区| 日本一区精品久久久久影院| 久久精品无码一区二区三区日韩 | 欧美日韩中文字幕久久久不卡| 无码国内精品久久综合88 | 伊人 久久 精品| 亚洲一区二区三区日本久久九| 伊人久久无码中文字幕| 久久久精品视频免费观看| 久久AV高潮AV无码AV| 色8激情欧美成人久久综合电| 色欲综合久久躁天天躁蜜桃| 国产成人无码精品久久久性色| AV狠狠色丁香婷婷综合久久| 7777精品伊人久久久大香线蕉| 久久精品国产免费| 久久婷婷五月综合色奶水99啪| 精品熟女少妇AV免费久久| 国产成人精品久久一区二区三区av| 久久国产亚洲高清观看| 久久人爽人人爽人人片AV| 一本久道久久综合狠狠躁AV| 品成人欧美大片久久国产欧美...| 久久精品人人做人人爽97| 热99RE久久精品这里都是精品免费| 久久亚洲国产中v天仙www| 久久精品黄AA片一区二区三区| 久久夜色精品国产亚洲| 久久久久久免费视频| 久久人做人爽一区二区三区| 老司机午夜网站国内精品久久久久久久久 | 怡红院日本一道日本久久 | 韩国三级中文字幕hd久久精品 | 精品久久久无码人妻中文字幕| 欧美激情精品久久久久久| 久久久久这里只有精品|