• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            posts - 12, comments - 4, trackbacks - 0, articles - 36
            我們要做的是,發(fā)現(xiàn)網(wǎng)絡(luò)熱點(diǎn),跟蹤輿情,并且給與預(yù)測(cè)。同時(shí),要求能夠?qū)χ付ǖ奈臋n集進(jìn)行處理,過濾。
               基本過程和xj的差不多,幾個(gè)有待商榷問題:
            1 夏博士所說,軟件架構(gòu),接口一定要實(shí)現(xiàn)定義良好,并且不能被修改,保證以后的更新,維護(hù)方便。
            2 數(shù)據(jù)的結(jié)構(gòu):參考網(wǎng)站分類的一到三級(jí),先將數(shù)據(jù)分類,再進(jìn)行聚類,發(fā)現(xiàn)新事件,主題(聚類的過程也是分層的,通過調(diào)整閾值)
               對(duì)于新發(fā)現(xiàn)的事件,使用分類算法來跟蹤
            為什么不能直接聚類完成發(fā)現(xiàn)和跟蹤的任務(wù)?考慮,如果直接聚類,不容易保證事件的穩(wěn)定性,同時(shí),計(jì)算復(fù)雜度較高,不宜控制聚類的數(shù)目。難以實(shí)現(xiàn)實(shí)時(shí)跟蹤。——及時(shí)發(fā)現(xiàn),實(shí)時(shí)跟蹤。

            3 對(duì)于分類的初步打算:
                  網(wǎng)站抓新聞
                  提取相干tag樹,去除噪音
                  分詞
                  對(duì)于一些高亮數(shù)據(jù)進(jìn)行標(biāo)記
                  特征提取(CHI)
                  向量化(tf/idf)
                  kNN
                  RTCut
                  
                  

            只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。
            網(wǎng)站導(dǎo)航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理


            久久男人AV资源网站| 欧美日韩中文字幕久久伊人| 大蕉久久伊人中文字幕| 青青草原1769久久免费播放| 精品国产婷婷久久久| 久久这里都是精品| 久久精品国产亚洲AV无码偷窥 | 国产精品久久久久久福利漫画| 国产成人精品久久二区二区| 精品久久人人妻人人做精品| 久久久久久伊人高潮影院| 久久ZYZ资源站无码中文动漫 | 亚洲第一永久AV网站久久精品男人的天堂AV | 久久国产精品-久久精品| 欧美与黑人午夜性猛交久久久 | 亚洲国产精品久久久天堂| 99久久99久久精品国产片果冻| 亚洲欧美国产精品专区久久| 国产一区二区三区久久精品| 久久久久久久91精品免费观看| 亚洲国产成人久久综合一 | 99精品伊人久久久大香线蕉| 99久久99久久精品国产片果冻| 国产L精品国产亚洲区久久| 日韩人妻无码一区二区三区久久| 精品久久久久久无码中文野结衣| 国产精品久久一区二区三区| 99久久精品免费看国产一区二区三区 | 99久久精品九九亚洲精品| 97久久超碰成人精品网站| 久久强奷乱码老熟女网站| 性做久久久久久免费观看| 污污内射久久一区二区欧美日韩| 国产精品欧美久久久久天天影视 | 亚洲伊人久久精品影院| 亚洲精品无码久久久久AV麻豆| 伊人色综合久久| 亚洲精品高清久久| 九九久久99综合一区二区| 久久精品国产精品青草app| 国产精品久久久福利|