• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            posts - 12, comments - 4, trackbacks - 0, articles - 36

            關于系統架構的思考

            Posted on 2005-12-12 18:31 inwind 閱讀(130) 評論(0)  編輯 收藏 引用
            我們要做的是,發現網絡熱點,跟蹤輿情,并且給與預測。同時,要求能夠對指定的文檔集進行處理,過濾。
               基本過程和xj的差不多,幾個有待商榷問題:
            1 夏博士所說,軟件架構,接口一定要實現定義良好,并且不能被修改,保證以后的更新,維護方便。
            2 數據的結構:參考網站分類的一到三級,先將數據分類,再進行聚類,發現新事件,主題(聚類的過程也是分層的,通過調整閾值)
               對于新發現的事件,使用分類算法來跟蹤
            為什么不能直接聚類完成發現和跟蹤的任務?考慮,如果直接聚類,不容易保證事件的穩定性,同時,計算復雜度較高,不宜控制聚類的數目。難以實現實時跟蹤。——及時發現,實時跟蹤。

            3 對于分類的初步打算:
                  網站抓新聞
                  提取相干tag樹,去除噪音
                  分詞
                  對于一些高亮數據進行標記
                  特征提取(CHI)
                  向量化(tf/idf)
                  kNN
                  RTCut
                  
                  
            久久91精品国产91久久户| 热99RE久久精品这里都是精品免费| 久久九九兔免费精品6| 亚洲αv久久久噜噜噜噜噜| 久久久噜噜噜www成人网| 品成人欧美大片久久国产欧美| 国产午夜精品理论片久久| 亚洲精品成人网久久久久久| 久久精品中文无码资源站| 精品国产乱码久久久久久浪潮| 狠狠色婷婷久久综合频道日韩| 久久精品国产91久久综合麻豆自制| 精品多毛少妇人妻AV免费久久| 国产成年无码久久久免费| 久久精品国产精品亚洲精品| 国内精品伊人久久久久妇| 久久这里只有精品首页| 久久精品日日躁夜夜躁欧美| 亚洲综合久久综合激情久久| 久久亚洲欧美国产精品| 久久久久久久免费视频| 久久久精品人妻无码专区不卡| 久久狠狠高潮亚洲精品| 伊人色综合久久天天人手人婷| 久久93精品国产91久久综合| 色综合久久天天综合| 色婷婷综合久久久中文字幕| 国产精品久久久久久五月尺| 国产精品美女久久久免费| 99久久99久久久精品齐齐| 久久99久国产麻精品66| 久久精品成人免费国产片小草| 久久99国产精一区二区三区| 日韩精品久久久肉伦网站| 国产美女亚洲精品久久久综合| 久久久久久久亚洲精品| 久久久久国色AV免费观看| 成人亚洲欧美久久久久| 精品国产一区二区三区久久蜜臀| 国产999精品久久久久久| 久久成人18免费网站|