• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            posts - 12, comments - 4, trackbacks - 0, articles - 36

            唉,越看越瑣碎

            Posted on 2005-12-07 12:02 inwind 閱讀(285) 評論(0)  編輯 收藏 引用 所屬分類: 隨想
            網頁的自動分類,需要考慮的東西很多啊。

            分類體系的選擇,利用DDC還是中圖?還是借鑒yahoo或者google的分類體系?分類層次有多深?

            訓練文集的選取?哪里來呢,那么多打好標記,并且其分類要與我們的分類相同或者,相似吧

            剛開始網頁的內容處理,表示,是否考慮超鏈接,是否考慮html,如何剔出亂其八糟的廣告?

            網頁向量化,又有那么多種權值計算方法,經典的就五個了,還有改進的,估計也有那么五六個比較好的吧?

            向量的降維,還好那位帥哥整理過5經典的算法,再加上后來北大那幫人做的實驗,經典的幾個里面的性能大多清楚了。可是,是不是還有改進的呢?特征提取算法和后面的分類算法組合后的性能參數呢?

            ok,然后是分類算法,姑且考慮KNN,還要考慮KNN的參數,K=?,文檔之間的距離的計算,文檔-類得分的的加權?如何加權?——還有其他的算法呢?

            分類完了,還有截取算法,某個文檔可以屬于哪些類?某個類可以包含哪些文檔?這個怎么確定?RCut,PCut還是SCut,還有其他的改進算法嗎?

            最有,貪心算法在這里面能起作用嗎?即每一步,都利用別人的實驗,選擇最好的算法,可是綜合起來,就一定是全局最好的算法嗎?
            99久久婷婷国产一区二区| 国产成人精品久久亚洲| 久久婷婷色综合一区二区| 囯产极品美女高潮无套久久久 | 91精品国产综合久久久久久| 国产精品久久国产精品99盘| 国产成人综合久久久久久| 99久久精品国产一区二区| 亚洲国产成人久久精品动漫| 色婷婷久久久SWAG精品| 国产亚洲欧美成人久久片| 亚洲精品NV久久久久久久久久| 国产精品一久久香蕉国产线看观看| 国产—久久香蕉国产线看观看| 亚洲午夜久久久久妓女影院 | 怡红院日本一道日本久久| 欧美亚洲日本久久精品| 91精品国产高清久久久久久io | 亚洲欧美成人综合久久久| 香蕉久久夜色精品国产小说| 欧美va久久久噜噜噜久久| 人妻精品久久久久中文字幕| 久久久青草青青亚洲国产免观| 久久无码AV中文出轨人妻| 久久亚洲精品无码观看不卡| 久久这里只有精品久久| 久久精品中文字幕无码绿巨人| 国产成人综合久久精品红| 久久人人超碰精品CAOPOREN | 久久久91人妻无码精品蜜桃HD| 99久久精品国产麻豆| 久久天天躁狠狠躁夜夜躁2O2O| 国产精品美女久久福利网站| 亚洲日韩欧美一区久久久久我| 久久久国产精品| 亚洲国产成人久久综合野外| 性欧美大战久久久久久久| 香蕉久久永久视频| 伊人久久大香线蕉综合Av| 精品熟女少妇AV免费久久| 无码伊人66久久大杳蕉网站谷歌 |