• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            posts - 7,  comments - 64,  trackbacks - 0
            大學(xué)畢業(yè)了!!上來感嘆一下!并拿出自己的畢業(yè)設(shè)計(jì)分享一下。
            這個(gè)小東西是用了一個(gè)星期完成的。BUG肯定不少,大家湊合著看一下吧。感覺有趣的就拿去玩玩。
            說說基本思路。
            1.對(duì)文件進(jìn)行分詞處理
            2.通過統(tǒng)計(jì)訓(xùn)練文檔當(dāng)中的詞頻方差,構(gòu)造評(píng)判矩陣
            3.之后在構(gòu)造待分類文檔的評(píng)判向量
            4.用評(píng)判向量和構(gòu)造矩陣相乘,選出最接近的分類。
            具體地方法大家可以參考一下這篇論文:《基于模糊理論的網(wǎng)頁過濾算法的實(shí)現(xiàn)》
            上圖:

                                                主界面

                                             結(jié)果文件

             訓(xùn)練文檔的目錄結(jié)構(gòu)

            程序文件:
             http://www.namipan.com/d/db9717e2153a1bc504dc597fee9ac32e92b428fcc4fe3900

            其實(shí)正確率還可以進(jìn)一步提高的。以后有興趣的時(shí)候再來重寫一下這個(gè)程序吧。



            總結(jié):
            我盡力優(yōu)化了這個(gè)程序的速度。但還是不理想。
            ICTCLAS分詞系統(tǒng)的效率低是其中一個(gè)重要原因。
            我使用了stlsoft中的aoto_buffer來優(yōu)化內(nèi)存的分配。
            使所有的string在內(nèi)存當(dāng)中只存在一份拷貝。
            map和vector容器永遠(yuǎn)只存放string*

            無法解決的問題:
            我想在一個(gè)double數(shù)組中存放1/N,2/N,3/N......N/N,以便后來使用。
            我覺得這些常量應(yīng)當(dāng)能在編譯時(shí)期確定。但是不知道如何通過定義宏來表示這些數(shù)值。
            搞的我最后不得不啟動(dòng)一個(gè)線程來專門計(jì)算這些值。

            有興趣的郵件聯(lián)系啊~!
            posted on 2009-06-12 21:38 HIT@ME 閱讀(1399) 評(píng)論(2)  編輯 收藏 引用

            FeedBack:
            # re: 非法信息識(shí)別系統(tǒng)
            2009-06-12 23:27 | unnamed
            還以為是源代碼,結(jié)果是執(zhí)行程序。  回復(fù)  更多評(píng)論
              
            # re: 非法信息識(shí)別系統(tǒng)
            2009-06-13 07:18 | YZY
            double數(shù)組既然是靜態(tài)的為什么還要用一個(gè)線程來計(jì)算這些值啊?
            直接計(jì)算或者從文本文件中讀取不就可以了?  回復(fù)  更多評(píng)論
              

            只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。
            網(wǎng)站導(dǎo)航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理


            <2009年6月>
            31123456
            78910111213
            14151617181920
            21222324252627
            2829301234
            567891011

            常用鏈接

            留言簿(5)

            隨筆檔案

            test

            搜索

            •  

            最新評(píng)論

            閱讀排行榜

            評(píng)論排行榜

            久久福利资源国产精品999| 97精品依人久久久大香线蕉97| 国产69精品久久久久777| 久久99国产精品久久久| 久久这里只有精品视频99| 国产福利电影一区二区三区久久老子无码午夜伦不 | 99久久精品九九亚洲精品| 久久99热狠狠色精品一区| 久久精品亚洲乱码伦伦中文| 久久亚洲精品无码aⅴ大香| 国产欧美一区二区久久| 一日本道伊人久久综合影| 国产综合久久久久| 无码人妻久久一区二区三区蜜桃| 东京热TOKYO综合久久精品| 久久久久国产一级毛片高清板| 久久久久亚洲精品日久生情| 亚洲国产精品久久| 色狠狠久久AV五月综合| 亚洲Av无码国产情品久久| 久久福利青草精品资源站| 久久久久波多野结衣高潮| 日韩中文久久| 国产高清国内精品福利99久久| 蜜臀av性久久久久蜜臀aⅴ麻豆| 国内精品久久久久久不卡影院| 亚洲综合日韩久久成人AV| 一本久久a久久精品综合香蕉| 久久精品9988| 久久精品一区二区国产| 久久久免费精品re6| 国产精品成人久久久| 人人狠狠综合久久亚洲| 国产精品狼人久久久久影院| 狠狠色婷婷久久一区二区三区| 久久国产免费直播| 日韩人妻无码一区二区三区久久99| 亚洲综合婷婷久久| 久久国产一片免费观看| 久久久久亚洲精品无码网址 | 国产91久久精品一区二区|