青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

隨筆 - 89  文章 - 118  trackbacks - 0
<2010年12月>
2829301234
567891011
12131415161718
19202122232425
2627282930311
2345678

留言簿(16)

隨筆分類(56)

隨筆檔案(89)

文章分類

推薦博客

搜索

  •  

最新隨筆

最新評論

閱讀排行榜

轉(zhuǎn)自:http://blog.csdn.net/pennyliang/archive/2010/07/07/5717498.aspx

中文分詞方法有很多,其中基于詞典的分詞方法有:
  •     基于模式匹配的方法:(速度快)

                     正向最大匹配、逆向最大匹配法、雙向匹配法

  •      基于規(guī)則的方法:(索引壓縮的效果最好)
                     最少分詞法
     基于統(tǒng)計的分詞方法有:
  •      統(tǒng)計語言模型分詞(2-gram,3-gram)
  •      串頻統(tǒng)計的漢語自動分詞

      除了這些基本的方法,為了獲得最佳的效果,也可以引入動態(tài)規(guī)劃的方法獲得最優(yōu)解。

     設(shè)句子P = W0W1W2?Wn , 其中Wi (0≤i≤n) 為句子P中的第i 個漢字。Si(0≤i≤n+1)為句子的第i個間隙(切分位置)

     那么一個句子P理論上有多少種分詞法呢?

     分詞分法總數(shù)的通項:Fn)表示一個有n個單詞的句子包含的全部不同的分詞方法。

     F(n)=1+ F(n-1)+F(n-2)+F(n-3)+F(n-4)+..F(1)

    F(1)=1

    F(2)=2

    F(3)=4

    F(4)=8

     …

    F(n)=2F(n-1)

    則F(n)=2n-1

    如果將詞頻看做是距離,則求解最佳切分方法等價于在2n-1的解空間中尋找1種最佳的切分方法使得路徑最短。為此我們舉個例子:

    早起先刷牙

 

    

 

圖中紅圈為切分點,切分點之間的連線表示確定的一種分詞

圖中給出了三種分法,分別是[][][][][]、[早起][][刷牙][][起先][刷牙]

假定我們有這樣一個字頻和詞頻表,分別如下

 

              400

早起            100

              500

起先            150

              500

              300

刷牙            100

              500

則以上三種切分法的代價分別為

[][][][][]400+500+500+300+500 = 2200

[早起][][刷牙]100+500+100 = 700

[][起先][刷牙]400+150+100 =750 (此處應(yīng)為650)

因此選用第2種切分法。

動態(tài)規(guī)劃的偽代碼大致為:

Segment(S,low,high,cost,last)

{

        Mincost = MAX;

        If(high-low<=1)

        {

        mincost = Costof(cost,L(low,high-low)); //其中L(start,length)的含義表示從start開始從P中取length長度的文本,Costof為該段文本的字頻,或者詞頻,如果不存在則為無窮大;如果cost數(shù)組中已經(jīng)計算過,則不重復(fù)計算,直接取值返回。

        cost[low][high] = mincost;

        Return mincost;

       }

        fori = low+1 to high

       {

           a = Segment(S,low,i,cost,last);//為了簡單這里做了精簡,事實上如果a返回的是無窮大,則后面不用繼續(xù)計算,直接跳出,因為這種情況下無論如何也不可能是最優(yōu)解,可以直接剪枝。

           b = Segment(S,i,high,cost,last);

           if(a+b<Mincost)

           {

               Mincost = a + b;

               Cost[low][high]=Mincost;

               Last[low][high] = i;//Last記錄最佳切分點

           }

        }

        ExtractSegmentPos(Last,low,high);//該函數(shù)是將切分點一一展開。

}

 

 

 

 ExtractSegmentPos(Last,low,high)

{

     SegPos=MAX;

     if(high-low>1)

     {

          If(Last[low][high]>0)

          {

              SegPos =  Last[low][high];

              output(SegPos);
          }

          else

          { 

               return;

          }

     }

     ExtractSegmentPos(Last,low, SegPos);

     ExtractSegmentPos(Last, SegPos,high);

}


參考文獻

[1] 孫 曉, 黃德根  基于動態(tài)規(guī)劃的最小代價路徑漢語自動分詞   [J]小型微型計算機系統(tǒng)  第27 卷第3 期 2006 年3 月

其他推薦閱讀

http://www.leadbbs.com/MINI/default.asp?230-2682632-0-0-0-0-0-a-.htm

posted on 2010-07-30 09:06 胡滿超 閱讀(779) 評論(0)  編輯 收藏 引用

只有注冊用戶登錄后才能發(fā)表評論。
網(wǎng)站導(dǎo)航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理


青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            国产一区二区三区在线观看网站 | 欧美亚洲一区| 久久精品视频在线看| 亚洲午夜未删减在线观看| 久久一区视频| 久久精品国产77777蜜臀| 欧美三级韩国三级日本三斤| 欧美成人在线免费观看| 韩国av一区二区三区四区| 亚洲男人的天堂在线aⅴ视频| 日韩午夜免费| 欧美激情精品久久久久久黑人| 老司机午夜精品视频| 国产性做久久久久久| 亚洲免费在线看| 亚洲欧美在线播放| 国产精品va在线| 一区二区三区四区蜜桃| 制服诱惑一区二区| 欧美久久电影| 亚洲精品你懂的| 精品不卡视频| 久久久久久久久伊人| 毛片精品免费在线观看| 精品动漫3d一区二区三区免费版 | 亚洲一区二区三区免费观看 | 91久久精品一区| 免费看av成人| 最新亚洲一区| 亚洲视频在线看| 国产精品国产成人国产三级| 中文日韩在线视频| 欧美在线不卡视频| 国产手机视频精品| 久久免费高清| 亚洲国语精品自产拍在线观看| 日韩视频一区二区三区| 欧美视频不卡| 午夜免费在线观看精品视频| 久久久久久97三级| 亚洲国产你懂的| 欧美日韩免费高清| 午夜欧美精品| 模特精品裸拍一区| 9色精品在线| 国产伦精品一区二区三区在线观看 | 午夜欧美理论片| 久久久综合网站| 亚洲精品国产品国语在线app| 欧美老女人xx| 午夜国产一区| 欧美国产日韩在线观看| 一区二区三区导航| 国产精品一区久久久| 久久久久久久激情视频| 亚洲人成绝费网站色www| 午夜欧美精品| 亚洲国产精品久久久久婷婷884| 欧美人与性动交cc0o| 亚洲欧美日韩国产综合| 亚洲福利视频网| 性做久久久久久久免费看| 在线日本欧美| 国产精品一区二区你懂得| 老**午夜毛片一区二区三区| 一个色综合导航| 麻豆av福利av久久av| 亚洲线精品一区二区三区八戒| 狠狠色丁香久久婷婷综合_中| 欧美乱人伦中文字幕在线| 欧美一区二区三区在| 亚洲精品在线视频观看| 久久亚洲一区| 午夜宅男欧美| 99视频超级精品| 精品动漫一区| 国产毛片一区二区| 欧美日韩精品免费观看视频完整| 久久精品免费观看| 亚洲一区二区三区午夜| 亚洲激情av在线| 美女诱惑一区| 久久九九电影| 欧美一级专区| 亚洲一区亚洲| 99精品国产在热久久下载| 在线观看日韩国产| 国产视频精品va久久久久久| 国产精品v日韩精品v欧美精品网站 | 亚洲欧美精品一区| 99精品免费网| 亚洲精品一区二区三区av| 免费成人性网站| 久久视频国产精品免费视频在线| 亚洲欧美国产77777| 国产精品99久久久久久白浆小说 | 亚洲国产美女| 免费高清在线视频一区·| 久久久久久久精| 欧美在线不卡| 久久精品盗摄| 久久精品视频一| 久久精品国亚洲| 欧美综合国产| 久久精品国产成人| 久久av一区二区三区| 欧美亚洲综合在线| 欧美一区二区三区播放老司机| 亚洲综合日本| 欧美一区激情| 欧美在线日韩| 久久欧美肥婆一二区| 久久在线视频在线| 欧美+日本+国产+在线a∨观看| 久热精品视频在线观看一区| 久久伊人精品天天| 女女同性女同一区二区三区91| 老司机午夜精品视频| 欧美激情网友自拍| 日韩一级免费| 亚洲一区二区在线播放| 欧美一级欧美一级在线播放| 久久精品导航| 欧美 日韩 国产 一区| 欧美精品久久天天躁| 欧美视频一二三区| 国产麻豆9l精品三级站| 狠狠色综合网| 亚洲精品乱码久久久久久日本蜜臀 | 欧美成人国产va精品日本一级| 欧美高清不卡| 国产精品毛片| 韩国一区二区三区在线观看| 亚洲激情二区| 亚洲一区二区免费视频| 久久精品五月| 亚洲国产天堂久久综合| 中文在线不卡视频| 久久久久久久精| 欧美色偷偷大香| 娇妻被交换粗又大又硬视频欧美| 亚洲精品韩国| 午夜精品亚洲一区二区三区嫩草| 久久人人97超碰人人澡爱香蕉 | 亚洲三级视频在线观看| 亚洲午夜久久久| 久久亚洲精品欧美| 欧美视频你懂的| 亚洲第一视频网站| 亚洲欧美精品中文字幕在线| 免费观看成人网| 亚洲视频在线观看网站| 久久性天堂网| 国产欧美一区二区三区在线老狼| 亚洲激情社区| 久久精品一二三| 日韩亚洲视频| 免费久久精品视频| 国产午夜亚洲精品羞羞网站| 99精品久久久| 欧美国产视频在线| 欧美一区永久视频免费观看| 欧美日韩不卡| 亚洲国产精品嫩草影院| 久久精品道一区二区三区| 日韩视频一区二区三区在线播放免费观看 | 国产欧美一区二区精品秋霞影院 | 亚洲欧美www| 欧美日本国产精品| 在线免费高清一区二区三区| 性欧美xxxx大乳国产app| 亚洲老板91色精品久久| 欧美1区2区| 精品不卡一区二区三区| 欧美中文字幕视频| 亚洲亚洲精品三区日韩精品在线视频| 欧美不卡视频一区发布| 激情五月综合色婷婷一区二区| 欧美亚洲网站| 亚洲尤物精选| 国产精品黄视频| 亚洲一卡久久| 日韩视频免费观看高清在线视频| 免费观看日韩| 亚洲激情校园春色| 欧美成人资源| 美脚丝袜一区二区三区在线观看 | 国产日韩一区二区三区| 午夜欧美理论片| 亚洲男人的天堂在线观看| 国产精品乱子乱xxxx| 午夜精品成人在线| 亚洲欧美成人精品| 国产欧美精品一区aⅴ影院| 午夜免费电影一区在线观看 | 亚洲精品一区二区三区蜜桃久 | 久久久亚洲成人| 伊人精品久久久久7777| 久久这里只精品最新地址| 久久久精彩视频|