青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

隨筆 - 89  文章 - 118  trackbacks - 0
<2008年7月>
293012345
6789101112
13141516171819
20212223242526
272829303112
3456789

留言簿(16)

隨筆分類(56)

隨筆檔案(89)

文章分類

推薦博客

搜索

  •  

最新隨筆

最新評論

閱讀排行榜

轉自:http://blog.csdn.net/pennyliang/archive/2010/07/07/5717498.aspx

中文分詞方法有很多,其中基于詞典的分詞方法有:
  •     基于模式匹配的方法:(速度快)

                     正向最大匹配、逆向最大匹配法、雙向匹配法

  •      基于規則的方法:(索引壓縮的效果最好)
                     最少分詞法
     基于統計的分詞方法有:
  •      統計語言模型分詞(2-gram,3-gram)
  •      串頻統計的漢語自動分詞

      除了這些基本的方法,為了獲得最佳的效果,也可以引入動態規劃的方法獲得最優解。

     設句子P = W0W1W2?Wn , 其中Wi (0≤i≤n) 為句子P中的第i 個漢字。Si(0≤i≤n+1)為句子的第i個間隙(切分位置)

     那么一個句子P理論上有多少種分詞法呢?

     分詞分法總數的通項:Fn)表示一個有n個單詞的句子包含的全部不同的分詞方法。

     F(n)=1+ F(n-1)+F(n-2)+F(n-3)+F(n-4)+..F(1)

    F(1)=1

    F(2)=2

    F(3)=4

    F(4)=8

     …

    F(n)=2F(n-1)

    則F(n)=2n-1

    如果將詞頻看做是距離,則求解最佳切分方法等價于在2n-1的解空間中尋找1種最佳的切分方法使得路徑最短。為此我們舉個例子:

    早起先刷牙

 

    

 

圖中紅圈為切分點,切分點之間的連線表示確定的一種分詞

圖中給出了三種分法,分別是[][][][][]、[早起][][刷牙][][起先][刷牙]

假定我們有這樣一個字頻和詞頻表,分別如下

 

              400

早起            100

              500

起先            150

              500

              300

刷牙            100

              500

則以上三種切分法的代價分別為

[][][][][]400+500+500+300+500 = 2200

[早起][][刷牙]100+500+100 = 700

[][起先][刷牙]400+150+100 =750 (此處應為650)

因此選用第2種切分法。

動態規劃的偽代碼大致為:

Segment(S,low,high,cost,last)

{

        Mincost = MAX;

        If(high-low<=1)

        {

        mincost = Costof(cost,L(low,high-low)); //其中L(start,length)的含義表示從start開始從P中取length長度的文本,Costof為該段文本的字頻,或者詞頻,如果不存在則為無窮大;如果cost數組中已經計算過,則不重復計算,直接取值返回。

        cost[low][high] = mincost;

        Return mincost;

       }

        fori = low+1 to high

       {

           a = Segment(S,low,i,cost,last);//為了簡單這里做了精簡,事實上如果a返回的是無窮大,則后面不用繼續計算,直接跳出,因為這種情況下無論如何也不可能是最優解,可以直接剪枝。

           b = Segment(S,i,high,cost,last);

           if(a+b<Mincost)

           {

               Mincost = a + b;

               Cost[low][high]=Mincost;

               Last[low][high] = i;//Last記錄最佳切分點

           }

        }

        ExtractSegmentPos(Last,low,high);//該函數是將切分點一一展開。

}

 

 

 

 ExtractSegmentPos(Last,low,high)

{

     SegPos=MAX;

     if(high-low>1)

     {

          If(Last[low][high]>0)

          {

              SegPos =  Last[low][high];

              output(SegPos);
          }

          else

          { 

               return;

          }

     }

     ExtractSegmentPos(Last,low, SegPos);

     ExtractSegmentPos(Last, SegPos,high);

}


參考文獻

[1] 孫 曉, 黃德根  基于動態規劃的最小代價路徑漢語自動分詞   [J]小型微型計算機系統  第27 卷第3 期 2006 年3 月

其他推薦閱讀

http://www.leadbbs.com/MINI/default.asp?230-2682632-0-0-0-0-0-a-.htm

posted on 2010-07-30 09:06 胡滿超 閱讀(779) 評論(0)  編輯 收藏 引用

只有注冊用戶登錄后才能發表評論。
網站導航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理


青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            欧美一区免费| 久久电影一区| 欧美激情1区2区3区| 久久亚洲图片| 亚洲高清视频一区二区| 久久婷婷蜜乳一本欲蜜臀| 久久国产精品99国产| 激情综合电影网| 亚洲国产一区二区三区在线播| 久久精品欧美日韩| 亚洲国产乱码最新视频| 欧美二区乱c少妇| 欧美另类videos死尸| 中文欧美日韩| 性做久久久久久久免费看| 在线观看精品视频| 亚洲激情另类| 国产精品美女| 裸体一区二区三区| 欧美欧美在线| 久久久久久久网| 蜜桃久久av一区| 亚洲欧美日韩综合aⅴ视频| 欧美一区二区三区日韩| 亚洲国产日韩欧美综合久久| 99精品免费| 韩国成人精品a∨在线观看| 亚洲国产精品久久久久婷婷老年| 欧美性生交xxxxx久久久| 久久午夜国产精品| 欧美日韩福利在线观看| 久久久国产视频91| 欧美老女人xx| 久久综合久久美利坚合众国| 欧美日韩国产精品成人| 久久精品官网| 欧美三级日韩三级国产三级| 久久久免费精品| 欧美日韩中国免费专区在线看| 久久久综合网| 国产精品久久九九| 亚洲电影激情视频网站| 国产日韩欧美成人| 99热免费精品| 亚洲国产精品一区| 欧美在线影院| 亚洲一区二区成人| 免费成人av在线看| 久久精品视频亚洲| 欧美先锋影音| 亚洲美女在线视频| 亚洲黄色小视频| 久久久7777| 久久精品九九| 国产精品久久久久久久久久妞妞| 亚洲国产高清aⅴ视频| 国产一区二区电影在线观看| 亚洲天堂成人在线观看| 日韩午夜在线播放| 久久伊人一区二区| 久久久噜噜噜久久久| 国产情人节一区| 亚洲性线免费观看视频成熟| 99国内精品久久久久久久软件| 久久综合九色九九| 久久伊人免费视频| 狠狠色丁香婷婷综合久久片| 欧美在线一级视频| 久久午夜视频| 在线不卡中文字幕| 麻豆91精品| 亚洲高清网站| av成人黄色| 欧美午夜精品久久久久免费视| 日韩视频专区| 亚洲永久在线| 国产日韩欧美一区二区三区四区| 亚洲欧美日韩国产综合精品二区| 亚洲欧美日韩网| 国产亚洲欧美aaaa| 久久久久国色av免费看影院| 美女精品网站| 亚洲精品资源| 欧美日韩国产小视频| 一本大道久久精品懂色aⅴ| 亚洲综合社区| 韩国精品在线观看| 蜜桃久久av一区| 99这里只有精品| 欧美在线免费视屏| 1000部精品久久久久久久久| 欧美丰满高潮xxxx喷水动漫| 亚洲毛片在线| 久久久久九九视频| 亚洲国产日韩欧美在线图片| 欧美日韩亚洲高清| 亚洲永久精品大片| 蜜桃精品一区二区三区 | 亚洲精品免费在线| 国产精品99久久久久久www| 国产精品麻豆va在线播放| 欧美一区中文字幕| 亚洲国产精品精华液2区45| 亚洲一区二区三区久久| 国内精品久久久| 欧美日韩精品三区| 久久九九国产精品| 亚洲最黄网站| 欧美福利视频网站| 午夜日韩福利| 亚洲精品影视| 国产一区亚洲一区| 欧美日韩在线视频一区| 久久久久国产免费免费| 一区二区三区欧美在线观看| 欧美成人福利视频| 欧美成人精品在线播放| 99riav久久精品riav| 国产精品揄拍500视频| 欧美激情综合色| 欧美在线视频观看| 亚洲精品久久久久久久久| 亚欧美中日韩视频| 日韩亚洲视频在线| 伊人春色精品| 国产精品私拍pans大尺度在线| 欧美极品aⅴ影院| 久久久xxx| 欧美一二三区精品| 亚洲午夜精品网| a4yy欧美一区二区三区| 欧美韩国在线| 久久综合亚洲社区| 久久成人免费视频| 亚洲欧美激情视频| 亚洲桃色在线一区| 亚洲精选91| 亚洲精品一区二区在线观看| 伊大人香蕉综合8在线视| 国产日韩精品综合网站| 国产欧美日本一区二区三区| 国产精品大片| 欧美性大战久久久久久久蜜臀| 欧美日韩国产成人在线观看| 欧美多人爱爱视频网站| 美女图片一区二区| 美国成人毛片| 欧美国产综合视频| 欧美精品99| 欧美激情精品久久久六区热门 | 久久久久在线| 久久先锋影音| 麻豆精品视频在线| 久久中文精品| 欧美好吊妞视频| 欧美精品久久天天躁 | 亚洲一区二区三区免费视频| 在线视频中文亚洲| 亚洲免费视频成人| 欧美一区二区三区在线免费观看| 亚洲欧美一区二区在线观看| 午夜精品免费视频| 欧美影片第一页| 久久久夜色精品亚洲| 理论片一区二区在线| 欧美激情综合亚洲一二区| 欧美日韩高清区| 国产欧美日韩综合一区在线观看 | 国产精品成人av性教育| 国产精品爽爽爽| 国产日韩一区欧美| 伊人久久亚洲热| 一本不卡影院| 久久精品国产精品亚洲综合| 久久免费精品视频| 亚洲国产精品久久久久秋霞不卡 | 亚洲第一在线视频| 亚洲日本aⅴ片在线观看香蕉| 日韩亚洲国产精品| 午夜精品久久久久影视| 毛片av中文字幕一区二区| 欧美三级在线| 韩国亚洲精品| 亚洲一区二区三区在线播放| 久久婷婷麻豆| 一二三区精品| 久久综合久久美利坚合众国| 欧美日韩麻豆| 在线高清一区| 亚洲在线播放| 欧美成人综合网站| 亚洲淫性视频| 欧美国产日韩精品免费观看| 国产欧美日韩精品一区| 亚洲乱码精品一二三四区日韩在线 | 欧美在线视频不卡| 欧美视频三区在线播放| 亚洲日本va午夜在线电影| 欧美一区二区三区日韩视频| 91久久精品日日躁夜夜躁国产|