• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            sunrise

            每天不斷學習,才能不斷提升自己。

              C++博客 :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理 ::
              64 隨筆 :: 0 文章 :: 92 評論 :: 0 Trackbacks

               今天六一,C小加不在身邊,混球啊。任務需要在看曼寧的《統計自然語言處理基礎》。然后用到互信息,每次我覺得好高深的名字,做下去的時候就發現沒有那么難。

            搭配

            搭配由有限的復合構詞法所描述。

            識別搭配對的方法有三種:1.使用頻率信息的搭配識別。2.基于含義和主詞搭配詞之間的距離識別。3.基于假設測試和互信息的識別。

            1.頻率

            將語料過濾后得到的動詞,名詞,之間進行兩兩配對,統計每個詞語在一個句子,或在一個段落中出現的次數,即為頻率。

            2.均值和方差 

               由于兩個詞之間的距離是可以變化的,計算兩個詞之間的偏移量的均值和方差。

            均值就是簡單的平均偏移量。

            方差衡量的是單獨的偏移量偏離均值的距離:


             
            是同現i的偏移量,表示的是樣本偏移量的均值。 

                 我們可以通過使用這個信息來發現搭配。具體的方法是通過尋找帶有低偏差的詞對。一個低的偏差值意味著這兩個詞通常大致相同距離出現。零偏差意味著這兩個詞總是以相同的距離出現。

               方差是關于一個相對于其他詞分布峰值情況的度量。

            關于互信息

            互信息的計算公式是這樣的:

            MI(a,b) = log( p(ab) / (p(a)*p(b)) )

            其中log的底數是2p(x)表示x出現的概率。

            好吧,好水,好簡單。。著手寫代碼了。

            posted on 2012-06-01 13:06 SunRise_at 閱讀(2100) 評論(2)  編輯 收藏 引用 所屬分類: 自然語言處理

            評論

            # re: 統計自然語言處理--互信息 2012-06-03 22:35 alafeizai
            統計自然語言處理 pdf么?  回復  更多評論
              

            # re: 統計自然語言處理--互信息 2012-06-04 10:00 SunRise_at
            我看的是紙質的。。@alafeizai
              回復  更多評論
              

            99久久国产综合精品麻豆| 亚洲国产成人精品女人久久久| 欧美亚洲国产精品久久| 亚洲国产精品18久久久久久| 久久国产乱子伦免费精品| 99久久国产综合精品五月天喷水 | 亚洲国产成人久久综合一区77| 波多野结衣久久| 91精品观看91久久久久久| 久久久www免费人成精品| 伊人久久综在合线亚洲2019| 亚洲精品乱码久久久久66| 国产成人无码精品久久久免费| 久久久一本精品99久久精品88| 亚洲国产成人久久综合一| 亚洲中文久久精品无码ww16| 久久香蕉国产线看观看乱码| 久久中文字幕人妻熟av女| 久久97久久97精品免视看| 精品久久久久久国产| 亚洲精品乱码久久久久久| 女同久久| 欧美精品丝袜久久久中文字幕 | 久久笫一福利免费导航| 亚洲成色999久久网站| 久久久久亚洲AV无码网站| 漂亮人妻被中出中文字幕久久 | 久久青青草原亚洲av无码app| 色婷婷久久综合中文久久一本| 国产一区二区三区久久| 久久精品国产亚洲AV麻豆网站| 综合久久精品色| 欧美亚洲国产精品久久| 久久国产欧美日韩精品免费| 亚洲日韩欧美一区久久久久我| 久久影视综合亚洲| 伊人久久一区二区三区无码| 欧美亚洲国产精品久久| 久久天天躁夜夜躁狠狠| 青青草原精品99久久精品66 | 久久国产精品免费|