青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

posts - 12, comments - 4, trackbacks - 0, articles - 36
今天看了一篇文章,主要講的是數據挖掘在新聞事件的發現和跟蹤上面的應用。論文的題目是Learing approaches for Detecting and Tracking News Events.
文章主要分成五個部分
新聞事件的特點分析,新聞事件的發現,新聞事件發現的評估,新聞時間的跟蹤,新聞事件跟蹤的評估

大致總結一些每一部分的主要內容

新聞事件的特點分析
   新聞事件和一般的文本分類,信息提取不同的地方在于,新聞事件的發展和報道和時間上的關系。新聞是以時間順序輸入TDT系統,關于某個事件的新聞,在時間上是一個尖峰脈沖。因此在做相似性聚類的時候需要充分考慮報道同一事件的新聞在時間上的相似性,以及文本相似性。
   還有就是,報道不同事件的新聞的term會大大不同,其起到的作用,即權值也大大不同,因此需要動態的更改這些權值,為下面的聚類和分類使用。

新聞事件的發現
   新聞事件的發現,實際上就是文本聚類,和時間有關的,文本量不大的文本聚類
   事件發現又分為兩部分:回顧的事件挖掘和新事件的在線發現。
   這篇文章主要采用了兩個修改了的聚類算法:GAC和INCR,其中GAC是對塊數據進行處理,會返回樹狀聚類,INCR是對流數據進行處理
   聚類的表示,這篇文章使用的是ltc,但其中的idf因子進行了修改
IDF(t,p)=log(N(p)/n(t,p)) 其中p是時間。

   GAC的步驟,

1.       把輸入集合的每一個文檔當作一個單獨的聚類,設置初始劃分為單個集合的全部集。

2.       把當前劃分分成兩個沒有重疊,并且連續的大小為m(用戶預定義的)的籃子

3.       在每個籃子里面使用GAC,重復的把兩個低層的聚類聚集成一個高層的聚類,直到籃子中的聚類降到p(用戶預定義的)或者任意兩個聚類間的相似性小于一個與定義的閾值(用戶預定義的)。

4.       移除籃子邊界,按照聚類的時間,把所有GAC聚類放在一起。使用的到的聚類序列作為更新的劃分。

5.       重新計算2-4部,直到劃分的大小不大于m,或者聚類之間的相似性達到限制。

6.       定期(once of 運行第五步k次)的在每個最高層聚類中重聚類,通過撫平組建聚類和從葉結點重新增長聚類。防止新聞事件被分在兩個時間窗口的情況的影響。

      

   
INCR
算法是直接的,一個一個處理文檔,逐步增加聚類。如果一個新文檔和一個類的相似性大于一個閾值tc,則聚入到已有的最近類。如果和所有的聚類的相似性都小于閾值,則把他作為新類的種子。通過恰當的選取閾值,可以獲得不同粒度的聚類。

       對于INCR在線事件發現的應用時,我們引入了一個附加的閾值,noverlty threshold(tn)。如果當前文檔和任何聚類的相似性都小于noverlty threshold,這個文檔就標記為“NEW”,表示這是一個新事件的開頭;否則就標記“OLD”。通過調整這個閾值,可以調整對于在線發現新事件的敏感度。

       設置兩個閾值的原因在于可以為不同的任務進行優化,我們發現設置tc=tn對于回顧聚類比較合適,而設置tc=正無窮對于在線偵測比較更好,即,不產生任何聚類。

       對于INCR增加的另外一個功能是時間懲罰(time penalty)。最簡單的方法是使用一個時間窗口。給定當前的文檔x,我們引入一個時間窗口m表示x前的m個文檔,然后定義修改后的x和任意聚類c相似性sim(x,c)

另外,他們引入了衰退相似性的權重函數sim(x,c)=(1-i/m)*sim(x,c),其中ix和類c中最近的文檔數。文中說,可以給出非線性的衰退函數,以求得更好的結果。

 

       對于新舊的預測,每個文檔要計算一個score,表示這個文檔有多新score(x)=1-arg max{sim(x,c)'}  其中x是當前新文檔,c是過去的所有聚類。通過設定閾值,來控制準確率和召回率的折中。
   
新聞事件發現的評估
   回顧事件的發現,使用關于籃子的GAC效果最好
   對于在線發現,處理流數據的INCR有天生的優勢,但是需要恰當的調整相似性的權重函數和聚類的閾值,這可能需要通過實驗測定。

新聞事件的跟蹤
   就是要在新聞事件到來的時候,確定他是關于那些事件,但是做決定的根據是先前到來的關于這個事件的為數不多的新聞。同時還要求能夠分開有關系的新聞事件,例如前后的礦難。另外就是要求對一個新聞事件的判斷必須是獨立的,與其他事件無關。
   文章選取了kNN和決策樹的算法。因為kNN在TC上的性能非常好,對術語和新聞作了最少的假設。
   為每個新聞事件訓練了一個kNN,并把它的m-ary變成了二維判斷。是由于正面事例太少,所以修改了一下YES的判斷標準。
   決策樹的算法暫時不考慮。
   在做分類時,一般只考慮一到一個半月以內的新聞作為訓練集,因為一般新聞的持續時間不會超過兩個月

事件跟蹤的評估
修改后的kNN效果還是很不錯的


只有注冊用戶登錄后才能發表評論。
網站導航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理


青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            先锋影音国产精品| 免费久久99精品国产| 日韩视频在线一区| 欧美国产一区二区在线观看| 亚洲福利一区| 欧美国产日本韩| 欧美成人免费在线| 一区电影在线观看| 亚洲视频中文字幕| 国产一区二区三区四区老人| 久久久久欧美| 欧美aⅴ一区二区三区视频| 亚洲久久视频| 一本一道久久综合狠狠老精东影业| 欧美三区视频| 久久午夜激情| 欧美日韩国产综合新一区| 性欧美精品高清| 美女999久久久精品视频| 日韩视频永久免费观看| 亚洲一区二区免费看| 激情一区二区| 亚洲精品日韩精品| 国产综合亚洲精品一区二| 亚洲国产小视频在线观看| 欧美日韩在线免费视频| 久久久久国色av免费观看性色| 另类av一区二区| 亚洲综合社区| 免费精品99久久国产综合精品| 亚洲欧美综合网| 久久中文字幕一区| 午夜精品久久久久久久99热浪潮| 久久精品99国产精品日本| 一区二区三区精密机械公司| 久久九九精品99国产精品| 亚洲最快最全在线视频| 久久精品av麻豆的观看方式 | 在线亚洲欧美视频| 国产一区再线| 日韩视频一区二区三区| 亚洲国产精品123| 亚洲欧美国产va在线影院| 亚洲人成网在线播放| 久久精品国产亚洲精品| 亚洲午夜激情网站| 免费在线亚洲| 久久―日本道色综合久久| 国产精品国色综合久久| 亚洲激情一区| 亚洲国产岛国毛片在线| 亚洲欧美在线磁力| 亚洲一区欧美| 欧美日韩精品二区| 亚洲国产欧美在线| 1000部精品久久久久久久久| 亚洲综合国产激情另类一区| 亚洲图片欧美一区| 欧美紧缚bdsm在线视频| 亚洲国产成人不卡| 亚洲国产mv| 久久天天狠狠| 欧美aa在线视频| 在线看日韩欧美| 久久午夜精品一区二区| 免费视频一区| 亚洲国产精品va在线看黑人动漫 | 欧美激情一区二区三区 | 欧美ed2k| 亚洲黄色一区二区三区| 亚洲日本电影| 欧美a一区二区| 亚洲国产欧美国产综合一区| 亚洲欧洲日本专区| 欧美精品首页| 99re热这里只有精品视频| 在线中文字幕不卡| 国产精品视频导航| 先锋影音国产精品| 久久亚洲精品伦理| 在线免费观看一区二区三区| 久久综合给合久久狠狠色| 欧美成人免费一级人片100| 亚洲激情黄色| 欧美日韩一区二区三区在线| avtt综合网| 久久精品亚洲一区二区三区浴池| 国内外成人免费激情在线视频网站 | 久久综合给合久久狠狠狠97色69| 在线观看不卡av| 欧美激情精品久久久久久蜜臀 | 欧美一区二区三区视频免费播放 | 玖玖玖国产精品| 亚洲国产婷婷综合在线精品| 欧美激情一区二区三区 | 牛牛精品成人免费视频| 99综合精品| 国产欧美日韩中文字幕在线| 久久成人综合网| 欧美激情亚洲自拍| 欧美亚洲免费电影| 亚洲激情偷拍| 国产伦精品一区二区三区高清版| 久久久免费av| 一本色道婷婷久久欧美| 久久婷婷国产综合国色天香| 亚洲乱码日产精品bd| 国产精品永久免费观看| 美日韩精品免费观看视频| 一区二区三区视频观看| 免费久久精品视频| 香蕉久久夜色| 亚洲精品国精品久久99热一| 国产精品永久免费在线| 欧美成人黄色小视频| 亚洲欧美日韩中文播放| 最新国产成人在线观看| 久久蜜桃精品| 午夜视黄欧洲亚洲| 一本一道久久综合狠狠老精东影业| 国产午夜精品久久久久久免费视 | 欧美激情一区| 久久一区欧美| 亚洲永久精品大片| 亚洲精品国产视频| 欧美凹凸一区二区三区视频| 欧美一区二区精品在线| 一本色道久久综合狠狠躁篇怎么玩| 国产一区二区精品久久99| 国产精品福利片| 欧美日韩国产成人在线免费 | 亚洲美女91| 欧美激情一区二区三级高清视频 | 亚洲欧洲视频| 精品粉嫩aⅴ一区二区三区四区| 国产精品第一页第二页第三页| 欧美精品激情在线观看| 免费国产自线拍一欧美视频| 久久精品成人| 久久精品官网| 久久国产精品亚洲77777| 亚洲在线观看| 亚洲综合视频1区| 亚洲一卡久久| 亚洲一区二区高清| 亚洲综合日韩| 亚洲欧美在线磁力| 欧美一区视频| 久久精品在线播放| 久久久久久高潮国产精品视| 欧美中文在线字幕| 久久久久久久999精品视频| 久久精品av麻豆的观看方式| 久久久久久一区| 巨乳诱惑日韩免费av| 免费看成人av| 欧美日韩91| 国产精品久久网| 国产精品视频99| 国产一区二区三区高清播放| 激情另类综合| 亚洲乱码视频| 亚洲尤物影院| 久久裸体视频| 亚洲人www| 一区二区三区久久久| 欧美一区二视频| 蜜臀av性久久久久蜜臀aⅴ| 欧美精品在欧美一区二区少妇| 欧美视频在线观看一区| 国产乱码精品一区二区三区不卡 | 欧美日本国产一区| 国产精品久久久久三级| 国内伊人久久久久久网站视频 | 国产农村妇女毛片精品久久麻豆| 国产日韩欧美中文| 亚洲激情二区| 亚洲欧美激情四射在线日| 久久精品国语| 亚洲欧洲另类| 亚洲欧美国产精品va在线观看| 久久精品视频免费播放| 欧美日韩视频在线一区二区观看视频| 国产精品免费视频xxxx| 亚洲国产天堂久久国产91| 亚洲一级在线| 免费成人高清视频| 亚洲一区二区综合| 欧美成人精品1314www| 国产精品一二三四| 亚洲精品之草原avav久久| 久久精品一区二区三区不卡| 亚洲国产日韩欧美综合久久| 亚洲欧美电影在线观看| 欧美激情一区二区三区成人| 国内自拍一区| 亚洲在线观看免费视频| 亚洲高清激情| 久久阴道视频| 国产一区二区三区四区在线观看|