• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            posts - 12, comments - 4, trackbacks - 0, articles - 36

            文本分類與輿情分析

            Posted on 2005-12-08 21:11 inwind 閱讀(1339) 評論(2)  編輯 收藏 引用

               項目的終極目標(biāo)是輿情分析,為主管部門及時掌握網(wǎng)絡(luò)輿論情況,以及了解輿論發(fā)展的時間和空間上的發(fā)生發(fā)展情況。所作的工作必須以此為判斷的唯一標(biāo)準(zhǔn)。
               
               分類,首先要有個分類體系,現(xiàn)在掌握的情況是,分類是根據(jù)學(xué)科體制,在分類樹的某個節(jié)點上,按照唯一的標(biāo)準(zhǔn)進(jìn)行分類。
               
               但是,人類知識本身就是渾然一體的,存在大量的交叉,甚至不同領(lǐng)域研究同一對象,甚至使用相同或者相似方法。(這時感覺,徐小棟老師的說法還是對的,呵呵,知識是渾然一體的,分類是人工雕琢,但是為了掌握的方便,只好如此了)。
               更何況,網(wǎng)絡(luò)信息的多樣性,隨意性,以及貼近生活,使得網(wǎng)絡(luò)信息,尤其是新聞,難以按照學(xué)科體制分類,或者很不適合用學(xué)科體制分類。
               例如,管理部門想要了解民眾對神六的看法,討論和關(guān)注程度,以及關(guān)注的方面。但是按照分類體系,神六對經(jīng)濟的影響屬于經(jīng)濟類,對外交的影響屬于政治類,對民俗的影響又屬于文化類。這樣,對于管理部門,可能是不想要得結(jié)果。
               
               又考慮到了主題的概念,一篇文章舉的例子,地震是主題,但是,唐山地震又是另外的概念,事件;載人航天是主題,但是神六上天又是事件。沒有人給出確切的定義。
               可否這樣定義呢:主題,是關(guān)于一個較為抽象概念的所有文章。
               事件,是關(guān)于一個確切的事件。
               
               但是,問題是,較為抽象的概念,分類的定義就是,對概念進(jìn)行劃分,概念是關(guān)于本質(zhì)屬性的反應(yīng)。本質(zhì)屬性呢,就是決定一個事物或者一類事物不是其他的決定性屬性。主題和分類還是有些混亂啊。

               現(xiàn)在想了兩種方案,
            一是分大類,僅一級,分個十幾二十類,然后在下面進(jìn)行聚類和事件發(fā)現(xiàn)跟蹤。
            二是分得比較細(xì),仿照北大或者google的三級分類,然后進(jìn)行聚類和事件發(fā)現(xiàn)跟蹤,然后給出事件發(fā)現(xiàn)跟蹤的結(jié)果。

            哪一個比較好呢,似乎第一類,簡單分類后,對于聚類和事件發(fā)現(xiàn)跟蹤的影響小。
            但是,新聞的特征向量如何選取呢,理論上分類和聚類的要求是相同的,但是肯定會有細(xì)微的差別,更何況聚類還需要考慮新聞的時間分布。

            另外一個問題了,事件發(fā)現(xiàn)需要利用新聞事件的時間特性,但是,在比較長一段時間內(nèi),關(guān)于一系列事件的主題,如何挖掘呢,比如,礦難。——給每個新聞事件確定一個特征向量,然后對事件的特征向量進(jìn)行聚類?

            嗯,繼續(xù)研究繼續(xù)研究

            Feedback

            # re: 文本分類與輿情分析  回復(fù)  更多評論   

            2007-01-23 21:24 by youyou
            最近準(zhǔn)備研究文本分類,能否給與賜教?不知道有沒有文本分類的代碼,可否給我一份,謝謝!myyouyou1979@126.com

            # re: 文本分類與輿情分析  回復(fù)  更多評論   

            2008-04-20 16:44 by 發(fā)達(dá)省份
            zhaiyongzy@126.com
            我也想要文本分類相關(guān)算法

            只有注冊用戶登錄后才能發(fā)表評論。
            網(wǎng)站導(dǎo)航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理


            久久人人爽人人爽人人av东京热| 欧美亚洲另类久久综合婷婷| 亚洲AV无码久久精品狠狠爱浪潮| 波多野结衣AV无码久久一区| 噜噜噜色噜噜噜久久| 久久午夜夜伦鲁鲁片免费无码影视| 久久丫忘忧草产品| 亚洲国产精品久久久久婷婷老年 | 人妻中文久久久久| 亚洲精品无码久久久久sm| 爱做久久久久久| 亚洲国产精品无码久久久蜜芽| 国产成人99久久亚洲综合精品| 久久久久久久久久久久久久| 久久99国产精品二区不卡| 久久婷婷五月综合97色直播| 久久亚洲综合色一区二区三区| 亚洲精品无码久久久| 久久91综合国产91久久精品| 久久99久久99精品免视看动漫 | 99久久国产热无码精品免费久久久久| 亚洲国产成人久久一区WWW| 国产亚洲美女精品久久久久狼| 99久久综合国产精品免费| 99久久99久久精品国产片| 国产精品99久久99久久久| 久久久久亚洲AV片无码下载蜜桃 | 久久久久久国产精品美女| 97热久久免费频精品99| 亚洲国产一成人久久精品| 伊人久久一区二区三区无码| 91久久精品电影| 999久久久国产精品| 久久精品国产半推半就| 国产精品99久久免费观看| 久久久久免费看成人影片| 久久精品国产亚洲AV电影| 亚洲va久久久噜噜噜久久男同| 国产成人无码精品久久久性色| 久久久久久久免费视频| 精品国产乱码久久久久久呢|