Posted on 2005-12-16 17:26
inwind 閱讀(81)
評論(0) 編輯 收藏 引用
今天又開了一下午的會議,boss提出了一個很新穎的想法
因為當(dāng)前的分類和聚類的實驗,都是基于封閉或者半封閉的數(shù)據(jù)集,并且數(shù)據(jù)集是比較規(guī)整的,在向量空間上是不均勻的,即有利于劃分的。
雖然,特征提取就是為了選擇可以劃分的向量,但是考慮到網(wǎng)絡(luò)上的海量數(shù)據(jù),測驗的結(jié)果和封閉測試的可能懸殊很大。
基于這樣的考慮,考慮使用多個分類或者聚類策略(這里使用策略一詞,包括不同的特征選擇策略的側(cè)重,例如地點,時間等,也包括分類/聚類算法的選擇,M-ray策略的選擇等等),最后把每個分類/聚類算法的結(jié)果,以向量的形式給出,聯(lián)成一個新的大向量,然后依次作分類/聚類。
這種思想是很新鮮的,但是,同樣,當(dāng)前的分類,聚類算法,比較復(fù)雜的也有將各種特征,進(jìn)行分別提取和不同權(quán)值,產(chǎn)生了不錯的效果。兩種策略的比較,還需要實驗來確定哦