繼建立同義詞庫后的新任務(wù),讀文獻(xiàn),然后找出問題的解決方案。幾篇文獻(xiàn)都是研究句子與句子的相似度計(jì)算,我們的關(guān)鍵是詞語與句子的相似度計(jì)算。據(jù)說FAQ是自然語言處理領(lǐng)域研究的熱點(diǎn)。看了幾篇論文,感覺都是大同小異。
因?yàn)槭堑谝淮谓佑|這些東西,所以有很多陌生的詞匯,就自己動(dòng)手查了查。
關(guān)于HowNet,見http://www.keenage.com/zhiwang/c_zhiwang.html
FAQ自動(dòng)問答系統(tǒng)的核心問題是如何快速地將客戶所提問題與FAQ數(shù)據(jù)庫的問題比較,進(jìn)而確定與其最相似的問題,如果有,則將對(duì)應(yīng)的答案作為結(jié)果回復(fù)給客戶。

FAQ系統(tǒng)結(jié)構(gòu)圖
相似度流程的計(jì)算就是先計(jì)算義原相似度,然后是概念相似度,接著詞語相似度,最后就是句子相似度。
/Files/sunrise/相似度.doc這里公式不能顯示就相似度計(jì)算就插在附件中了。
FAQ差不多就進(jìn)行到這里了。程序小白的小白文章,小白將繼續(xù)小白下去。