繼建立同義詞庫后的新任務,讀文獻,然后找出問題的解決方案。幾篇文獻都是研究句子與句子的相似度計算,我們的關鍵是詞語與句子的相似度計算。據說FAQ是自然語言處理領域研究的熱點??戳藥灼撐?,感覺都是大同小異。
因為是第一次接觸這些東西,所以有很多陌生的詞匯,就自己動手查了查。
關于HowNet,見http://www.keenage.com/zhiwang/c_zhiwang.html
FAQ自動問答系統的核心問題是如何快速地將客戶所提問題與FAQ數據庫的問題比較,進而確定與其最相似的問題,如果有,則將對應的答案作為結果回復給客戶。

FAQ系統結構圖
相似度流程的計算就是先計算義原相似度,然后是概念相似度,接著詞語相似度,最后就是句子相似度。
/Files/sunrise/相似度.doc這里公式不能顯示就相似度計算就插在附件中了。
FAQ差不多就進行到這里了。程序小白的小白文章,小白將繼續小白下去。