自然語言處理中,經常要處理序列標注問題(分詞、詞性標注、組快分析等),為給定的觀察序列標注標記序列。

os分別代表觀察序列和標記序列,

clip_image002

根據貝葉斯公式,clip_image004

  生成模型和判別模型的定義

  os進行統計建模,通常有兩種方式:

(1)生成模型

   構建os的聯合分布p(s,o)

(2)判別模型

   構建o和s的條件分布p(s|o)

   判別模型和生成模型的對比

(1)訓練時,二者優化準則不同

      生成模型優化訓練數據的聯合分布概率;

      判別模型優化訓練數據的條件分布概率,判別模型與序列標記問題有較好的對應性。

(2)對于觀察序列的處理不同

      生成模型中,觀察序列作為模型的一部分;

      判別模型中,觀察序列只作為條件,因此可以針對觀察序列設計靈活的特征。

(3)訓練復雜度不同

      判別模型訓練復雜度較高。

(4)是否支持無指導訓練

      生成模型支持無指導訓練。