自然語言處理中,經常要處理序列標注問題(分詞、詞性標注、組快分析等),為給定的觀察序列標注標記序列。
令o和s分別代表觀察序列和標記序列,

根據貝葉斯公式,
1 生成模型和判別模型的定義
對o和s進行統計建模,通常有兩種方式:
(1)生成模型
構建o和s的聯合分布p(s,o)
(2)判別模型
構建o和s的條件分布p(s|o)
2 判別模型和生成模型的對比
(1)訓練時,二者優化準則不同
生成模型優化訓練數據的聯合分布概率;
判別模型優化訓練數據的條件分布概率,判別模型與序列標記問題有較好的對應性。
(2)對于觀察序列的處理不同
生成模型中,觀察序列作為模型的一部分;
判別模型中,觀察序列只作為條件,因此可以針對觀察序列設計靈活的特征。
(3)訓練復雜度不同
判別模型訓練復雜度較高。
(4)是否支持無指導訓練
生成模型支持無指導訓練。