自然語(yǔ)言處理中,經(jīng)常要處理序列標(biāo)注問(wèn)題(分詞、詞性標(biāo)注、組快分析等),為給定的觀察序列標(biāo)注標(biāo)記序列。

os分別代表觀察序列和標(biāo)記序列,

clip_image002

根據(jù)貝葉斯公式,clip_image004

  生成模型和判別模型的定義

   對(duì)os進(jìn)行統(tǒng)計(jì)建模,通常有兩種方式:

(1)生成模型

   構(gòu)建os的聯(lián)合分布p(s,o)

(2)判別模型

   構(gòu)建o和s的條件分布p(s|o)

   判別模型和生成模型的對(duì)比

(1)訓(xùn)練時(shí),二者優(yōu)化準(zhǔn)則不同

      生成模型優(yōu)化訓(xùn)練數(shù)據(jù)的聯(lián)合分布概率;

      判別模型優(yōu)化訓(xùn)練數(shù)據(jù)的條件分布概率,判別模型與序列標(biāo)記問(wèn)題有較好的對(duì)應(yīng)性。

(2)對(duì)于觀察序列的處理不同

      生成模型中,觀察序列作為模型的一部分;

      判別模型中,觀察序列只作為條件,因此可以針對(duì)觀察序列設(shè)計(jì)靈活的特征。

(3)訓(xùn)練復(fù)雜度不同

      判別模型訓(xùn)練復(fù)雜度較高。

(4)是否支持無(wú)指導(dǎo)訓(xùn)練

      生成模型支持無(wú)指導(dǎo)訓(xùn)練。