http://mp.weixin.qq.com/s?__biz=MzA4MTA5MjE5Mw==&mid=2651787969&idx=1&sn=68c1b0958b6a0c1c70d7543c0970ad50&scene=1&srcid=0519zoXZYKHoRqDA4qivrJDe#wechat_redirect
小編:近日邀請周志華老師為 52cs.org 寫點(diǎn)小文章,特別想讓他給機(jī)器學(xué)習(xí)降降溫,讓大家更客觀更全面地選擇自己的研究方向。周老師推薦了自己以前寫的這篇文章給我,放在當(dāng)下讀這篇文章,一點(diǎn)不過時(shí),希望對大家有所啟迪。
機(jī)器學(xué)習(xí)現(xiàn)在是一大熱門,研究的人特多,越來越多的新人涌進(jìn)來。
不少人其實(shí)并沒有真正想過,這是不是自己喜歡搞的東西,只不過看見別人都在搞,覺著跟大伙兒走總不會(huì)吃虧吧。
問題是,真有個(gè)“大伙兒”嗎?就不會(huì)是“兩伙兒”、“三伙兒”?如果有“幾伙兒”,那到底該跟著“哪伙兒”走呢?
很多人可能沒有意識(shí)到,所謂的machine learning community,現(xiàn)在至少包含了兩個(gè)有著完全不同的文化、完全不同的價(jià)值觀的群體,稱為machine learning "communities"也許更合適一些。
第一個(gè)community,是把機(jī)器學(xué)習(xí)看作人工智能分支的一個(gè)群體,這群人的主體是計(jì)算機(jī)科學(xué)家。
現(xiàn)在的“機(jī)器學(xué)習(xí)研究者”可能很少有人讀過1983年出的“Machine Learning: An Artificial Intelligence Approach”這本書。這本書的出版標(biāo)志著機(jī)器學(xué)習(xí)成為人工智能中一個(gè)獨(dú)立的領(lǐng)域。它其實(shí)是一部集早期機(jī)器學(xué)習(xí)研究之大成的文集,收羅了若干先賢(例 如Herbert Simon,那位把諾貝爾獎(jiǎng)、圖靈獎(jiǎng)以及各種各樣和他相關(guān)的獎(jiǎng)幾乎拿遍了的科學(xué)天才)的大作,主編是Ryszard S. Michalski(此君已去世多年了,他可算是機(jī)器學(xué)習(xí)的奠基人之一)、Jaime G. Carbonell(此君曾是Springer的LNAI的總編)、Tom Mitchell(此君是CMU機(jī)器學(xué)習(xí)系首任系主任、著名教材的作者,機(jī)器學(xué)習(xí)界沒人不知道他吧)。Machine Learning雜志的創(chuàng)刊,正是這群人努力的結(jié)果。這本書值得一讀。雖然技術(shù)手段早就日新月異了,但有一些深刻的思想現(xiàn)在并沒有過時(shí)。各個(gè)學(xué)科領(lǐng)域總有 不少東西,換了新裝之后又粉墨登場,現(xiàn)在熱火朝天的transfer learning,其實(shí)就是learning by analogy的升級版。
人工智能的研究從以“推理”為重點(diǎn)到以“知識(shí)”為重點(diǎn),再到以“學(xué)習(xí)”為重點(diǎn),是有一條自然、清晰的脈絡(luò)。人工智能出身的機(jī)器學(xué)習(xí)研究者,絕大部分 是把機(jī)器學(xué)習(xí)作為實(shí)現(xiàn)人工智能的一個(gè)途徑,正如1983年的書名那樣。他們關(guān)注的是人工智能中的問題,希望以機(jī)器學(xué)習(xí)為手段,但具體采用什么樣的學(xué)習(xí)手 段,是基于統(tǒng)計(jì)的、代數(shù)的、還是邏輯的、幾何的,他們并不care。
這群人可能對統(tǒng)計(jì)學(xué)習(xí)目前dominating的地位未必滿意。靠統(tǒng)計(jì)學(xué)習(xí)是不可能解決人工智能中大部分問題的,如果統(tǒng)計(jì)學(xué)習(xí)壓制了對其他手段的研 究,可能不是好事。這群人往往也不care在文章里show自己的數(shù)學(xué)水平,甚至可能是以簡化表達(dá)自己的思想為榮。人工智能問題不是數(shù)學(xué)問題,甚至未必是 依靠數(shù)學(xué)能夠解決的問題。人工智能中許多事情的難處,往往在于我們不知道困難的本質(zhì)在哪里,不知道“問題”在哪里。一旦“問題”清楚了,解決起來可能并不 困難。
第二個(gè)community,是把機(jī)器學(xué)習(xí)看作“應(yīng)用統(tǒng)計(jì)學(xué)”的一個(gè)群體,這群人的主體是統(tǒng)計(jì)學(xué)家。
和純數(shù)學(xué)相比,統(tǒng)計(jì)學(xué)不太“干凈”,不少數(shù)學(xué)家甚至拒絕承認(rèn)統(tǒng)計(jì)學(xué)是數(shù)學(xué)。但如果和人工智能相比,統(tǒng)計(jì)學(xué)就太干凈了,統(tǒng)計(jì)學(xué)研究的問題是清楚的,不象人工智能那樣,連問題到底在哪里都不知道。在相當(dāng)長時(shí)間里,統(tǒng)計(jì)學(xué)家和機(jī)器學(xué)習(xí)一直保持著距離。
慢慢地,不少統(tǒng)計(jì)學(xué)家逐漸意識(shí)到,統(tǒng)計(jì)學(xué)本來就該面向應(yīng)用,而機(jī)器學(xué)習(xí)天生就是一個(gè)很好的切入點(diǎn)。因?yàn)闄C(jī)器學(xué)習(xí)雖然用到各種各樣的數(shù)學(xué),但要分析大 量數(shù)據(jù)中蘊(yùn)涵的規(guī)律,統(tǒng)計(jì)學(xué)是必不可少的。統(tǒng)計(jì)學(xué)出身的機(jī)器學(xué)習(xí)研究者,絕大部分是把機(jī)器學(xué)習(xí)當(dāng)作應(yīng)用統(tǒng)計(jì)學(xué)。他們關(guān)注的是如何把統(tǒng)計(jì)學(xué)中的理論和方法變 成可以在計(jì)算機(jī)上有效實(shí)現(xiàn)的算法,至于這樣的算法對人工智能中的什么問題有用,他們并不care。
這群人可能對人工智能毫無興趣,在他們眼中,機(jī)器學(xué)習(xí)就是統(tǒng)計(jì)學(xué)習(xí),是統(tǒng)計(jì)學(xué)比較偏向應(yīng)用的一個(gè)分支,充其量是統(tǒng)計(jì)學(xué)與計(jì)算機(jī)科學(xué)的交叉。這群人對統(tǒng)計(jì)學(xué)習(xí)之外的學(xué)習(xí)手段往往是排斥的,這很自然,基于代數(shù)的、邏輯的、幾何的學(xué)習(xí),很難納入統(tǒng)計(jì)學(xué)的范疇。
兩個(gè)群體的文化和價(jià)值觀完全不同。第一個(gè)群體認(rèn)為好的工作,第二個(gè)群體可能覺得沒有技術(shù)含量,但第一個(gè)群體可能恰恰認(rèn)為,簡單的才好,正因?yàn)楹芎玫?抓住了問題本質(zhì),所以問題變得容易解決。第二個(gè)群體欣賞的工作,第一個(gè)群體可能覺得是故弄玄虛,看不出他想解決什么人工智能問題,根本就不是在搞人工智 能、搞計(jì)算機(jī),但別人本來也沒說自己是在“搞人工智能”、“搞計(jì)算機(jī)”,本來就不是在為人工智能做研究。
兩個(gè)群體各有其存在的意義,應(yīng)該寬容一點(diǎn),不需要去互較什么短長。但是既然頂著Machine Learning這個(gè)帽子的不是“一伙兒”,而是“兩伙兒”,那么要“跟進(jìn)”的新人就要謹(jǐn)慎了,先搞清楚自己更喜歡“哪伙兒”。
引兩位著名學(xué)者的話結(jié)尾,一位是人工智能大獎(jiǎng)得主、一位是統(tǒng)計(jì)學(xué)習(xí)大家,名字我不說了,省得惹麻煩:
“I do not come to AI to do statistics”
“I do not have interest in AI”
閱讀記錄:read twice