http://blog.sina.cn/dpool/blog/s/blog_4caedc7a0102w57s.html?wm=3049_a111

一個理想的研究人員成長軌跡應(yīng)該是什么樣的?
微軟全球執(zhí)行副總裁沈向洋博士認(rèn)為一個酷酷的研究員應(yīng)該是這樣的:“挑選一個雄心勃勃的目標(biāo),致力于端到端的研究,長久的堅(jiān)持,而他的研究伙伴們也應(yīng)該有著同樣的激情,但最重要的是始終樂在其中。”
如果以這個標(biāo)準(zhǔn)來看,微軟亞洲研究院首席研究員劉鐵巖博士可謂是研究員的范本。2003年,從清華大學(xué)電子工程系博士畢業(yè)之后,劉鐵巖直接進(jìn)入了微軟亞洲研究院,在這一待就是十余年。這十多年間,劉鐵巖博士由原本的多媒體信號處理方向的博士,逐步成長為國際機(jī)器學(xué)習(xí)和信息檢索領(lǐng)域的知名學(xué)者。這些轉(zhuǎn)型在外人看起來十分巨大,但“三清”(本科、碩士和博士都就讀于清華大學(xué))出身的劉鐵巖博士說:“微軟亞洲研究院其實(shí)是我的第二所大學(xué),這是一個培養(yǎng)人的地方,有了她的幫助,這一切其實(shí)過渡地非常自然。”
開放環(huán)境帶來的首次轉(zhuǎn)型
在結(jié)束了九年的清華校園學(xué)習(xí)時,擺在劉鐵巖面前的選擇有很多,例如知名大學(xué)教職等等,而微軟亞洲研究院吸引劉鐵巖的除了全球領(lǐng)先的研究環(huán)境之外,更重要的是可以和自己敬仰已久的頂尖行業(yè)大牛一起工作,對于一個剛開始入行的年輕研究員來說無疑動力巨大。因此,劉鐵巖于2003年正式加入了微軟亞洲研究院,并由原來的多媒體信號處理方向的研究轉(zhuǎn)入了互聯(lián)網(wǎng)搜索與挖掘領(lǐng)域,從此開始了對信息檢索這一全新領(lǐng)域的探索。
這是劉鐵巖在研究院的第一次轉(zhuǎn)型,但這次轉(zhuǎn)型并不像人們想象的那么艱難,因?yàn)槲④泚喼扪芯吭簽檠芯咳藛T提供了一個十分開放的科研環(huán)境,讓研究員們有充分的自由和資源來調(diào)整自己的研究興趣。在這里劉鐵巖和很多不同研究方向的資深研究員們進(jìn)行了交流,其中包括他后來的老板,現(xiàn)在的微軟亞洲研究院常務(wù)副院長馬維英博士。同時,借助研究院這個平臺劉鐵巖還與眾多國際知名學(xué)者進(jìn)行了深入交流,進(jìn)一步拓寬了其科研視野,劉鐵巖博士首次轉(zhuǎn)型的領(lǐng)路人便是卡內(nèi)基梅隆大學(xué)的文本分類領(lǐng)域的資深專家楊頤明授。2004年暑假,正處于轉(zhuǎn)型期的劉鐵巖博士遇見了前來微軟亞洲研究院交流的楊教授,便一拍即合地展開了合作。他們當(dāng)時共同搭建了當(dāng)時世界上最大的、近三十萬類的文本分類系統(tǒng),相關(guān)論文收到了廣泛關(guān)注,短短幾年間就被引用了數(shù)百次。這次和楊教授的合作也成了劉鐵巖進(jìn)入到文本信息處理領(lǐng)域的第一個敲門磚。從那個時候起,劉鐵巖開始了解什么是信息檢索,什么是文本分類系統(tǒng),他的首次轉(zhuǎn)型也逐步成型。
挑選一個雄心勃勃的目標(biāo):排序?qū)W習(xí)
第一次轉(zhuǎn)型之后,劉鐵巖作為信息檢索領(lǐng)域的新人,始終保持著旺盛的好奇心,不斷思考著能為這個領(lǐng)域帶來哪些新東西。當(dāng)時圍繞搜索引擎所開展的研究十分火熱,信息檢索更是人們關(guān)注的重中之重。通過大量的文獻(xiàn)研究,劉鐵巖發(fā)現(xiàn)這個方向大多數(shù)的研究者都是數(shù)字圖書館專業(yè)背景,因此研究方法都偏向經(jīng)驗(yàn)化,缺少了對于優(yōu)化系統(tǒng)方式和目標(biāo)的科學(xué)思考。
基于對行業(yè)的洞察,劉鐵巖開始深入學(xué)習(xí)機(jī)器學(xué)習(xí)的相關(guān)知識,并試圖把機(jī)器學(xué)習(xí)的思想引入信息檢索領(lǐng)域。由此,劉鐵巖博士在學(xué)術(shù)界的第一個成名工作——排序?qū)W習(xí)(learning to rank)就這樣誕生了,該方法為信息檢索領(lǐng)域帶來了重大變革。
隨后,劉鐵巖的研究便圍繞排序?qū)W習(xí)展開。在2007到2008年,劉鐵巖和他的團(tuán)隊(duì)在SIGIR、WWW、ICML等頂級學(xué)術(shù)會議上發(fā)表了大量的關(guān)于排序?qū)W習(xí)的論文,還在主流會議上做主題講座、主持專題研討會。他的表現(xiàn)受到了學(xué)術(shù)界越來越多的關(guān)注,更多的研究人員跟隨他進(jìn)入到這個領(lǐng)域中來,短短的幾年時間劉鐵巖及其團(tuán)隊(duì)的研究實(shí)力便在全世界的信息檢索領(lǐng)域內(nèi)遙遙領(lǐng)先。而劉鐵巖博士出的第一本學(xué)術(shù)專著也與排序?qū)W習(xí)相關(guān)。該專著已被多所大學(xué)作為教科書、并被其他學(xué)者引用了近千次。
致力于端到端的系統(tǒng)性研究 在2008年到2009年左右,排序?qū)W習(xí)領(lǐng)域盡管很繁榮,但是多數(shù)人仍把排序?qū)W習(xí)作為應(yīng)用級的研究。在機(jī)器學(xué)習(xí)領(lǐng)域的主流學(xué)術(shù)會議中,排序?qū)W習(xí)通常也會被分到應(yīng)用領(lǐng)域(application track)。
劉鐵巖很快就發(fā)現(xiàn)了這其中的原因:一個研究領(lǐng)域如果缺少科研理論的話,是無法被廣泛認(rèn)可的。因此在后來的幾年時間里,劉鐵巖和他的研究團(tuán)隊(duì)花費(fèi)了大量時間從理論的角度把排序?qū)W習(xí)領(lǐng)域正式化,去闡述這個領(lǐng)域是什么、目標(biāo)是什么、各種算法的關(guān)系是什么、有什么樣的理論性質(zhì)等等。他們在ICML、NIPS、COLT等頂級機(jī)器學(xué)習(xí)會議上發(fā)表了大量排序?qū)W習(xí)的理論文章,即使到今天這些論文的影響力也十分深刻。在這整個的研究周期內(nèi),劉鐵巖及其團(tuán)隊(duì)把排序?qū)W習(xí)打造成一個完整的研究領(lǐng)域,并通過從算法到理論的一系列研究成果,讓這個領(lǐng)域真正的火了起來,劉鐵巖也成了這一研究領(lǐng)域當(dāng)之無愧的代表人物。
這就是微軟亞洲研究院里一個典型的研究案例。劉鐵巖在微軟內(nèi)部的導(dǎo)師Rakesh Agrawal院士曾告訴他:“對于研究人員來說,并不是為了發(fā)表論文而發(fā)論文,而是要在特定的歷史階段,針對一個重要的問題,從表面到核心全部做到位。”一直到今天,排序?qū)W習(xí)一直都是很多會議的主要方向之一,仍然有很多學(xué)者在進(jìn)行研究。正是因?yàn)檫@些工作,劉鐵巖博士完成了他的第二次轉(zhuǎn)型——由信息檢索轉(zhuǎn)變到了機(jī)器學(xué)習(xí)。
第三次轉(zhuǎn)型:博弈機(jī)器學(xué)習(xí)
在微軟亞洲研究院,研究員的研究成果除了作為論文發(fā)表出來之外,還會應(yīng)用到微軟的各個產(chǎn)品中。通過與產(chǎn)品部門合作,研究員們可以發(fā)現(xiàn)實(shí)際應(yīng)用中的新問題。劉鐵巖團(tuán)隊(duì)與微軟的在線廣告部門的合作就是其中一個非常有代表性的實(shí)例。
這項(xiàng)合作始于排序?qū)W習(xí),劉鐵巖和團(tuán)隊(duì)成員幫微軟廣告部門離線訓(xùn)練了一個效果極佳的機(jī)器學(xué)習(xí)模型用于必應(yīng)廣告搜索中的競價排名。上線之初模型立刻帶來了很大的效益,但隨著時間的推移,廣告效益卻大打折扣。劉鐵巖和他的團(tuán)隊(duì)發(fā)現(xiàn)了這個問題,并找到了奇怪現(xiàn)象的根源:廣告競價排名過程常常涉及到人(廣告主)的因素,廣告主會因?yàn)樗惴ǖ母淖儙淼膬r格變化,敏銳地調(diào)整自己的廣告投放策略,這是一個動態(tài)過程。如果不考慮經(jīng)濟(jì)規(guī)律和人的動態(tài)策略,離線地進(jìn)行機(jī)器學(xué)習(xí)模型的訓(xùn)練,結(jié)果自然會產(chǎn)生很大的偏差。
如果想把廣告競價這個動態(tài)問題解釋清楚,僅有機(jī)器學(xué)習(xí)的知識背景顯然是不夠的。所以劉鐵巖便帶領(lǐng)其團(tuán)隊(duì)開始學(xué)習(xí)博弈論,計(jì)算經(jīng)濟(jì)學(xué)等等,組名也改成了“互聯(lián)網(wǎng)經(jīng)濟(jì)研究組”,這便是他第三次轉(zhuǎn)型的開始。在這個轉(zhuǎn)型過程中,他發(fā)明了一種全新的技術(shù),稱為“博弈機(jī)器學(xué)習(xí)”,把博弈論的思想引入到機(jī)器學(xué)習(xí)的過程中,來對人的動態(tài)策略進(jìn)行建模,從而解決上文提到的難題。
如果你了解博弈論和機(jī)器學(xué)習(xí)分別是什么的話,就會發(fā)現(xiàn)這兩個領(lǐng)域差別巨大,完全是不同的體系,那么這次轉(zhuǎn)型的難度也可想而知。劉鐵巖博士說:“對于任何一位研究人員,如果不是在微軟亞洲研究院的話,這種轉(zhuǎn)型都是非常困難的。因?yàn)椋绻汩_始學(xué)習(xí)新東西,想要有這個領(lǐng)域的人認(rèn)識、認(rèn)可你,并產(chǎn)生頂級的影響力是十分艱難的。但當(dāng)我們真正去做的時候,發(fā)現(xiàn)微軟亞洲研究院給了我們很多幫助,這讓我們對新領(lǐng)域的研究變得輕松不少。”當(dāng)劉鐵巖和他們組的研究員們開始涉足互聯(lián)網(wǎng)經(jīng)濟(jì)領(lǐng)域時,不僅有來自微軟其他研究院在博弈論領(lǐng)域頗有建樹的同事(如Noam Nisan)的幫助、也有很多來自學(xué)界的博弈論專家(如鄧小鐵教授、葉蔭宇教授等)拋出了橄欖枝。他們互相訪問,一起參加各種學(xué)術(shù)活動,互相交流,在很短的時間內(nèi),劉鐵巖他們就對博弈論這一研究方向有了很多深刻的認(rèn)識:不僅在算法博弈論領(lǐng)域的頂級會議上發(fā)表了多篇論文,還在互聯(lián)網(wǎng)經(jīng)濟(jì)研究組成立不到兩年的時間里,以程序委員會主席的身份把全世界第二的算法博弈論會議——互聯(lián)網(wǎng)經(jīng)濟(jì)大會(WINE)帶到中國。
黃金三鏢客:電子,數(shù)學(xué)和計(jì)算機(jī)  微軟亞洲研究院 人工智能組三次轉(zhuǎn)型,成就了劉鐵巖博士一路創(chuàng)新不斷的探索和發(fā)現(xiàn),然而這背后也離不開其整個研究團(tuán)隊(duì)的支持與努力。現(xiàn)在,劉鐵巖博士帶領(lǐng)的團(tuán)隊(duì)更名為“人工智能組”,繼續(xù)在當(dāng)下火熱的機(jī)器學(xué)習(xí)和人工智能領(lǐng)域進(jìn)行深耕。不久前,微軟亞洲研究院對外開源的DMTK(分布式機(jī)器學(xué)習(xí)工具包)便是這個小組的研究成果。
如果給這個研究組尋找一個關(guān)鍵詞的話,那一定是“求知欲”。從劉鐵巖的三次轉(zhuǎn)型中也不難發(fā)現(xiàn),現(xiàn)名為人工智能組的研究員們絕非循規(guī)蹈矩之人,他們有著強(qiáng)烈的求知欲,就像初生牛犢不怕虎一樣,知難而進(jìn),什么不會學(xué)什么,什么難做什么,朝氣十足。
而另一方面,該團(tuán)隊(duì)的組合十分有趣,就像微軟亞洲研究院的一個小小縮影一樣。研究員們的專業(yè)覆蓋面既不是全部精鉆于機(jī)器學(xué)習(xí),也不是全部埋頭在博弈論上。目前,人工智能組有三分之一的研究員出自數(shù)學(xué)系,專業(yè)包括計(jì)算數(shù)學(xué)、概率論和組合數(shù)學(xué),這涵蓋了該團(tuán)隊(duì)所需要的所有數(shù)學(xué)基礎(chǔ)。另外三分之一的研究員,包括劉鐵巖在內(nèi)都是來自電子工程專業(yè),劉鐵巖博士認(rèn)為,電子工程專業(yè)出身的人有一個很大的優(yōu)點(diǎn)便是有著非常好的直覺,并且不局限自己的思路,十分開放。而其余三分之一的研究員則是計(jì)算機(jī)專業(yè)出身,他們都擁有很強(qiáng)的計(jì)算機(jī)技能。當(dāng)數(shù)學(xué)、電子和計(jì)算機(jī)三撥精英碰撞在一起的時候,就沒有什么研究方向能難得住他們了。
此外,人工智能組還是一個十分重視學(xué)術(shù)和工程實(shí)踐相結(jié)合的團(tuán)隊(duì)。他們的很多啟發(fā)與靈感都來自于與微軟產(chǎn)品部門的合作,因此,這是一個不斷提出新問題的團(tuán)隊(duì)。在人工智能組發(fā)表的論文中你可以看到一個很明顯的特點(diǎn):團(tuán)隊(duì)很少循規(guī)蹈矩地解決別人提出的問題,而是經(jīng)常提出新的問題,并給出一個力所能及范圍內(nèi)的最優(yōu)解。這樣的論文常常有很高的引用數(shù),平均下來,劉鐵巖和他的團(tuán)隊(duì)發(fā)表的論文幾乎每篇都有上百次的引用。
三次轉(zhuǎn)型帶來了如今人工智能研究組的團(tuán)隊(duì)凝聚力。一加一大于二,小組的很多論文都有至少一個電子,一個計(jì)算機(jī)和一個數(shù)學(xué)背景的研究員參與,這樣的論文都非常有特點(diǎn),也能滿足各種要求,無論是定力證明、直覺、還是實(shí)現(xiàn)的精巧,都可圈可點(diǎn)。
“爭吵文化”與“真理不辨不明” 劉鐵巖博士帶領(lǐng)的人工智能組還有一個十分有趣的“爭吵文化”。在接受采訪時,筆者對劉鐵巖博士嘴里說出的“爭吵文化”感到十分難以置信。坐在對面的劉鐵巖博士穿著經(jīng)典款的男士襯衫,外套一件淡灰色的羊毛開衫,學(xué)院氣息濃厚,讓人似乎很難將他與“爭吵”聯(lián)系在一起。
“我們團(tuán)隊(duì)幾乎會天天爭吵。”劉鐵巖博士笑言。但這其實(shí)是研究組最有活力的狀態(tài),開會的時候,大家不會在乎職位高低,就一個問題會針鋒相對地表達(dá)自己的觀點(diǎn)。人工智能組全組上下都堅(jiān)持的一個信條是“真理不辨不明”。在劉鐵巖的帶領(lǐng)下,整個組會相互批判的看問題,就連待久一點(diǎn)的實(shí)習(xí)生也會自然的融入其中,和他的導(dǎo)師間也是一種互相辯論,互相學(xué)習(xí)的關(guān)系。
因此,對于實(shí)習(xí)生來說,進(jìn)入微軟亞洲研究院會帶來巨大的成長。首先是知識的積累,很多實(shí)習(xí)生在進(jìn)研究院之初知識非常有限。但微軟亞洲研究院計(jì)算機(jī)專家資源密集,超過兩百名的計(jì)算機(jī)專家們的研究經(jīng)歷、方向和視角各不相同,向他們學(xué)習(xí)一定會有所收獲。其次,實(shí)習(xí)生們在這里學(xué)會的更多是研究經(jīng)驗(yàn)和研究方法,“爭吵文化”在這里便得到了很好的體現(xiàn)。無論是什么大牛發(fā)了什么論文,都應(yīng)該抱有一種“破壞性”的思想,先客觀地分析,從中立甚至批判的視角來研究。因此,人工智能組培養(yǎng)出的實(shí)習(xí)生也都個性十足,頗有“小牛”風(fēng)范,從不盲目崇拜。
在微軟亞洲研究院大學(xué):成長于中國,卻能影響世界 作為三清畢業(yè)的博士、微軟亞洲研究院首席研究員,劉鐵巖博士的研究之路始終都未離開中國本土。而作為國際機(jī)器學(xué)習(xí)和信息檢索領(lǐng)域的知名學(xué)者,他的國際影響力也毋庸置疑。劉鐵巖的論文多次獲得最佳論文獎、最高引用論文獎;他擔(dān)任了SIGIR、WWW、NIPS、AAAI等眾多頂級學(xué)術(shù)會議的程序委員會主席或領(lǐng)域主席,ACM信息系統(tǒng)會刊(TOIS)、ACM萬維網(wǎng)會刊(TWEB)等主流學(xué)術(shù)期刊的副主編;他和他的研究成果也被美國國家公共電臺、中國中央電視臺、MIT技術(shù)評論等國內(nèi)外知名媒體所報(bào)道。此外,他還受邀在包括卡內(nèi)基梅隆大學(xué)(CMU)、諾丁漢大學(xué)在內(nèi)的國內(nèi)外知名高校擔(dān)任客座教授、博士生導(dǎo)師。對于所獲得的諸多成就,劉鐵巖無不感動地說:“最重要的原因其實(shí)是我來自微軟亞洲研究院,如果我博士畢業(yè)沒有來到研究院,我都不敢想象會有今天的影響力。”
微軟亞洲研究院從1998年11月成立的第一天開始,就在國際學(xué)術(shù)界扮演著舉足輕重的作用。這么多年來,研究院以一貫開放的心態(tài),與學(xué)術(shù)界展開積極的合作,而研究院開放的學(xué)術(shù)環(huán)境也為研究人員們構(gòu)建了一座與學(xué)術(shù)界的橋梁,兩者相輔相成。甚至有國外學(xué)者戲稱微軟亞洲研究院是一個讓人“又愛又恨”的機(jī)構(gòu)。愛在它的研究成果,為學(xué)術(shù)界帶來了諸多創(chuàng)新,也“恨”在其彪悍的實(shí)力,讓別人望塵莫及。
除了學(xué)術(shù)合作,微軟亞洲研究院為研究員們還提供了接觸用戶,服務(wù)用戶的可能。微軟亞洲研究院的研究員也和微軟的產(chǎn)品部分積極展開合作。劉鐵巖博士帶領(lǐng)的人工智能組的技術(shù)轉(zhuǎn)化也體現(xiàn)在微軟必應(yīng)搜索的搜索結(jié)果排序和廣告排序,小冰的自動問答技術(shù)等微軟的產(chǎn)品和服務(wù)中。
劉鐵巖博士謙虛的表示,“能成為包括CMU在內(nèi)的眾多知名高校的客座教授,很大程度源于學(xué)術(shù)界對微軟亞洲研究院的信任。甚至人工智能組的實(shí)習(xí)生,也成為了CMU的offer收割機(jī),這都得益于我們開放的科研環(huán)境和緊密的學(xué)術(shù)交流。因?yàn)槲④泚喼扪芯吭海覀兊难芯勘桓嗳岁P(guān)注,我們的新人也被更多人認(rèn)可,這就形成了一個良性循環(huán)。類似于國外的師承關(guān)系,從這個角度來看,微軟亞洲研究院著實(shí)就像是一所大學(xué)了。”
閱讀記錄:read twice