http://mp.weixin.qq.com/s/qCsa7k9ksS6B2GeArOS7TA

2016-12-18 吳郢 視覺求索 視覺求索

這紛紛擾擾的世界里有一類人,不用媒體加油添醋的鼓吹,也不用自己夸大其詞的炫耀。他們看似像平凡人一樣,但是他們深邃閃耀的思想,卓越不凡的成就,和堅韌不拔的精神,卻格外讓人敬仰。很多有志青年拿他們當人生的楷模,可是能得其一二者,都已然是鳳毛麟角了。他們從來不用居高臨下地說教,盛氣凌人般以勢壓人,始終是平和如一。他們自己平時的一言一行,足以讓后輩們汗顏和羞愧。Tom,就是這類真學者的一個典型。

Tom就是Thomas S.Huang教授,大家都親切地稱他Tom。在他50多年活躍常青的學術人生中,輾轉于MIT,Purdue,和UIUC,始終領跑在圖像處理,計算機視覺,模式識別,人機交互的最前沿,源源不斷地有新穎的東西,著實讓人景仰和贊嘆不已。每年的學術會議,當我們的注意力總是很容易被諸如風景,行情和八卦等等所轉移時,我們卻總發現一個滿頭銀絲的資深學者,還在認認真真地聽報告。這樣的Tom只會讓我們無地自容。20年以前Tom收我為徒,引領我走進學術研究的世界。經歷著混沌,懵懂,自大,迷茫,糾結,開悟等等眾法諸象促使我企圖去觀察,體會,和理解Tom這樣的老一代卓越學者的學術人生。

為學日益很多學者學人學生,每天要學習“新”的東西。這當然無可厚非,但是對“日新”的理解,卻慢慢變成了只是對熱點的追逐。所以,知道的名詞是越來越多了,可是對科研的熱情卻是越來越低了,心氣也越磨越消沉了。這樣,就被這紛紛擾擾的世界所誘惑,放棄自己最開始的學術理想和追求。結果像這樣“日益”般地為學,基本上是難以為繼的。所以,那些真正能十年磨一劍的人,少之又少。Tom的研究領域眾多,并且都在最前沿,難道他不是在日益地為學?為何他可以有耀眼常青半個多世紀的學術生涯?

從我的視角看他,他的學術人生是一個澹泊的致遠的求道人生。

學術本質上追求的是什么?絕對不是論文的數量,也不是學術上的地位,更不是商業化,這都不是學術的objective function。說某某人著作等身,說某某人泰山北斗,說某某人業界領袖,對一個真正的學者來說,這都沒啥意義。學術追求的是求真的追求,是去問問題,是去找你believe的正解。這個真,其實就是“道”,是govern萬事萬物的東西。大道從來都是至簡的。從牛頓力學,到麥克斯韋方程,到質能方程,都簡潔優美地讓人窒息。花里胡哨的東西,鮮能流傳久遠。正所謂為道日損。如果想求得這個道,就要每天都扔掉一些東西,一些不必要的東西。當這些都扔下了,就近于得道了。在我看來,Tom早已經得到這個道了。

我一直感嘆Tom生活的簡單。比如連手機,他也是近幾年才開始用的。要不是為了和師母聯系方便,我估計他會一直不用手機的。他說他是個old-fashion的人。這看似不過是他自嘲的話,但是一如他說話之精簡,這句話背后的滋味,如果不認真去體會,一定品不出其中深意。想想,如今沒有手機的日子,可能只有超級充實的人,才能選擇去過。沒有手機的日子,也只有他這樣為道日損的人,才能選擇去過。不光生活如此,在他的精神世界,他日損的是名利心,完全對名利是不在意的。這也就是他學界業界這么多朋友學生為之贊嘆不已的一種境界。

名利心是真正為學的大敵,也當然是為道的大敵。Scholarship的本質是對真”的不二的態度,這也是Tom說他自己old-fashion的另一個重要的意思。現在的new-fashion已經不是求“真”了,而是求“新”,求“異”,求“名”了。所以,大家爭先恐后發表一些half-baked的東西,短平快的東西,哪怕一丁點小得不能再小的incremental work也拼命要搶先發表,這才有arXiv這樣的東西出現的基礎。干脆,要不以后大家都學費爾瑪好了,先把碑立上,讓后世花300年去證真偽。所以,能在我們這樣的現實世界里,堅守old-fashion的,難道不值得我們salute嗎?

Tom的科研,半個世紀以來一直引領著好幾個領域的前沿,可是他從來沒有去爭啥啥啥是自己的發現。一個例子是他在Structure from Motion里的貢獻。Tom和他的學生R. Y.Tsai早在1981年給出了三維運動和結構的關系和剛體運動估計的唯一解的條件,這是當代三維重建和Structure from Motion的奠基性的工作。這比Longuet-Higgins在1981在Nature上的工作不會晚。Tom和Faugeras在1989年關于Essential Matrix的工作也是立體視覺的里程碑。可是他從來不去爭這些虛名。

另一個例子是他在人機交互的研究。早在從80年代末開始,他就開始了人臉的非剛性運動分析,人的表情撲捉和識別,voice-driven talking head,還有手指頭的articulated運動分析和gesture recognition的研究。那時,他就開始結合虛擬現實和基于視頻的人體的運動撲捉識別。這樣的非剛性運動分析的研究,不僅對計算機視覺,而且對計算機圖形學,都引發了巨大的變革性的進步。

還有一個例子是他在content-based image retrieval的最先驅的貢獻。早在90年代,還沒有google的時代,Tom就開始了圖像和多媒體搜索的研究。他那時將relevance feedback引入圖像搜索,開創了全新的用learning和active learning的方式來研究圖像的相似性。這些都是后世image retrieval和image search的基礎。   

在我看來,他的澹泊明志才能讓他在求道的路上致遠。師母曾經說過,他們年輕的時候,那時在MIT,生活也如一般年輕人一樣拮據。這半個世紀以來,AI幾起幾落。Tom這樣優秀的人,也多次面臨業界的高薪誘惑。可是,他選擇了澹泊,選擇了求道,選擇了寧靜致遠地求道。求道的路上有師母相伴,人生何其幸也。記得CVPR‘05在San Diego,一天會議下來,傍晚Tom和師母手挽手,光著腳,在海灘邊散步。此情此景,惹得大家紛紛羨慕的目光。 

在像Tom這樣的人看來,科研有如一種信仰,一種求索,一種信仰。只能心無旁騖,澹泊寧靜,才能不被這紛擾的世界擾亂,才能到達遙遠的彼岸。這印證了李白的詩句:兩岸猿聲啼不住,輕舟已過萬重山。

我寫到這里,突然記得金庸在《神雕俠侶》里有一段話是關于“第三次華山論劍”的,寫得有點意思。 “... 第一次華山論劍,郭靖尚未出世,那時東邪、西毒、南帝、北丐、中神通五人,為爭一部《九陰真經》,約定在華山絕頂比武較量,藝高者得,結果中神通王重陽獨冠群雄,贏得了‘武功天下第一’的尊號。二十五年后,王重陽逝世,黃藥師第二次華山論劍,除東邪、西毒、南帝、北丐四人外,又有周伯通、裘千仞、郭靖三人參與。各人修為精湛,各有所長,但真要說到‘天下第一’四字,實所難言,單以武功而論,似乎倒以發了瘋的歐陽鋒最強。想不到事隔數十年,居然又有一群武林好手,相約作第三次華山論劍。這一招使黃藥師等盡皆愕然。更奇的是,眼前這數十人并無一個認得。難道當真‘長江后浪推前浪,一輩新人勝舊人’?難道自己這一干人都做了井底之蛙,竟不知天外有天,人上有人? ...” 
閱讀記錄:read twice