http://mp.weixin.qq.com/s/DwUEJ64_GbTMLZ-okSKqYw
2016年10月1日, 我很榮幸地作為Thomas S. Huang黃煦濤教授學術大家庭的一員,參加了黃教授八十大壽紀念學術研討會。受研討會組委會的邀請,我作了一個相同主題的報告。現在整理補充以后與有興趣的同仁,尤其是年輕一代, 分享。這個報告的用意是以回顧我自己20多年學術生涯的個人歷程, 以及與黃教授更加悠長,輝煌的學術生涯的相似度, 向前輩大師致以崇高的敬意, 并希望對比我年輕的從事科研的人們有所啟發。
我們今天為什么花功夫做研究呢? 幾百年前牛頓那個時代,科學家鳳毛麟角。 開個玩笑,傳說牛頓一日在一棵蘋果樹下打坐。砰的一聲,一個蘋果砸在牛頓頭上, 他茅塞頓開, 于是有了萬有引力定律。 這樣的好日子已經一去不復返了。
近代也有因為蘋果靈機一動,結果財源滾滾的。 大家都知道吧? 他就是喬布斯。
今天我們做研究的面臨一個什么樣的挑戰呢?地上的果子沒了,唾手可得的矮枝上的果子也給人摘光了。果子倒是還有,但是得費點力氣了。而且特別高的樹枝上, 還有特別甜的果子。
那么我們怎么樣才能摘到研究的碩果呢? 我想是這樣的。 要向前輩,大師們學習。 學習他們的哪些方面呢?我認識黃教授也有二十多年了,幾乎和我自己的學術生涯一樣長。潛移默化, 遠程觀摩, 我自己學到了什么呢? 第一, 要保持學術好奇心。 不要閉關自守, 要與時俱進。 不斷地嘗試新問題, 采納新的理論技術。第二, 要有學術熱誠, 不是三分鐘熱度。 一種熱愛, 一種聚焦, 并長期保持, 才會日積月累, 有所成就。 第三, 要有治學精神, 這樣才不會被各種浮躁, 各種跟風,各種浮夸所左右, 才會保持學術的嚴謹。 最后一點, 學無止境, 活到老, 學到老,才能永葆學術青春。
來看看我的學術歷程吧。 我從本科, 碩士, 到博士論文, 都是做圖像處理Image Processing。 九十年代初, wavelet 當紅, 我的博士論文是做圖像和視頻編碼。當時的standard是JPEG, MPEG。 我的博士論文嘗試用Wavelet變換。 當然也得有自己特色, 比如利用wavelet的joint spatio-frequency表征結合人類視覺系統HVS的特點提高編碼效率和消除解碼后的圖像瑕疵artifact。這篇論文已經有場景分析的雛形。
博士畢業后, 在柯達研究院一干就是15年。那些年都做了什么研究呢? 主要是智能化圖像處理Intelligent Image Processing (智能,呵呵)和計算機視覺Computer Vision。舉幾個例子。 第一, 自動紅眼消除。多少做圖像有關研究的人知道,數字照相機是誰發明的? 柯達Kodak!自動紅眼消除, 誰發明的?Kodak!這可是我親身參加的。 那個年代, 沒有深度學習, 連人臉檢測都沒有, 我們也做出來了。 有興趣的可以去查查Kodak的專利(有很多citations)。 第二, 照片朝向自動檢測。 很多人認為照片天生就是大頭朝上的。真的嗎? 這個問題我也提出了在當時條件下的最合理解法。 其他還有 圖像自動標注。 現在很多年輕人以為圖像自動標注是從ImageNet 開始的, 這是很幼稚的。 地理標記, 我們做的時候還沒有Smart phone呢。 上下文與圖像內容結合來做vision, 也是在Kodak的時候開始倡導的。“野生”視頻中的動作識別和利用網絡數據遷移學習事件識別,是在Kodak的最后幾年做的。現在說這些, 不是王婆賣瓜, 是說幾個意思: 沒有深度學習也可以做vision, 很多東西其實先前就有人研究過了(所以查文獻不能只看這兩年的), 實踐中能夠提煉出很多有價值的研究命題。 這樣的話就不需要老是跟著別人(“大牛”)的屁股后面走,去跟風, 去拼幾個百分點。
2011年加入羅切斯特大學之后, 學術自由度就更大了。 從2013年起, 我的研究小組逐漸擴大, 研究范圍也更加廣泛。 現在有幾個開拓點。 圖像情緒識別 (與Adobe合作), 圖像視頻加標題 (與Adobe, Yahoo合作),醫學圖像視頻分析 (與羅徹斯特大學醫學院多項合作), 基于社交多媒體的計算社會學(與PARC, 紐約州司法部等合作), 大數據圖文分析, 等等。 值得一提的是與Adobe合作的圖像加標題算法曾經一度踞于MSCOCO圖像加標題競賽榜首達連續五個月, 和Yahoo合作的視頻加標題大數據集為世界上公開的最大數據集。 這些工作都受到同行關注。
社交多媒體的研究, 我在羅徹斯特大學這幾年強力推動。個人認為社交多媒體能提取的社會信號最重要的是兩個:用戶特征信息 和 情感信息。在這兩個方面, 我們的工作包括 Twitter 圖像文本集合情感分析和Pinterest 用戶興趣挖掘。
社交多媒體的一個重要的功能是用來把握社會的脈搏。 我們的近期研究涉及美國總統競選狀況分析,青少年酗酒問題, 毒品消費與販賣, 等等。 具體的工作論文里有, 這里就不一一贅述了。 值得引起學術界興趣的是, 大家都在反思, 為什么美國主流媒體, 各種民調都一致認為希拉里會勝選,結果令很多人大跌眼鏡呢? 其實我們根據上千萬希拉里和川普Twitter擁躉的社會結構, 已經看出川普不像輿論導向說的那樣在婦女,高教育,高收入, 及少數族裔中那么不得人心。 這個工作不代表我們的政治立場, 是讓數據說話(Let Data Speak)。 這個工作也不是馬后炮, 我們的一系列工作是在選舉結果出來前就見諸報端的。
我在黃教授的八十大壽研討會上秀了這樣一張照片。 那時我的導師陳長汶比我現在還年輕。 朋友開玩笑說那時的L教授一副躊躇滿志的樣子。 我覺得是初生牛犢不怕虎。
其實我博士畢業的時候一點沒有想到二十年后是這樣的。只是知道這輩子喜歡和圖像數據打交道。我現在仍然在和圖像數據打交道,而且樂此不疲, 而且花樣翻新。 從這個意義上, 我覺得我是在跟隨Tom的腳步,“東施效顰”。我覺得我是在模仿Tom的心境, 永遠年輕。
二十年斗轉星移,二十載躬耕隴畝。 這讓我情不自禁的想起一首歌“ForeverYoung”。 我聽過Rod Stewart中年男的版本, 現在更喜歡一個更年輕的有饒舌的版本,聽起來覺得更年輕。
Forever young,
I want to be forever young.
Do you really want to live forever?
Forever, and ever
Forever young,
I want to be forever young.
Do you really want to research forever?
Forever, and ever
Jay-Z feat. Mr Hudson Forever Young Official Music Video and Lyrics ...
視頻鏈接 https://www.youtube.com/watch?v=m1_EDno-44M
從圖像處理, 到計算機視覺, 到多媒體, 再到社交媒體, 大數據, 啰啰嗦嗦說了自己的學術歷程。我覺得我的個人旅途是效法Tom, Tom則打趣地說我的個人旅途比他的更有趣。 我不敢當, 只能說我enjoyed it 而且enjoying it more。
我的歷程是與“黃家軍“密不可分的。 Tom的學術大樹根深葉茂, 我也有幸成為其中一員。 我很感謝我學術生涯中共事過的人們。這條交錯的學術鏈一直從Tom,長汶,到我,再到我指導過的Tom的學生亮亮、 建朝, 再到亮亮和建朝都指導過的我的學生全增,運成。 Tom的學術家庭早已不再是一棵樹, 而是一個網絡, 一個深度網絡。
做研究的, 心里年輕, 就永遠年輕。讓我們永遠好奇, 永遠熱誠,并把這種精神傳給我們的學生。 這樣的話,年輕代代相傳,代代永駐。讓我們一起來慶祝黃教授非凡的學術生涯, 慶祝黃教授的學術之樹蓬勃向上,永遠常青!
閱讀記錄:read twice