【靜.沙龍】推出【主題分享】,圍繞大數據、人工智能、前沿科技與人文等主題進行微信群的在線交流與探討。
【靜.沙龍主題分享】第18期 機器學習需多元探索,中國尚缺原創,引領精神
主講嘉賓:邢波 Eric P. Xing
主持人:中國經濟網經營顧問 楊靜
嘉賓介紹:

【邢波Eric P. Xing】清華大學物理學、生物學本科;美國新澤西州立大學分子生物學與生物化學博士;美國加州大學伯克利分校(UC,Berkeley)計算機科學博士;現任美國卡耐基梅隆大學(CMU)計算機系教授,2014年國際機器學習大會(ICML)主席。美國國防部高級研究計劃局(DARPA)信息科學與技術顧問組成員。(他在中國大數據技術大會上的報告請參考閱讀原文鏈接)
Professor of Carnegie Mellon University Program Chair of ICML2014
Dr. Eric Xing is a Professor of Machine Learning in the Schoolof Computer Science at Carnegie Mellon University. His principal researchinterests lie in the development of machine learning and statisticalmethodology; especially for solving problems involving automated learning,reasoning, and decision-making in high-dimensional, multimodal, and dynamicpossible worlds in social and biological systems. Professor Xing received aPh.D. in Molecular Biology from Rutgers University, and another Ph.D. inComputer Science from UC Berkeley.
【楊靜lillian】這次您受邀來中國參加大數據技術大會,在您看來,中國大數據相關技術和生態發展到了什么水平?與美國的差距主要體現在哪些方面?
【邢波Eric P. Xing】中國的大數據技術與題目跟進國外趨勢還做得不錯。但在原創性部分有欠缺。也許由于工程性,技術性上的原創工作通常不吸引眼球且風險極大這樣的特點,所以沒人愿意啃硬骨頭。整體不算太差,但缺少領軍人物,和領先的理念。還有在導向上,傾向于顯著的效益和快的結果,但對于學術本身的追求不是很強烈。如果效果不是立竿見影,愿意碰的人就少。大部分人都這樣,就是趨向于平庸。整個生態系統上看,中國大數據發展水平與歐洲、日本比并不差,公眾的認知也熱烈。整個環境還蠻好。與中國學生有點像,群體不見得差,但缺少特別杰出的領袖,和有膽識的開拓者。
人工智能的目標沒有上限,不應以人腦為模板
【楊靜lillian】您說過深度學習只是實現人工智能目標的一種手段,那么在您看來,人工智能的目標到底是什么?拋開《奇點臨近》的科學性,您認為機器智能總體超越人類這個目標在2050年前后有可能實現么?或者說在2050年前后,世界的控制權會不會由人工智能主導?
【邢波 Eric P. Xing】人工智能的目標其實是沒有上限的。人工智能的目標并不是達到動物或人類本身的智力水平,而是在可嚴格測量評估的范圍內能否達到我們對于具體功能上的期待。例如用多少機器、多長時間能達成多少具體任務?(這里通常不包含抽象,或非客觀任務,比如情緒,感情等。)人的智力不好評價,尤其標準、功能、結果及其多元,很多不是人工智能追求的目標??苹眉业睦寺孟牒涂茖W家的嚴格工作是有區分的。大部分計算機科學家完成的工作可能不那么讓人驚嘆,但很多任務已經改變世界。例如,飛機自動駕駛裝置可能沒有人的智能,但它完成飛行的任務,卻比人類駕駛員好。
再比如彈鋼琴,機器也可以彈鋼琴,精確程度肯定超過人。但是否有必要發明機器人代替人彈鋼琴來上臺表演,或機器人指揮家甚至機器人樂隊?從這個角度看,我個人沒有動力或必要去發明機器人來彈鋼琴,至少我不認為應該去比較機器和人類鋼琴家。鋼琴大師如霍洛維茨,魯賓斯坦是不能被機器替代的、比較的,雖然他們也彈錯音。一個武術大師,如果現在用槍來和他比武力,把他打死,有意義嗎?那么標準是什么?我認為我們應該去想和做一些更有意義和價值的事情。
關于2050年的未來預測,如果非要比較的話,我認為人工智能不會達到超越人類的水平,科學狂人或科幻家也許喜歡這樣預測未來,博得眼球,但科學家需要腳踏實地做有意義的工作。所謂奇點是根本不可能的。未來學家這樣去臆測也許是他們的工作;政治家、企業家、實踐學家向這個方向去推動則是缺乏理性、責任和常識;而科學家和技術人員去應和,鼓吹這些則是動機可疑了?
人工智能脫離人類掌控?這種可能性不能排除。但要是咬文嚼字的話,如果是計算機的超級進步涌現出智能,以至脫離人類掌控而自行其道,那還何謂“人工”?這就變成“自然智能”。我認為“世界的控制權會不會由人工智能主導”這類題目定義就不嚴肅,無法也無益做科學討論,也不能被科學預見。
【Ning】能否通俗科普一下機器學習的幾個大的技術方向,和它們在實踐中可能的應用。
【邢波 Eric P. Xing】很難科普的講,不使用專業術語。機器學習不過是應用數學方法體系和計算實踐的一個結合,包羅萬象。比如圖模型(深度學習就是其中一種),核(kernel)方法,譜(spectral)方法,貝葉斯方法,非參數方法,優化、稀疏、結構等等。我在CMU的機器學習課和圖模型課對此有系統全面的講解。
機器學習在語音、圖形,機器翻譯、金融,商業,機器人,自動控制方面有廣泛的應用。很多自然科學領域,例如進化分析,用DNA數據找生物的祖先(屬于統計遺傳的問題),需要建模,做一個算法去推導,數學形式和求解過程與機器學習的方法論沒有區別。一個成熟的,優秀的機器學習學者是應被問題、興趣和結果的價值去激勵、推動,而不是畫地為牢,被名詞所約束。我本人在CMU的團隊,就既可以做機器學習核心理論、算法,也做計算機視覺、自然語言處理,社會網絡、計算生物學,遺傳學等等應用,還做操作系統設計,因為底層的基本法則都是相通的。
【李志飛】大數據,深度學習,高性能計算帶來的機器學習紅利是不是差不多到頭了?學術界有什么新的突破性或潛在突破性的新算法或原理可以把機器學習的實際應用性能再次大幅提升?
【邢波 Eric P. Xing】大數據、深度學習、高性能計算只是接觸了機器學習的表層,遠遠不到收獲紅利的時候,還要接著往下做。算法的更新和變化還沒有深挖,很多潛力,空間還很大?,F在還根本沒做出像樣的東西。另外我要強調,機器學習的所謂紅利,遠遠不僅靠“大數據、深度學習、高性能計算”帶來。舉個例子,請對比谷歌和百度的搜索質量(即使都用中文),我想即使百度自己的搜索團隊也清楚要靠什么來追趕谷歌。
【Ning】世界各國在機器學習方面的研究實力如何?從科普的角度來看,人的智能和人工智能是在兩個平行的世界發展么?
【邢波 Eric P. Xing】不太愿意評價同行的水平。人的智能和人工智能可以平行,也可以交互。
【楊靜lillian】您既是計算機專家,還是生物學博士,在您看來,如果以未來世界整體的智能水平作為標準,是基因工程突破的可能性大,還是人工智能領域大,為什么?
【邢波 Eric P. Xing】基因工程其實突破很多。在美國和全球轉基因的食品也有很多。胰島素等藥物也是通過轉基因菌株來生產,而不是化學合成。診斷胎兒遺傳缺陷的主要手段也基于基因工程技術。但是輿論風向在變,也不理性。例如我小時候讀的《小靈通看未來》里,“大瓜子”等神奇食品現在已經通過基因技術實現。從技術上看,我們已經實現了這個需要,但公眾是否接受,是個問題。科學家要對自己的責任有所界定。例如造出原子彈,科學家負責設計制造,但怎么用是社會的事。
人工智能領域也已經有很多應用型的成果,但也還有很大空間。人工智能就是要去達到功能性的目標,有很多事情可以用它去達成,但這里不見得包括感情思考。人的樂趣就是感情和思考,如果讓機器代替人思考,我認為沒有這個需要。
靠基因工程提升人的智能基本不可能,人的成就也未必與基因完全相關,例如馮.諾依曼,很大程度是后天環境教育形成的。基因只是必要條件,而非充分條件。作為一個生物學博士,我反對用基因工程改變人的智能的做法,認為這很邪惡。科學家應該對自然法則或上帝有所敬畏。在西方,優生學是不能提的,因為它違反了人本主義的原則和人文人權的理念。我個人認為這個題目在科學道德上越界了,是不能想象的。
【楊靜lillian】您說過美國的大腦計劃雷聲大雨點小,請問歐盟的大腦工程您怎么看,會對人工智能發展起到促動作用么?或者說,人工智能研究是否應以人的大腦為模型?
【邢波 Eric P. Xing】歐洲大腦工程的爭議很大,包括目標和經費分配。但這個目標也提升了社會和公眾的對于科學的關注,工程的目的不用過于糾結。這個項目就是啟發式的,培養人才,培養科學實力的種子項目。
大腦工程,無論歐洲和美國,對人工智能發展沒有直接的促進作用。以仿生學來解釋人工智能工程上的進步,至少在學術上不是一個精確和可執行的手段,甚至是歧路。只是用于教育公眾,或者通俗解釋比較艱深的科學原則。
人工智能不必也不應以人腦為模型。就像飛機和鳥的問題,兩者原理手段完全不同。人工智能應該有自己的解決辦法,為什么要用人腦的模型來限制學科的發展?其實有無數種路徑來解決問題,為什么只用人腦這一種模板?
機器學習領域應多元探索,巨大潛力與空間待挖掘
【李志飛】更正一下我的問題: 現有的機器學習算法如深度學習在利用大數據和高性能計算所帶來的紅利是不是遇到瓶頸了?(至少我所在的機器翻譯領域是這樣) 接下來會有什么新機器學習算法或原理會把大數據和高性能計算再次充分利用以大幅提升應用的性能?我覺得如果機器學習領域想在應用領域如機器翻譯產生更大的影響,需要有更多人做更多對應用領域的教育和培訓,或者是自己跨界直接把理論研究跟應用實踐結合起來
【邢波 Eric P. Xing】機器學習的算法有幾百種,但是目前在深度學習領域基本沒有被應用。嘗試的空間還很大,而且無需局限在深度學習下。一方面機器學習學者需要跨出自己的圈子去接觸實際,另一方面應用人士也要積極學習,掌握使用發展新理論。
【楊靜lillian】您認為谷歌是全球最具領導性的人工智能公司么?您預測人工智能技術會在哪幾個領域得到最廣泛的應用?人工智能產業會像互聯網領域一樣出現壟斷么?
【邢波 Eric P. Xing】谷歌是最具有領導性的IT公司。世界上沒有人工智能公司,公司不能用技術手段或目標定義名稱和性質。人工智能是一個目標,而不是具體的一些手段。所以有一些界定是不嚴肅的。關于應用領域前面已經談過了。
【楊靜lillian】您曾經比喻,中國的人工智能領域里,有皇帝和大臣,您怎么判斷中國人工智能產業的發展水平和發展方向?最想提出的忠告是什么?
【邢波 Eric P. Xing】中國整個IT領域,以至科學界,應該百花齊放,有的觀點占領了過多的話語權,別的觀點就得不到尊重。目前業界形成一邊倒的局面,媒體的極化現象比較嚴重。建議媒體應該平衡報道。中國目前深度學習話語權比較大,沒人敢批評,或者其他研究領域的空間被壓縮。這種研究空間的壓縮對機器學習整個領域的發展是有害的。學界也存在有人山中裝虎稱王,山外實際是貓的現象。坦率的說,目前中國國內還沒有世界上有卓越影響的重量級人工智能學者,和數據科學學者。中國需要更多說實話,戳皇帝新衣的小孩,而不是吹捧的大臣、百姓和裸奔的皇帝。不要等到潮水退去,才讓大家看到誰在裸奔。
現在一些輿論以深度學習綁架整個機器學習和人工智能。這種對深度學習或以前以后某一種方法的盲目追捧,到處套用,甚至上升到公司、國家戰略,而不是低調認真研究其原理、算法、適用性和其它方法,將很快造成這類方法再次冷卻和空洞化,對這些方法本身有害。行外人物、媒體、走穴者(比如最近在太廟高談闊論之流)對此的忽悠是很不負責的,因為他們到時可以套了錢、名,輕松轉身,而研發人員投入的時間、精力和機會成本他們是不會在乎的。美國NSF、軍方和非企業研究機構與神經計算保持距離是有深刻科學原因的,而國內從民到官這樣的發燒,還什么彎道超車,非常令人懷疑后面的動機和推手。
【楊靜lillian】確實如您所說,現在大多數中國企業或學術機構,被一個大問題困擾。就是缺乏大數據源,或者缺乏大數據分析工具,那么怎樣才能搭上大數據的時代列車呢?
【邢波 Eric P. Xing】首先我沒有那樣說過,我的看法其實相反。即使給那些企業提供了大數據,他們真會玩么?這有點葉公好龍,作為一個嚴肅的研究,應該把工具造出來。得先有好的技術,別人才會把數據提供給你。有時小數據都沒做好,又開始要大數據,沒人會給??梢杂媚M,更可以自己寫爬網器(crawler)自己在網上抓。例如我們的實驗室,學生就可以自己去找數據源。研究者的心態有時不正確,好像社會都需要供給他,自己戴白手套。其實人人都可以搭上“大數據”這個列車,但需要自己去勤奮積極努力。
【楊靜lillian】Petuum開源技術系統會成為一種大數據處理的有效工具么?可以取代Spark?
【邢波 Eric P. Xing】希望如此。更客觀地說,不是取代。是解決不同的問題,有很好的共生、互補關系。
中國學術界的原創性待提高,缺乏燈塔型領軍人物
【劉成林】@楊靜lillian問題提的好!期待詳細報道。另外我加一個問題,請Eric給中國人工智能學術界提點建議,如何選擇研究課題和如何深入下去。
【邢波 Eric P. Xing】希望中國人工智能學術界要對機器學習、統計學習的大局有所掌控,全面判斷和尋找,尚未解決的難題。這需要很多人靜下來,慢下來,多讀,多想。而不是跟風或被熱點裹挾。得有足夠的耐心,屏蔽環境的影響和壓力。在技術上得重視原創性,如果只把學術看成是一個短時期的比賽,價值就不大。得找有相當難度,而自己有獨特資源的方向,就保證了思想的原創性和資源的獨特性。要分析清楚自己的優勢。
例如我們做的Petuum,很多人就不敢碰。我們開始時甚至都不懂操作系統,從頭學;我們放緩了步子,兩年近十人只出兩篇文章。但不嘗試怎么知道?得給自己空間。
【張寶峰】邢老師提到過在機器學習領域,美國可以分成幾個大的分支,比如Jordan
算一個,能否再詳細的闡述還有哪些其他分支和流派?
【邢波 Eric P. Xing】這算八卦。原來有幾個流派,但現在流派的界限已經非常模糊了。
【劉挺-哈工大】您認為哪些方向或組織有希望出現領軍人物?
【邢波 Eric P. Xing】國內的同行思路有些短板,所以研究領域比較割裂。上層不夠高,下層也不夠深,橫向也不寬,因此扎根不夠,影響有限。所以比較缺憾,體現為很多割裂的領域。
在中國的企業界和學術界哪里會出現領軍人物?這個問題我認為:對什么叫“領軍人物”國內的同行的定義還相當膚淺,功利。除了商業上的成功,或者學術上獲獎,這些顯性成就,還需要有另外的維度。例如從另外一個角度,具有個人魅力,他的思想、理論、人格被很多人追隨和推崇的,有眾多門生甚至超越自己的,就沒有。中國的研究者不善于建立自己的體系,去打入一個未知的境界,做一個燈塔型的人物。這種人物在中國特別少,基本上沒有。
在美國M.Jordan就是這樣的人物,就有燈塔型的效應,被眾人或學術界效法,敬佩,和追隨,包括他的反對者。他也不是中國最典型的最年輕教授等成功人物,而是大器晚成,到了45歲才開始發揚光大,上新臺階。但他的做為人的魅力(會五國語言,年輕時彈琴掙錢,平時風趣博學);他的勤奮自律(到Berkeley后正教授了還和我們一起在課堂聽課,從頭學統計,優化,到現在還天天讀文獻);他的工作和生活的平衡(現在自己組樂隊,和孩子玩兒);他的眾多學生的成就(很多方向和他大不相同,甚至相對);他的嚴謹,嚴肅的學風;和他的洞察力。這些都是除了學術成就之外他成為領軍人物的要素。我們國內知識分子接近這個境界的太少了。不要說學術上的差距,就連上餐桌品酒、懂菜,說話寫作遣詞造句的造詣都差不少。所以,先不要急出領軍人物;先從文化上培育土壤,培育認真、一絲不茍的習慣和精神,培育熱愛教學、熱愛學生的責任;培育潔身自好、玉樹臨風的氣質;注重細節、小節、修養,再由小至大、由士及賢、由賢入圣。在這個境界上,學問就變成一種樂趣了,就可以做出彩了。
【張寶峰】歡迎回國,把Pleuum變成實際產業標準。
【邢波 Eric P. Xing】不是沒有可能,但也需要好的平臺和環境、機緣。這次回國參會,很興奮的是,學術界和產業界都對機器學習的技術有很大的熱情,也有信念去獲取成功,相當積極。我個人的觀點,通過交流,收獲很大。期望這種交流繼續,也期待國內的學界、媒體、企業能夠共同促進產業生態的發展,利益多樣化。可以是金錢的成功,也可以是原創性的增長。而不是被某一個目標來一統天下。
如果回國發展,應該有更多商業上的機會。但是國內的起點低,有些規則兩國不一樣?,F在人生的目標不是錢,而是對樂趣的滿足,以及服務社會。實現自我的價值,也讓家人,朋友,學生,師長,同事開心。
下個月還有機會回國,到時也期待與大家繼續交流互動。非常感謝@楊靜lillian 提供這個和大家交流的機會。也欽佩她專業敬業。這次結識很多朋友,后會有期!
【李志飛】以前看您的論文時覺得比較理論化,而從應用研究者的角度很難快速的知道怎么去實用到自己領域中。以后論文是不是都加一個session, 指導性的講講怎么應用到相關領域。當然這是假設該論文有實用價值,有很多機器學習論文都是沒有的
【邢波 Eric P. Xing】我自己的論文,相當一部分是非常適于應用的(比如我們在ACL,EMNLP,ISMB等的獲獎論文,我們在CVPR上的很多工作,和最近我們Petuum的工作。)你要是去看機器學習專業論文,那就應該謙卑的去服從他們的規則。就像我本人看純數學家的論文需要花幾個月去搞懂背景知識;我看生物、語言學文章也需自己從他們模糊的不精確的表述中提煉嚴格的數學形式一樣。我認為這是我作為讀者的責任和樂趣。每一個成熟的研究者和工程師應該有能力從論文中讀出自己能用的東西。
【Ning】很贊Eric 回答問題的思路。他是典型的厚積薄發。@楊靜lillian 沙龍很有范兒! 這些討論很有啟發性。
【靜點評】感謝邢波教授此次回國特地安排時間與群友溝通分享。雖然他平時在群里討論或行文時言辭犀利,但見到他本人時,卻發現他是一個風度翩翩、玉樹臨風、儒雅淵博的“中國式”學者,甚至比許多中國本土學者還有“中國風”——邢教授經常圍著一條有范兒的圍巾,看起來像是從電影里走出來的民國時期名教授。他的許多觀點得到了大家的贊許,例如知識分子要有自己的獨立思考,不宜盲目跟風,或者僅僅追求名利以及短期利益,也應該有長遠眼光和縝密判斷。在美國,科學家并不像中國這樣,是公眾輿論的中心,但也讓他們可以安心學術,少受環境干擾。針對國內一個普遍的問題,如有龐大數據和計算能力支撐的大企業才能玩轉大數據,邢波教授他們研發了開源的Pleuum系統,讓更多開發者有更多機會搭上大數據的列車。
邢波教授感嘆中國業界缺乏燈塔級的領軍人物,但國內學術界和產業界都對機器學習的技術有很大的熱情,獲取成功的動機強烈,也意味著機遇。他在美國機器學習領域已經成為了主流學術的中堅,他的學生們也紛紛在學界業界成為新一代領袖,我們也期待他的研發成果與學術經驗能更給中國業界更多啟迪與反思。相信這類線上線下的交流,能為中國大數據和人工智能業界創造更多雙贏空間。
作者: 楊靜 微信公眾號:楊靜lillian 轉載請注明
閱讀記錄: read once