O(1) 的小樂

Job Hunting

公告

記錄我的生活和工作。。。

<

2025年11月

>

日

一

二

三

四

五

六

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

1

2

3

4

5

6

統(tǒng)計(jì)

隨筆 - 182
文章 - 1
評(píng)論 - 41
引用 - 0

留言簿(10)

隨筆分類(70)

隨筆檔案(182)

文章檔案(1)

2011年1月 (1)

如影隨形

小樂 CppBlog
小樂 CSDN
小樂 Github
小樂博客園
小樂豆瓣

搜索

閱讀排行榜

評(píng)論排行榜

Learning和Vision中的小進(jìn)展和大進(jìn)展(轉(zhuǎn))

首先祝朋友們中秋節(jié)快樂！

因?yàn)檫^(guò)去三個(gè)月的實(shí)習(xí)工作很繁忙，這么已經(jīng)很長(zhǎng)時(shí)間沒有更新了。這個(gè)夏天參加了兩次會(huì)議(CVPR和ECCV)，在微軟完成了一個(gè)新的project，這些經(jīng)歷都給了我新的啟發(fā)。

不積跬步無(wú)以至千里

很多在這個(gè)領(lǐng)域做research的朋友抱怨，這個(gè)領(lǐng)域在過(guò)去相當(dāng)長(zhǎng)的時(shí)間沒有“突破性”的進(jìn)展了。在過(guò)去，我也一直抱有這樣的看法。不過(guò)，如果比較最近兩年的paper，以及20年前的paper，其實(shí)，還是可以看到，在很多具體的方向上，我們都已經(jīng)取得了長(zhǎng)足的進(jìn)展。很多在當(dāng)年只是處于雛型階段的算法和模型，經(jīng)過(guò)整個(gè)community這么多年的努力，現(xiàn)在的性能已經(jīng)接近或者到達(dá)實(shí)用的水平。

雖然，在每年的各大會(huì)議中，非常激動(dòng)人心的paper很少，可是，如果我們把某個(gè)方向過(guò)去10年的文章串在一起，我們會(huì)發(fā)現(xiàn)，這個(gè)方向的前沿已經(jīng)推進(jìn)了不少。這個(gè)過(guò)程有點(diǎn)類似于進(jìn)化。在每年發(fā)表的成百上千的paper中，真正有價(jià)值的貢獻(xiàn)只占很小的比例。但是這小部分的貢獻(xiàn)能經(jīng)歷時(shí)間的考驗(yàn)，被積淀下來(lái)，并且被逐步被廣泛地接受。當(dāng)這樣的進(jìn)展積累到一定程度，整個(gè)方向就已是今非昔比。

在這個(gè)過(guò)程中，不同類型的paper其實(shí)發(fā)揮著不同的作用。舉一個(gè)簡(jiǎn)單的例子，在很多問(wèn)題的傳統(tǒng)模型中，因?yàn)榻：陀?jì)算的方便，都喜歡使用L2 norm來(lái)測(cè)量與觀察數(shù)據(jù)的匹配程度。而近年來(lái)，越來(lái)越多的模型開始改用L1 norm來(lái)取代L2 norm，并且在性能上獲得很大的提高。這樣的變化起碼經(jīng)歷了10年時(shí)間才逐步受到廣泛的注意。在較為早期的工作里，部分的researcher在實(shí)踐中發(fā)現(xiàn)似乎用L1 norm性能更好，但是大家并不是一開始就深入了解這背后的原理的。于是，這樣的觀察也許只散見于不同paper的experiment section或者implementation details里面。隨著這種觀察被反復(fù)驗(yàn)證，就會(huì)有人進(jìn)行系統(tǒng)性的實(shí)驗(yàn)比較，使得這些觀察形成更為可靠的結(jié)論。另一方面，理論分析也隨之展開，希望能從更深的層次上來(lái)剖析其背后的原理，甚至建立嚴(yán)格的數(shù)學(xué)模型——于是一個(gè)本來(lái)只是實(shí)驗(yàn)中的heuristic的方法終于具有了穩(wěn)固的理論根基。這些理論將啟發(fā)人們提出新的方法和模型。

也許在很多人看來(lái)，從L2 norm到L1 norm的變化，只是一字之差，不值一提。但是，這種變化對(duì)于全領(lǐng)域的影響非常深遠(yuǎn)，不僅僅在很多具體的topic上帶來(lái)性能提高，而且引導(dǎo)了學(xué)科的發(fā)展趨勢(shì)——robust fitting, sparse coding / compressed sensing受到熱情關(guān)注，和這種變化是密切相關(guān)的。

我在和一些同學(xué)交流的時(shí)候，發(fā)現(xiàn)有些人特別熱衷于解決“根本問(wèn)題”。壯志固然可嘉，但是，我始終認(rèn)為，根本問(wèn)題的解決離不開在具體問(wèn)題上的積累和深刻理解。這種積累，既包括理論的，也包括實(shí)驗(yàn)的。至少，對(duì)于像我這樣的普通人，我覺得，獲得這種積累的唯一途徑就是大量的實(shí)踐，包括閱讀paper，建立數(shù)學(xué)模型，推導(dǎo)求解算法，自己親手把程序?qū)懗鰜?lái)，在實(shí)際數(shù)據(jù)中運(yùn)行并觀察結(jié)果。新的idea是思考出來(lái)的，但是，這種思考是需要建立在對(duì)問(wèn)題的深刻理解上的。從石頭縫里蹦出有價(jià)值的idea的概率，和彩票中獎(jiǎng)沒有什么區(qū)別。

什么是有價(jià)值的？

每個(gè)人對(duì)于一個(gè)工作的價(jià)值會(huì)有不同的判斷。我在這里只是想說(shuō)說(shuō)我個(gè)人的看法。Research 和 Engineer 不太一樣的地方在于，后者強(qiáng)調(diào)work，而且傾向于使用已經(jīng)proven的方法；而前者更強(qiáng)調(diào)novelty——?jiǎng)?chuàng)新是Research的生命。

一直以來(lái)，一些paper有這樣的傾向，為了顯示這個(gè)工作的“技術(shù)含量”，會(huì)在上面列出大段的數(shù)學(xué)推導(dǎo)，或者復(fù)雜的模型圖。很多的推導(dǎo)只是把一些眾所周知的線性代數(shù)結(jié)論重新推一遍，或者重新推一下kernel trick，又或者optimization里面的primal dual的變換。可是這些東西再多，在有經(jīng)驗(yàn)的reviewer看來(lái)，只是在做標(biāo)準(zhǔn)作業(yè)，對(duì)于novelty加分為零。

真正的創(chuàng)新，在于你提出了別人沒有提出過(guò)的東西。創(chuàng)新的內(nèi)涵可以是多方面的：

建立了新的數(shù)學(xué)模型，或者提出了新的解法
提出的新的應(yīng)用
提出新的框架，用新的方式來(lái)整合原有的方法
在比較性實(shí)驗(yàn)中獲得新的觀察
統(tǒng)一本來(lái)分開的領(lǐng)域，模型，或者方法

創(chuàng)新可以體現(xiàn)在從理論，建模，求解和實(shí)驗(yàn)的各個(gè)環(huán)節(jié)之中。判斷創(chuàng)新與否的關(guān)鍵不在于有多高深的數(shù)學(xué)，不在于使用了多時(shí)髦的方法，不在于做一個(gè)多熱門的topic，而在于是否make a difference。

另外，我覺得，創(chuàng)新的大小不能絕對(duì)而論。有一些在實(shí)驗(yàn)中用于improve performance的小trick，也許能被有理論基礎(chǔ)的researcher開拓成全新的方法論，甚至建立嚴(yán)密的數(shù)學(xué)基礎(chǔ)。很多paper中都埋藏著這樣的金子，等待trained eyes的發(fā)掘（可能連paper的作者自己都沒有意識(shí)到~~）

Comments (1)

超級(jí)喜歡博主的這番話！“我始終認(rèn)為，根本問(wèn)題的解決離不開在具體問(wèn)題上的積累和深刻理解。這種積累，既包括理論的，也包括實(shí)驗(yàn)的。至少，對(duì)于像我這樣的普通人，我覺得，獲得這種積累的唯一途徑就是大量的實(shí)踐，包括閱讀paper，建立數(shù)學(xué)模型，推導(dǎo)求解算法，自己親手把程序?qū)懗鰜?lái)，在實(shí)際數(shù)據(jù)中運(yùn)行并觀察結(jié)果。新的idea是思考出來(lái)的，但是，這種思考是需要建立在對(duì)問(wèn)題的深刻理解上的。從石頭縫里蹦出有價(jià)值的idea的概率，和彩票中獎(jiǎng)沒有什么區(qū)別。”

我感覺是非常非常不錯(cuò)的一篇文章！和大家分享一下。。

posted on 2010-09-23 16:38 Sosi 閱讀(286) 評(píng)論(0) 編輯收藏引用

只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。




網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問(wèn) Chat2DB 管理

統(tǒng)計(jì)系統(tǒng)

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品