• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            posts - 12, comments - 4, trackbacks - 0, articles - 36

            網(wǎng)頁(yè)的自動(dòng)分類(lèi),需要考慮的東西很多啊。

            分類(lèi)體系的選擇,利用DDC還是中圖?還是借鑒yahoo或者google的分類(lèi)體系?分類(lèi)層次有多深?

            訓(xùn)練文集的選取?哪里來(lái)呢,那么多打好標(biāo)記,并且其分類(lèi)要與我們的分類(lèi)相同或者,相似吧

            剛開(kāi)始網(wǎng)頁(yè)的內(nèi)容處理,表示,是否考慮超鏈接,是否考慮html,如何剔出亂其八糟的廣告?

            網(wǎng)頁(yè)向量化,又有那么多種權(quán)值計(jì)算方法,經(jīng)典的就五個(gè)了,還有改進(jìn)的,估計(jì)也有那么五六個(gè)比較好的吧?

            向量的降維,還好那位帥哥整理過(guò)5經(jīng)典的算法,再加上后來(lái)北大那幫人做的實(shí)驗(yàn),經(jīng)典的幾個(gè)里面的性能大多清楚了。可是,是不是還有改進(jìn)的呢?特征提取算法和后面的分類(lèi)算法組合后的性能參數(shù)呢?

            ok,然后是分類(lèi)算法,姑且考慮KNN,還要考慮KNN的參數(shù),K=?,文檔之間的距離的計(jì)算,文檔-類(lèi)得分的的加權(quán)?如何加權(quán)?——還有其他的算法呢?

            分類(lèi)完了,還有截取算法,某個(gè)文檔可以屬于哪些類(lèi)?某個(gè)類(lèi)可以包含哪些文檔?這個(gè)怎么確定?RCut,PCut還是SCut,還有其他的改進(jìn)算法嗎?

            最有,貪心算法在這里面能起作用嗎?即每一步,都利用別人的實(shí)驗(yàn),選擇最好的算法,可是綜合起來(lái),就一定是全局最好的算法嗎?

            posted @ 2005-12-07 12:02 inwind 閱讀(285) | 評(píng)論 (0)編輯 收藏

            偶離開(kāi)科大后,李開(kāi)復(fù)先生竟然緊接著就過(guò)去了,郁悶啊郁悶,只能從zw同學(xué)那里拷來(lái)一些二手的資料,不過(guò)看來(lái)zw同學(xué)還是很認(rèn)真地記錄了的,受益匪淺啊!
            =======================================================

            kafulee在科大的演講

            唉,真是人山人海啊,估計(jì)在我的映象中已經(jīng)很久沒(méi)有出現(xiàn)過(guò)這種場(chǎng)景了。介紹了一下google的工作場(chǎng)景,真是令人神往啊。實(shí)驗(yàn)室的一位師兄獲得了一本贈(zèng)書(shū)。

            寫(xiě)一下他給我們的建議吧:厚積薄發(fā),有的放矢

            (1)練內(nèi)功。不要只花功夫?qū)W習(xí)各種流行的編程語(yǔ)言和工具,以及一些公司招聘廣告上要求的科目。要把數(shù)據(jù)結(jié)構(gòu)、算法、數(shù)據(jù)庫(kù)、操作系統(tǒng)原理、計(jì)算機(jī)體系結(jié)構(gòu)、計(jì)算機(jī)網(wǎng)絡(luò),離散數(shù)學(xué)等基礎(chǔ)課程學(xué)好。不妨試試Donald Knuth的Art of Computer Programming里的題目,如果你能夠解決其中的大部分題目,就說(shuō)明你在算法方面的功力不錯(cuò)了。

            (2)多實(shí)戰(zhàn)。通過(guò)編程的實(shí)戰(zhàn)積累經(jīng)驗(yàn)、內(nèi)化知識(shí)。建議大家爭(zhēng)取在大學(xué)四年中積累編寫(xiě)十萬(wàn)行代碼的經(jīng)驗(yàn)。

            (3)求實(shí)干。不要輕視任何的實(shí)際工作,比如一些看似簡(jiǎn)單的編碼或測(cè)試。要不懈追求對(duì)細(xì)節(jié)一絲不茍的實(shí)干作風(fēng)與職業(yè)精神。

            (4)不放棄數(shù)學(xué)。數(shù)學(xué)是思維的體操,數(shù)學(xué)無(wú)處不在。尤其當(dāng)你對(duì)一些“數(shù)學(xué)密集型”的領(lǐng)域有興趣,例如視頻、圖像處理等等,你需要使它成為你的利器。

            (5)培養(yǎng)團(tuán)隊(duì)精神,學(xué)會(huì)與人合作。

            (6)激勵(lì)創(chuàng)新意識(shí),不為書(shū)本和權(quán)威所約束。

            (7)有策略地“打工”。在不影響學(xué)業(yè)的前提下,尋找真正有意義的暑期工作或兼職。去找一個(gè)重視代碼的公司,在一個(gè)好的“老板”指導(dǎo)下完成真正會(huì)被用戶(hù)使用的程序。不要急于去一個(gè)要你做“頭”而獨(dú)擋一面的地方,因?yàn)橄騽e人學(xué)習(xí),是你的目的。打工和找工作一樣,“不要只看待遇和職銜,要挑一個(gè)你能夠?qū)W習(xí)的環(huán)境,一個(gè)愿意培養(yǎng)員工的企業(yè),一個(gè)重視你的專(zhuān)業(yè)的公司,最后,要挑一個(gè)好老板。”

            posted @ 2005-12-07 10:48 inwind 閱讀(385) | 評(píng)論 (0)編輯 收藏

            僅列出標(biāo)題
            共2頁(yè): 1 2 
            97久久精品无码一区二区| 久久久无码精品亚洲日韩京东传媒 | 国内精品久久久久久久涩爱| 中文字幕久久欲求不满| 欧美久久综合九色综合| 亚洲AV无码久久| 久久e热在这里只有国产中文精品99 | 久久天天躁狠狠躁夜夜96流白浆| 2021国内久久精品| 2021国产成人精品久久| 99精品国产综合久久久久五月天 | 久久精品极品盛宴观看| 日本欧美久久久久免费播放网| 成人久久精品一区二区三区 | 伊人伊成久久人综合网777| 精品久久无码中文字幕| 久久只有这精品99| 韩国三级中文字幕hd久久精品| 少妇人妻88久久中文字幕| 久久国产成人亚洲精品影院| 久久久久亚洲av无码专区导航| 国产激情久久久久影院老熟女| 久久夜色精品国产噜噜噜亚洲AV| 天天综合久久一二三区| 久久99毛片免费观看不卡| 九九精品99久久久香蕉| 午夜精品久久久久久久久| 亚洲欧美成人久久综合中文网| 久久99毛片免费观看不卡| 亚洲va久久久噜噜噜久久天堂| 久久毛片一区二区| 性欧美大战久久久久久久 | 久久国产精品-久久精品| 久久偷看各类wc女厕嘘嘘| 国产成人精品综合久久久久| 亚洲伊人久久综合中文成人网| 蜜桃麻豆www久久国产精品| 九九久久精品国产| 人妻丰满?V无码久久不卡| 亚洲国产成人久久一区久久| 日韩精品久久久肉伦网站|