• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            牽著老婆滿街逛

            嚴以律己,寬以待人. 三思而后行.
            GMail/GTalk: yanglinbo#google.com;
            MSN/Email: tx7do#yahoo.com.cn;
            QQ: 3 0 3 3 9 6 9 2 0 .

            基于Google的學(xué)習(xí)過程

            版權(quán)聲明:可以任意轉(zhuǎn)載,轉(zhuǎn)載時請務(wù)必以超鏈接形式標明文章原始出處和作者信息及本聲明
            http://www.chedong.com/tech/study.html

            關(guān)鍵詞: google Open Source Gnu search 工具箱 學(xué)習(xí) E-learning

            內(nèi)容摘要:

            Google的使用如此重要, O"Reilly有本專門的書介紹了如何優(yōu)化網(wǎng)站面向Google的設(shè)計,和使用Google的一些技巧:
            http://www.oreilly.com/catalog/googlehks/
            這里我很想把以前遇到類似問題時在Google上尋找資料的思路和大家分享一下:

            足夠“多”的特征關(guān)鍵詞是快速定位的關(guān)鍵


            有朋友問我:在
            如果用戶理解了使用更多的關(guān)鍵詞可以更快的定位到所需要的信息這一點的話,那么每次查詢時用戶使用的關(guān)鍵詞個數(shù)就反映了用戶的搜索引擎使用水平,根據(jù)在1997年,英語國家的用戶平均每次上網(wǎng)查詢鍵入2.1個單詞,歐洲其他國家為1.5個單詞;到1999年,英語國家是2.7個單詞,歐洲國家是2個單詞。英語國家用戶的經(jīng)驗值要領(lǐng)先其他國家將近1年半的時間。中文搜索引擎也將經(jīng)歷一個用戶經(jīng)驗值逐漸提高的過程。
            從中我們可以想象在互聯(lián)網(wǎng)資源的使用水平上中國和國際先進水平的差距。

            提高搜索結(jié)果質(zhì)量的途徑:使用英文專業(yè)術(shù)語、文件類型過濾、專業(yè)站點站內(nèi)搜索

            2000年1月,Excite公司的科學(xué)家對全球約6.4億的Internet網(wǎng)頁進行了語言認證,發(fā)現(xiàn)其中英文信息內(nèi)容占了71%,而日文是6.82%、德文是5.08%、法文是 1.75%、中文則為1.52%。如此豐富多彩的英文海量數(shù)據(jù)庫,勢必吸引著英語國家的上網(wǎng)用戶不斷應(yīng)用搜索引擎去尋找那些有價值的信息內(nèi)容。使用英文專業(yè)術(shù)語:學(xué)會把自己的問題翻譯成英文后再查最近一次經(jīng)歷是找一個Linux應(yīng)用的安裝文檔,但用中文關(guān)鍵詞搜出的內(nèi)容大部分很多都很舊,甚至有基于RedHat5.2的,而且絕大部分只是的把臺灣開發(fā)人員寫的繁體板HOWTO轉(zhuǎn)成了簡體中文,此外,由于一些計算機名次中文名稱的翻譯不一致也限制了搜索結(jié)果的數(shù)量和質(zhì)量。所以目前來說,質(zhì)量比較高的仍然基于是相應(yīng)領(lǐng)域英文關(guān)鍵詞的搜索。比如,我在解決Perl源代碼格式美化的過程中學(xué)到了 indent,pretty print和source code beatufier這些術(shù)語。通過這些關(guān)鍵詞,也方便我找到了其他開發(fā)語言的代碼格式美化工具。

            文件類型過濾:
            Google有對PDF, Word(Power Point, Excel), PS文檔的索引能力,由于這種文檔的內(nèi)容比一般的HTML經(jīng)過了更多的整理,學(xué)術(shù)價值一般比較高,所以這些類型的文檔天生就比一般的HTML類型的文檔 PageRank要高。可以通過"filetype:pdf keywords"這種格式過濾返回結(jié)果的文件類型,從而提高搜索結(jié)果的質(zhì)量。

            利用站內(nèi)搜索減小搜索范圍:
            如果某個站點的結(jié)果數(shù)很多,Google會類聚成2條,并可以通過“www.example.com 站內(nèi)的其它相關(guān)信息”執(zhí)行站內(nèi)檢索,在查詢的命令中其實就是"site:www.example.com keywords",所以很多時候可以進一步通過站內(nèi)檢索將搜索結(jié)果限制在某些專業(yè)站點的范圍內(nèi),這樣很多問題的資料往往可以從其官方站點的FAQ或郵件列表HTML歸檔中查到。

            此外Google本身也有按操作系統(tǒng)分類的主題搜索入口:
            http://www.google.com/linux
            http://www.google.com/bsd
            http://www.google.com/mac
            http://www.google.com/microsoft

            我的猜測:Google其實是針對有相應(yīng)內(nèi)容的WEB站點根據(jù)其服務(wù)器進行了類聚,要知道關(guān)于Office的內(nèi)容如果跑在Linux服務(wù)器的 Apache上那么很有可能是OpenOffice,而關(guān)于Office 2000的文檔項目肯定是跑在Windows服務(wù)器的IIS上的多。

            BUG反饋/改進意見也是一種非常有價值的勞動

            首先,如果發(fā)現(xiàn)了問題一定要進行主動的反饋:有朋友問我說他以前早就遇到過類似的問題,說明Resin在CPU比較慢的機器上自動啟動這個問題應(yīng)該是比較普遍了,但為什么一致沒有作為BUG提交上去呢?

            其次,如果找到了解決方法,千萬不要為自己的一點小技巧沾沾自喜,像在Java 編程技術(shù)中漢字問題的分析及解決這篇文章中提到的那個的高手那樣,雖然他自己知道了通過Hacking Servert包的源文件解決中文字符集問題的方法,如果這真是一個正確的思路為什么不作為一個議程直接提交給JCP呢?

            所以我在找到解決Resin自動啟動這個問題以后,在相應(yīng)的BUG跟蹤報告中提交了自己的方法,如果以后的版本中有了改進,大家安裝使用中可以少考慮一個問題不是更好嗎。(雖然這個方法最后沒有被采納),有時候在反饋過程中你也許會發(fā)現(xiàn)讓別人接受你的建議其實更難。尤其在中文支持問題上:但如果中文用戶自己不主動反饋,以后很多的設(shè)計中就會繼續(xù)忽略中文用戶的一些特殊需求。

            事實上無論是BUG提交還是改進意見,對于軟件的進步都是一種非常有價值的。雖然目前國內(nèi)還沒有很多人直接參與開源軟件的開發(fā),但通過以上這些方式積極的參與也是在為開源軟件加油。

            更主動的反饋莫過于像Blogger一樣的主動表達:把你的理解和想法通過互聯(lián)網(wǎng)傳播出去,由于在表達和交流過程中同時你也總結(jié)提煉了自己的思想,所以“教授他人其實正是一個非常好的學(xué)習(xí)過程”。

            GNU的“工具箱”哲學(xué):問題的分解

            雖然常常發(fā)現(xiàn)自己碰到的很多問題在國外幾年前就有人遇到過了,而且往往能通過Google找到大量相關(guān)資源。而且類似需求非常多的話,往往還會有很多 Open Source的解決方案發(fā)布在SourceForge.netApache.org上。

            但也不要指望所有問題都能夠直接在互聯(lián)網(wǎng)上找到答案,因為復(fù)雜問題本身的解決有可能利用其他一些工具組合解決完成的。比如:我在解決多臺服務(wù)器之間的日志合并統(tǒng)計過程中找到的Apache的日志輪循工具cronolog,在OutLook Express郵件的HTML歸檔過程中找到的mbx2mbox+mhonarc,以及在CVS的常用工具整理過程中找到的大量優(yōu)秀應(yīng)用等。

            GNU很推崇“工具箱”哲學(xué):因為很多復(fù)雜的問題都可以通過幾個更簡單的工具通過一定的組合加以解決的。而Perl往往就是粘合這些優(yōu)秀工具的“膠水語言”。這也是為什么Perl(或者說Perl的哲學(xué))是任何一個程序員都因該學(xué)習(xí)并掌握的語言。

            如果一個問題在Google上也找不到,有時候反思一下是不是自身需求本身的問題,因為只有合理的需求是發(fā)展的源動力:如果你發(fā)現(xiàn)提出需求目前很多系統(tǒng)中不支持,說明我們對其設(shè)計目標理解不夠深入或者對問題的復(fù)雜度缺乏正確的估計造成的。比如:MySQL早期版本中沒有外鍵和事務(wù)處理的支持,CVS沒有文件的鎖定機制,但事實上經(jīng)過很長時間的實踐證明:這些功能并非必需,而且沒有這些功能系統(tǒng)也是“夠用”的,而且是高效的。

            總結(jié)

            1. 畢竟搜索引擎只是幫助我們把“模糊的”人類語言轉(zhuǎn)換成立了計算機比較擅長的“精確”匹配,因此往往需要使用一些真正能夠幫助去其他信息區(qū)分開的特征關(guān)鍵詞(不僅是多)才能夠把自己真正需要的資源比較高效的提煉出來;
            2. 而返回的結(jié)果不可能達到非常完美的程度,所以有時候除了一些技巧外,還是需要我們自己從頭幾十條比較相關(guān)的結(jié)果中進行一下歸納總結(jié)。“搜索= =>總結(jié)==>再搜索……”,我想基于搜索引擎的學(xué)習(xí)基本上就是這么一個不斷提煉過程吧;
            3. 如果直接找不到問題的答案就想辦法把問題分解,如果還找不到,就反思一下自己的需求是否合理;
            4. 把自己的經(jīng)驗通過互聯(lián)網(wǎng)加以總結(jié),反饋和推廣,網(wǎng)志W(wǎng)eblog是一個不錯的手段,善于把你的觀點共享給別人;

            相關(guān)資源:

            Google搜索幫助
            http://www.google.com/help/

            NEC Research Institute CiteSeer
            http://citeseer.nj.nec.com

            The Apache Software Foundation
            http://www.apache.org/

            GNU項目
            http://www.gnu.org

            各種開源項目資源
            http://sourceforge.net
            http://freshmeat.net

            posted on 2006-08-07 18:22 楊粼波 閱讀(365) 評論(0)  編輯 收藏 引用 所屬分類: 文章收藏

            亚洲国产精品无码久久九九| 久久福利青草精品资源站免费| 精品午夜久久福利大片| 99久久精品国内| 久久人人爽人爽人人爽av| 亚洲午夜久久久久久噜噜噜| 嫩草影院久久国产精品| 亚洲香蕉网久久综合影视| 久久er国产精品免费观看2| 久久久这里只有精品加勒比| 日本久久久久久中文字幕| 欧美亚洲国产精品久久高清| 亚洲色欲久久久久综合网 | 亚洲AV日韩精品久久久久| 中文国产成人精品久久亚洲精品AⅤ无码精品 | 香蕉久久夜色精品国产尤物| 91精品国产91久久久久福利| 久久婷婷是五月综合色狠狠| 精品国产综合区久久久久久 | 精品久久久久久国产91| 久久只有这里有精品4| 久久国产成人午夜AV影院| 久久精品视频网| 久久噜噜电影你懂的| 欧美va久久久噜噜噜久久| 性欧美大战久久久久久久久| 久久久久久久91精品免费观看 | 成人a毛片久久免费播放| 久久国产精品成人免费| 久久久久久国产精品无码下载| 亚洲性久久久影院| 国产真实乱对白精彩久久| 99久久精品国产一区二区三区| 999久久久国产精品| 99久久亚洲综合精品网站| 久久精品国产精品青草| 久久精品国产半推半就| 国产精品永久久久久久久久久 | 日韩精品久久久久久久电影蜜臀| 97精品伊人久久大香线蕉| 无码专区久久综合久中文字幕|