• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            本打算做一個網絡爬蟲(crawler)的,但水平有限只做了基本的一些功能. 思路: 肯定是要能先通過url連接到http服務器了,然后發送一個"GET url \n"的請求才能下載網頁. 之后就是分析網頁,比如辨認超鏈接和搜索關鍵詞.

            就是GET 這個東西搞不懂, 有的網頁需要給完整的url, 有的只需要相對路徑才正確. 怎么才能自動知道需要哪個啊?


            source: http://www.shnenglu.com/Files/tompson/getwebpage.rar
            (寫的很爛, 供學習網絡編程的同學參考)
            Posted on 2007-08-11 14:45 ken 閱讀(1860) 評論(2)  編輯 收藏 引用 所屬分類: program

            Feedback

            # re: 網頁抓取的程序  回復  更多評論   

            2007-08-11 14:51 by XTSHMF
            兩個都試試阿,哪個行就哪個貝,嘿嘿

            # re: 網頁抓取的程序  回復  更多評論   

            2007-08-11 15:14 by ken
            怎么判斷哪個行,哪個不行? 有的兩個都不行,比如google.com
            久久996热精品xxxx| 人妻少妇久久中文字幕一区二区| 久久91精品久久91综合| 国产毛片久久久久久国产毛片| 欧美日韩精品久久久久 | 久久这里只有精品18| 久久久久亚洲AV无码网站| 久久精品一区二区国产| 久久精品成人| 久久婷婷五月综合色高清| 93精91精品国产综合久久香蕉| 久久亚洲日韩看片无码| 久久久久久狠狠丁香| 热99RE久久精品这里都是精品免费 | 大伊人青草狠狠久久| 亚洲国产成人久久一区WWW| 久久精品国产亚洲av高清漫画| 久久久久亚洲AV无码去区首| 99久久99这里只有免费的精品| 精品伊人久久久| 国产精品欧美久久久久天天影视| 狠狠色丁香久久婷婷综合五月| 波多野结衣久久精品| 亚洲国产精品久久久久久| 久久久精品国产sm调教网站| 亚洲伊人久久综合影院| 精品久久人人妻人人做精品| 996久久国产精品线观看| 久久AV高潮AV无码AV| 欧美亚洲国产精品久久| 久久97久久97精品免视看秋霞 | 日本精品久久久久久久久免费| 欧美久久精品一级c片片| AV色综合久久天堂AV色综合在| 香蕉久久夜色精品升级完成| 国产精品久久久久久久久软件 | 久久精品中文字幕有码| 国产L精品国产亚洲区久久| 久久精品国产亚洲沈樵| 国产精品久久自在自线观看| 久久青青草原国产精品免费|