• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            本打算做一個網(wǎng)絡(luò)爬蟲(crawler)的,但水平有限只做了基本的一些功能. 思路: 肯定是要能先通過url連接到http服務(wù)器了,然后發(fā)送一個"GET url \n"的請求才能下載網(wǎng)頁. 之后就是分析網(wǎng)頁,比如辨認(rèn)超鏈接和搜索關(guān)鍵詞.

            就是GET 這個東西搞不懂, 有的網(wǎng)頁需要給完整的url, 有的只需要相對路徑才正確. 怎么才能自動知道需要哪個啊?


            source: http://www.shnenglu.com/Files/tompson/getwebpage.rar
            (寫的很爛, 供學(xué)習(xí)網(wǎng)絡(luò)編程的同學(xué)參考)
            Posted on 2007-08-11 14:45 ken 閱讀(1866) 評論(2)  編輯 收藏 引用 所屬分類: program

            Feedback

            # re: 網(wǎng)頁抓取的程序  回復(fù)  更多評論   

            2007-08-11 14:51 by XTSHMF
            兩個都試試阿,哪個行就哪個貝,嘿嘿

            # re: 網(wǎng)頁抓取的程序  回復(fù)  更多評論   

            2007-08-11 15:14 by ken
            怎么判斷哪個行,哪個不行? 有的兩個都不行,比如google.com
            婷婷综合久久中文字幕| 久久久久国产一区二区三区| 精品国产乱码久久久久久浪潮| 色8久久人人97超碰香蕉987| 久久影院午夜理论片无码| 欧美一级久久久久久久大片| 久久伊人中文无码| 久久无码AV中文出轨人妻| 久久久久久国产精品美女| 久久狠狠爱亚洲综合影院| 无码人妻精品一区二区三区久久久 | 色综合色天天久久婷婷基地| 国产综合久久久久| 午夜不卡888久久| 亚洲国产天堂久久久久久| 亚洲欧美成人综合久久久| 久久超碰97人人做人人爱| 久久久精品午夜免费不卡| 久久99亚洲综合精品首页| 一级做a爰片久久毛片毛片| 亚洲中文久久精品无码| 精品午夜久久福利大片| 国产午夜精品久久久久九九| 色婷婷久久久SWAG精品| 久久久久人妻一区精品色| 久久亚洲高清观看| 久久久久久国产精品美女| 女人香蕉久久**毛片精品| 欧美色综合久久久久久| 国产美女久久精品香蕉69| 久久久不卡国产精品一区二区| 精品国产乱码久久久久久呢| 99久久精品国内| 亚洲人成电影网站久久| 亚洲国产精品久久66| 久久国语露脸国产精品电影| 久久精品国产一区二区电影| 久久夜色精品国产噜噜麻豆| 欧美精品福利视频一区二区三区久久久精品 | 国产日韩欧美久久| 久久人人爽人人爽人人片AV高清|