• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            本打算做一個網絡爬蟲(crawler)的,但水平有限只做了基本的一些功能. 思路: 肯定是要能先通過url連接到http服務器了,然后發送一個"GET url \n"的請求才能下載網頁. 之后就是分析網頁,比如辨認超鏈接和搜索關鍵詞.

            就是GET 這個東西搞不懂, 有的網頁需要給完整的url, 有的只需要相對路徑才正確. 怎么才能自動知道需要哪個啊?


            source: http://www.shnenglu.com/Files/tompson/getwebpage.rar
            (寫的很爛, 供學習網絡編程的同學參考)
            Posted on 2007-08-11 14:45 ken 閱讀(1866) 評論(2)  編輯 收藏 引用 所屬分類: program

            Feedback

            # re: 網頁抓取的程序  回復  更多評論   

            2007-08-11 14:51 by XTSHMF
            兩個都試試阿,哪個行就哪個貝,嘿嘿

            # re: 網頁抓取的程序  回復  更多評論   

            2007-08-11 15:14 by ken
            怎么判斷哪個行,哪個不行? 有的兩個都不行,比如google.com
            精品综合久久久久久888蜜芽| 97精品伊人久久大香线蕉app| 国产成人精品久久一区二区三区av | 婷婷久久综合九色综合98| 91久久九九无码成人网站| 亚洲综合久久夜AV | 精品乱码久久久久久久| 久久996热精品xxxx| 欧美黑人激情性久久| 久久久黄片| 青青青青久久精品国产h| 久久香综合精品久久伊人| 777久久精品一区二区三区无码| 亚洲国产综合久久天堂| 日本精品久久久久中文字幕8| 亚洲中文久久精品无码ww16| 免费精品久久久久久中文字幕| 99久久国产综合精品麻豆| 色婷婷综合久久久中文字幕| 久久亚洲av无码精品浪潮| 久久精品不卡| 久久九九有精品国产23百花影院| 7777精品久久久大香线蕉| 久久亚洲国产精品成人AV秋霞| 久久免费大片| 精品久久久久久无码中文字幕| 久久美女网站免费| 国产精品视频久久久| 国产成人久久精品激情| 国产麻豆精品久久一二三| 国产欧美久久一区二区| 久久精品视频免费| 久久国产乱子伦精品免费强| 久久99亚洲网美利坚合众国| 午夜精品久久久久久中宇| 久久w5ww成w人免费| 国产精品久久永久免费| 国产精品永久久久久久久久久| 久久精品国产色蜜蜜麻豆| 久久精品国产99国产精品| 色综合久久天天综线观看|