• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            本打算做一個網絡爬蟲(crawler)的,但水平有限只做了基本的一些功能. 思路: 肯定是要能先通過url連接到http服務器了,然后發(fā)送一個"GET url \n"的請求才能下載網頁. 之后就是分析網頁,比如辨認超鏈接和搜索關鍵詞.

            就是GET 這個東西搞不懂, 有的網頁需要給完整的url, 有的只需要相對路徑才正確. 怎么才能自動知道需要哪個啊?


            source: http://www.shnenglu.com/Files/tompson/getwebpage.rar
            (寫的很爛, 供學習網絡編程的同學參考)
            Posted on 2007-08-11 14:45 ken 閱讀(1852) 評論(2)  編輯 收藏 引用 所屬分類: program

            Feedback

            # re: 網頁抓取的程序  回復  更多評論   

            2007-08-11 14:51 by XTSHMF
            兩個都試試阿,哪個行就哪個貝,嘿嘿

            # re: 網頁抓取的程序  回復  更多評論   

            2007-08-11 15:14 by ken
            怎么判斷哪個行,哪個不行? 有的兩個都不行,比如google.com
            久久午夜综合久久| 国产精品伦理久久久久久| 久久99精品国产麻豆宅宅| 欧美午夜A∨大片久久| 欧美国产成人久久精品| 久久精品一本到99热免费| 国产国产成人久久精品| 亚洲中文字幕久久精品无码喷水| 99久久国语露脸精品国产| 久久综合九色欧美综合狠狠 | 久久久中文字幕| 免费精品久久天干天干| 秋霞久久国产精品电影院| 狠狠色狠狠色综合久久| 狠狠色伊人久久精品综合网| 伊人久久无码中文字幕| 久久精品国产99久久久香蕉| 亚洲va久久久噜噜噜久久天堂| 99久久无码一区人妻| 久久超乳爆乳中文字幕| 国产A三级久久精品| 久久无码国产| 久久亚洲2019中文字幕| 国产精品九九久久免费视频 | 精品久久久久久久久免费影院| 久久狠狠色狠狠色综合| 久久精品亚洲一区二区三区浴池| 久久99这里只有精品国产| 久久久精品日本一区二区三区| 久久精品国产亚洲网站| 国产精品免费福利久久| 97精品久久天干天天天按摩| 久久婷婷激情综合色综合俺也去| 亚洲熟妇无码另类久久久| 久久久无码精品亚洲日韩蜜臀浪潮| 久久人人爽人人爽AV片| 午夜精品久久久久久久无码| 久久久免费观成人影院| 久久青青草视频| 色婷婷久久综合中文久久蜜桃av| 久久天天躁狠狠躁夜夜不卡|