• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            本打算做一個網(wǎng)絡(luò)爬蟲(crawler)的,但水平有限只做了基本的一些功能. 思路: 肯定是要能先通過url連接到http服務(wù)器了,然后發(fā)送一個"GET url \n"的請求才能下載網(wǎng)頁. 之后就是分析網(wǎng)頁,比如辨認超鏈接和搜索關(guān)鍵詞.

            就是GET 這個東西搞不懂, 有的網(wǎng)頁需要給完整的url, 有的只需要相對路徑才正確. 怎么才能自動知道需要哪個啊?


            source: http://www.shnenglu.com/Files/tompson/getwebpage.rar
            (寫的很爛, 供學(xué)習(xí)網(wǎng)絡(luò)編程的同學(xué)參考)
            Posted on 2007-08-11 14:45 ken 閱讀(1860) 評論(2)  編輯 收藏 引用 所屬分類: program

            Feedback

            # re: 網(wǎng)頁抓取的程序  回復(fù)  更多評論   

            2007-08-11 14:51 by XTSHMF
            兩個都試試阿,哪個行就哪個貝,嘿嘿

            # re: 網(wǎng)頁抓取的程序  回復(fù)  更多評論   

            2007-08-11 15:14 by ken
            怎么判斷哪個行,哪個不行? 有的兩個都不行,比如google.com
            91久久精品91久久性色| 国产精品久久久久9999| 亚洲国产婷婷香蕉久久久久久| 久久精品成人免费看| 伊人色综合久久| 国产精品久久久久久久久久影院| 久久久久久亚洲精品影院| 亚洲va久久久噜噜噜久久男同| 国产成人综合久久综合| 久久久网中文字幕| 国产精品久久久久久| 久久中文字幕视频、最近更新 | 尹人香蕉久久99天天拍| 久久精品国产亚洲AV嫖农村妇女| 国产国产成人久久精品| 伊人色综合久久天天人手人婷| 精品久久久久久无码人妻热| 无码人妻久久一区二区三区免费 | 亚洲国产综合久久天堂| 久久成人国产精品二三区| 久久亚洲AV无码精品色午夜麻豆| 久久亚洲国产午夜精品理论片| av色综合久久天堂av色综合在| 久久精品国产一区二区电影| 久久久免费精品re6| 囯产极品美女高潮无套久久久| 午夜精品久久久内射近拍高清| 夜夜亚洲天天久久| 久久99热狠狠色精品一区| 久久亚洲精品成人av无码网站| 国内高清久久久久久| 久久中文字幕精品| 综合久久精品色| 久久天天躁狠狠躁夜夜不卡| 香港aa三级久久三级老师2021国产三级精品三级在 | 久久天天躁狠狠躁夜夜av浪潮 | 亚洲中文字幕无码久久2017| 久久久久久无码国产精品中文字幕| 香蕉久久一区二区不卡无毒影院 | 中文字幕热久久久久久久| 久久亚洲AV成人无码软件|