久久久久久久综合色一本,美女国产一区,欧美日韩免费观看一区=区三区

網頁抓取的程序

本打算做一個網絡爬蟲(crawler)的,但水平有限只做了基本的一些功能. 思路: 肯定是要能先通過url連接到http服務器了,然后發送一個"GET url \n"的請求才能下載網頁. 之后就是分析網頁,比如辨認超鏈接和搜索關鍵詞.

就是GET 這個東西搞不懂, 有的網頁需要給完整的url, 有的只需要相對路徑才正確. 怎么才能自動知道需要哪個啊?

source: http://www.shnenglu.com/Files/tompson/getwebpage.rar
(寫的很爛, 供學習網絡編程的同學參考)

Posted on 2007-08-11 14:45 ken 閱讀(1866) 評論(2) 編輯收藏引用所屬分類: program

Feedback

# re: 網頁抓取的程序回復 更多評論

2007-08-11 14:51 by XTSHMF

兩個都試試阿，哪個行就哪個貝，嘿嘿

# re: 網頁抓取的程序 回復 更多評論

2007-08-11 15:14 by ken

怎么判斷哪個行,哪個不行? 有的兩個都不行,比如google.com

刷新評論列表

只有注冊用戶登錄后才能發表評論。
【推薦】100%開源！大型工業跨平臺軟件C++源碼提供，建模，組態！



網站導航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

ken

網頁抓取的程序

Feedback

# re: 網頁抓取的程序回復 更多評論

# re: 網頁抓取的程序 回復 更多評論

常用鏈接

留言簿(1)

隨筆分類

隨筆檔案

搜索

最新評論

閱讀排行榜

評論排行榜

ken

網頁抓取的程序

Feedback

# re: 網頁抓取的程序 回復 更多評論

# re: 網頁抓取的程序 回復 更多評論

常用鏈接

留言簿(1)

隨筆分類

隨筆檔案

搜索

最新評論

閱讀排行榜

評論排行榜

# re: 網頁抓取的程序回復更多評論

# re: 網頁抓取的程序回復更多評論