本打算做一個網絡爬蟲(crawler)的,但水平有限只做了基本的一些功能. 思路: 肯定是要能先通過url連接到http服務器了,然后發送一個"GET url \n"的請求才能下載網頁. 之后就是分析網頁,比如辨認超鏈接和搜索關鍵詞.
就是GET 這個東西搞不懂, 有的網頁需要給完整的url, 有的只需要相對路徑才正確. 怎么才能自動知道需要哪個啊?
source:
http://www.shnenglu.com/Files/tompson/getwebpage.rar(寫的很爛, 供學習網絡編程的同學參考)
這幾天讀了下<薛定鄂的貓>, 這是一本敘述量子學發展的科普讀物.
量子的性質可以用幾個例子來說明: 雨過天晴,天上出現了彩虹,但是由于每個人所處的位置不同,看到的彩虹都是不一樣的. 就是說這個東西是通過觀察才會出現, 而實際上是不存在的. 又比如把貓和毒藥放在盒子里,打開盒子后貓是死是活? 根據多維宇宙的說法,在沒打開盒子的時候對于觀察者來說貓死和活兩種狀態并存,打開盒子后宇宙就會分裂為兩個,而觀察者選擇其中一個.
能否把這個性質用在程序中呢?