QQ在許多公司內(nèi)部被禁止使用,為了能使用QQ,稍微懂點(diǎn)兒計(jì)算機(jī)的人都知道用代理。QQ提供了socket和http代理這兩種功能,socket代理功能強(qiáng)大,但一般公司對(duì)外允許連接的端口號(hào)比較有限,難以利用。大多數(shù)公司是允許連接外部的80端口的,這樣使用QQ的http代理是可行的。但是找到能用的QQ代理有點(diǎn)兒麻煩,因此下面的Python代碼提供了自動(dòng)進(jìn)行QQ代理驗(yàn)證的功能。
import urllib2
import socket
import re
f = urllib2.urlopen('http://www.proxycn.com/html_proxy/http-1.html')
content = f.read()
f.close()
ipPattern = re.compile(r'(\d+\.\d+\.\d+\.\d+):80')
ipList = ipPattern.findall(content)
print ipList
requestData = "CONNECT http.tencent.com:443 HTTP/1.1\x0d\x0a"
requestData += "Accept: */*\x0d\x0aContent-Type: text/html\x0d\x0a"
requestData += "Proxy-Connection: Keep-Alive\x0d\x0a"
requestData += "Content-length: 0\x0d\x0a\x0d\x0a"
for ip in ipList:
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
try:
s.connect((ip,80))
s.send(requestData)
data = s.recv(64)
if data.find("200 Connection established")!= -1:
print ip, 'good'
# A vailable proxy is found once, then exit the program
s.close
exit(0)
else:
print ip, 'bad'
except socket.error:
print ip, 'dead'
finally:
s.close
程序在找到一個(gè)可用的QQ代理后退出,用good標(biāo)識(shí)。另兩種代理服務(wù)器的狀態(tài)是dead,說(shuō)明本地?zé)o法連接到代理服務(wù)器,或是bad,能與代理服務(wù)器建立連接,但是代理不能與QQ服務(wù)器通訊。
代碼思路
通過(guò)代理中國(guó)獲取到80端口的代理服務(wù)器列表,使用了urllib2模塊獲取頁(yè)面數(shù)據(jù),然后正則表達(dá)式解析出80端口的IP地址存入list中。接下來(lái)的幾行代碼簡(jiǎn)單,但是很重要,使用較為底層的socket對(duì)象,構(gòu)造合適的數(shù)據(jù)包通過(guò)代理,請(qǐng)求與QQ服務(wù)器連接,通過(guò)讀取的返回?cái)?shù)據(jù)包來(lái)驗(yàn)證連接是否能建立。
這里主要涉及到了HTTP協(xié)議的CONNECT的概念,很多人可能認(rèn)為http代理只是為web瀏覽提供服務(wù),其實(shí)CONNECT方法允許允許用戶建立TCP連接到任何端口,這意味著代理不僅可用于HTTP,還可用于FTP,QQ等其他協(xié)議。只是網(wǎng)上提供CONNECT方法的代理服務(wù)器比較少,我有時(shí)候掃了一大堆,也沒(méi)有找到一個(gè)可用的代理。反過(guò)來(lái)說(shuō),有時(shí)候你找到的能瀏覽網(wǎng)頁(yè)的http服務(wù)器,未必能用在QQ上,QQ需要的是能CONNECT的代理。網(wǎng)頁(yè)瀏覽一般只使用HTTP協(xié)議的GET或POST方法,提供這兩種方法的服務(wù)器就多了。
了解了代碼的原理,稍做改動(dòng),就可以用于其他類型的代理的驗(yàn)證了,需要的是一些基本網(wǎng)絡(luò)知識(shí)和數(shù)據(jù)報(bào)的發(fā)送和接收。
posted on 2008-07-02 22:13
len 閱讀(1602)
評(píng)論(1) 編輯 收藏 引用 所屬分類:
IT技術(shù)