QQ在許多公司內部被禁止使用,為了能使用QQ,稍微懂點兒計算機的人都知道用代理。QQ提供了socket和http代理這兩種功能,socket代理功能強大,但一般公司對外允許連接的端口號比較有限,難以利用。大多數公司是允許連接外部的80端口的,這樣使用QQ的http代理是可行的。但是找到能用的QQ代理有點兒麻煩,因此下面的Python代碼提供了自動進行QQ代理驗證的功能。
import urllib2
import socket
import re
f = urllib2.urlopen('http://www.proxycn.com/html_proxy/http-1.html')
content = f.read()
f.close()
ipPattern = re.compile(r'(\d+\.\d+\.\d+\.\d+):80')
ipList = ipPattern.findall(content)
print ipList
requestData = "CONNECT http.tencent.com:443 HTTP/1.1\x0d\x0a"
requestData += "Accept: */*\x0d\x0aContent-Type: text/html\x0d\x0a"
requestData += "Proxy-Connection: Keep-Alive\x0d\x0a"
requestData += "Content-length: 0\x0d\x0a\x0d\x0a"
for ip in ipList:
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
try:
s.connect((ip,80))
s.send(requestData)
data = s.recv(64)
if data.find("200 Connection established")!= -1:
print ip, 'good'
# A vailable proxy is found once, then exit the program
s.close
exit(0)
else:
print ip, 'bad'
except socket.error:
print ip, 'dead'
finally:
s.close
程序在找到一個可用的QQ代理后退出,用good標識。另兩種代理服務器的狀態是dead,說明本地無法連接到代理服務器,或是bad,能與代理服務器建立連接,但是代理不能與QQ服務器通訊。
代碼思路
通過代理中國獲取到80端口的代理服務器列表,使用了urllib2模塊獲取頁面數據,然后正則表達式解析出80端口的IP地址存入list中。接下來的幾行代碼簡單,但是很重要,使用較為底層的socket對象,構造合適的數據包通過代理,請求與QQ服務器連接,通過讀取的返回數據包來驗證連接是否能建立。
這里主要涉及到了HTTP協議的CONNECT的概念,很多人可能認為http代理只是為web瀏覽提供服務,其實CONNECT方法允許允許用戶建立TCP連接到任何端口,這意味著代理不僅可用于HTTP,還可用于FTP,QQ等其他協議。只是網上提供CONNECT方法的代理服務器比較少,我有時候掃了一大堆,也沒有找到一個可用的代理。反過來說,有時候你找到的能瀏覽網頁的http服務器,未必能用在QQ上,QQ需要的是能CONNECT的代理。網頁瀏覽一般只使用HTTP協議的GET或POST方法,提供這兩種方法的服務器就多了。
了解了代碼的原理,稍做改動,就可以用于其他類型的代理的驗證了,需要的是一些基本網絡知識和數據報的發送和接收。
posted on 2008-07-02 22:13
len 閱讀(1602)
評論(1) 編輯 收藏 引用 所屬分類:
IT技術