上海交通違章查詢網站: http://www.shjtaq.com/Server1/dzjc_new.asp
驗證碼圖片獲取地址: http://www.shjtaq.com/Server1/validatecode.asp?m=2304.046
服務器通過頁面請求的session-id來區分之后提交的驗證碼。 第一次請求查詢頁面時,服務器將訪問session(cookie)傳到客戶端,之后的查詢和驗證碼獲取時客戶端攜帶之前的cookie傳送到服務器,服務器端保存著當前 session-id與驗證碼 的對應關系。
查詢返回記錄可通過 xpath或者 beautifulsoup進行解析
程序使用python完成,也是個簡單的小爬蟲,scrapy 之類的沒必要使用了,gevent完成異步通信。
交通網的驗證碼生成還是比較簡單,做自動識別可找幾個簡單的圖形識別程序即可。
如若不行,則人工輸入嘍