終于有點(diǎn)時(shí)間寫這樣一些文字,來介紹我前些時(shí)間寫的搜狐陽光牧場(chǎng)外掛。
其實(shí)這樣的一個(gè)外掛沒有什么高深的技術(shù),只需要使用2個(gè)輔助工具和1門你熟悉的編程語言就OK了。
廢話不多說,我就開門見山直接介紹了。
你需要準(zhǔn)備2個(gè)工具:HttpWatch(或HttpAnalyzer),以及JSONViewer(http://www.codeplex.com/JsonViewer)
HttpWatch(或HttpAnalyzer)是收費(fèi)軟件,JSONViewer是free的。另外你也可以安裝Firefox的JSONView插件,也可以不用JSONViewer。
編寫任何一個(gè)WEB應(yīng)用外掛,第一步肯定都是登錄。只有正確登錄了,才能繼續(xù)后面的操作。
我們先拿HttpWatch來分析一下搜狐白社會(huì)的登錄過程。
第一部分:登錄1、打開http://bai.sohu.com,如果你以前已經(jīng)登錄了,先退出來到要求你輸入email和密碼的頁面
2、按下HttpWatch的Record按鈕,然后在頁面上輸入Email和密碼,點(diǎn)登錄。然后你會(huì)進(jìn)入白社會(huì)首頁。這個(gè)時(shí)候看一下HttpWatch記錄的軌跡,如下:

上面的圖中我添加了filter,把圖片什么的過濾掉了。
3、通過上面HttpWatch記錄的軌跡,我們很容易看到,登錄的真實(shí)URL是:
http://passport.sohu.com/sso/login.jsp?userid=你的E-MAIL賬號(hào)&password=密碼串&appid=1062&persistentcookie=1&s=1248665199215&b=2&w=1440&pwdtype=1
上面地址中,userid是你登錄時(shí)輸入的email地址,password是經(jīng)過md5加密的字符串,s是時(shí)間(1970-1-1到現(xiàn)在的秒數(shù),應(yīng)該是這個(gè)賬號(hào)注冊(cè)的時(shí)間。在C語言中可以用time()函數(shù)來產(chǎn)生),w應(yīng)該是計(jì)算機(jī)屏幕X方向的分辨率,persistentcookie表示保存cookie,b和pwdtype是一個(gè)常量,不知道具體含義(我們也不需要關(guān)心)。
OK,通過上面我們看到的URL,就可以完成賬號(hào)登錄了。
第二部分:進(jìn)入陽光牧場(chǎng)1、打開HttpWatch的Record,點(diǎn)擊首頁左側(cè)的“陽光牧場(chǎng)”,HttpWatch會(huì)將每個(gè)頁面動(dòng)作都記錄下來。我們可以看到,陽光牧場(chǎng)的真實(shí)地址是http://bai.sohu.com/app/farm/。在HttpWatch中選中http://bai.sohu.com/app/farm/這條記錄,在下方的Content頁簽中,可以看到這個(gè)頁面的source code:

2、你可以把這個(gè)頁面的source code復(fù)制出來,到dreamweaver或其他編輯器中查看,你會(huì)發(fā)現(xiàn),這個(gè)網(wǎng)頁其實(shí)包含了幾個(gè)iframe。其中有一個(gè)iframe,才是真正的、中間那個(gè)陽光牧場(chǎng)的大flash的地址:
<iframe src="http://sh_farm.rekoo.com/embed_swf/?so_sig_uid=6位數(shù)字&so_sig_session_key=UXdkRmZMaUxFQjg9&so_sig_sig=049fa15390e4c9acffbecac8870e83c1" frameborder="0" width="796" height="590" scrolling="no"></iframe>在上面的地址中,so_sig_uid就是你在搜狐白社會(huì)網(wǎng)站的用戶ID,這個(gè)ID對(duì)一般用戶來說沒什么用,是每個(gè)用戶在數(shù)據(jù)庫中的標(biāo)識(shí)。但是對(duì)我們編寫外掛來說,就很有用了,所以在這個(gè)地方,你需要將這個(gè)ID保存下來,以后要用到。
3、在瀏覽器中輸入http://sh_farm.rekoo.com/embed_swf
/?so_sig_uid=6位數(shù)字&so_sig_session_key=UXdkRmZMaUxFQjg9&so_sig_sig=049fa15390e4c9acffbecac8870e83c1,你會(huì)發(fā)現(xiàn)瀏覽器中只留下剛才我們看到的中間的那個(gè)大flash了,其他的通通都沒有了。事實(shí)證明我們找到的這個(gè)iframe是正確的。(注:執(zhí)行此步驟時(shí),別忘了打開HttpWatch的Record)
4、在HttpWatch中選中上面的地址,觀察一下返回的Content:

5、在上面我選中的高亮部分中,你能看到session_name、session_value、uid等一些信息。其中對(duì)我們非常重要的一個(gè)值就是session_value。有過web開發(fā)經(jīng)驗(yàn)的朋友都知道,登錄后,在站點(diǎn)中是有一個(gè)session在client端維護(hù)著用戶的一些信息,并且這個(gè)session是每次登錄都會(huì)產(chǎn)生的隨機(jī)字符串,并且有一定的有效期(由管理權(quán)配置)。所以,我們要模擬web的動(dòng)作,就需要拿到正確的session字符串,也就是上面我們看到的那個(gè)session_value。
其實(shí)到目前為止,我們的分析工作已經(jīng)進(jìn)行了一大半了。簡(jiǎn)單總結(jié)一下:
我們上面做了那么多事情,最重要達(dá)到兩個(gè)目的:
(1)如何模擬用戶登錄
(2)獲得正確的UID和sessionid
另外,關(guān)于sessionid的獲取還有其他方法,例如,如果你使用的是Java,可以從cookie中讀取到sessionid。
第三部分、分析陽光牧場(chǎng)各種操作有了上面的基礎(chǔ),下面的分析簡(jiǎn)直是易如反掌了。
1、打開HttpWatch的Record,將上面的http://sh_farm.rekoo.com/embed_swf
/?so_sig_uid=6位數(shù)字&so_sig_session_key=UXdkRmZMaUxFQjg9&so_sig_sig=049fa15390e4c9acffbecac8870e83c1
重新刷新一下。
2、在HttpWatch中,你會(huì)看到很多這樣的地址:http://sh_farm.rekoo.com/get_api/,這個(gè)地址那可是相當(dāng)?shù)闹匾。瑤缀跛械拿钫?qǐng)求都是往這個(gè)地方發(fā)。
3、選中http://sh_farm.rekoo.com/get_api/
,在下面的POST Data中可以看到:

原來這是一個(gè)標(biāo)準(zhǔn)的http post請(qǐng)求,完整的URL就是:
http://sh_farm.rekoo.com/get_api/?method=user.get_friends&rekoo_killer=你的6位UID&sessionid=剛才我們從頁面上獲取到的session_value
然后我們點(diǎn)擊旁邊的Content頁簽,看到服務(wù)器返回的內(nèi)容如下:

上面是典型的JSON數(shù)據(jù),接下來怎么做不用我說了吧。你可以把上面的內(nèi)容復(fù)制到JSONViewer中,它提供了樹形結(jié)構(gòu)供你方便的展開每個(gè)節(jié)點(diǎn),以分析父子關(guān)系、每個(gè)節(jié)點(diǎn)的類型等信息:

4、上面我們看到的是獲取好友列表的請(qǐng)求,其他的諸如獲取商店信息、殺蟲澆水、播種、收割……請(qǐng)求地址都是http://sh_farm.rekoo.com/get_api/,只不過post的參數(shù)不同而已。將正確的參數(shù)post給服務(wù)器,服務(wù)器就會(huì)返回相應(yīng)操作的JSON數(shù)據(jù)給你,有了這些數(shù)據(jù),你就可以進(jìn)行后期的分析處理了。
OK,通過上面文字的介紹,相信各位已經(jīng)明白了,這樣的一個(gè)外掛是怎么工作的了。