curl是一個(gè)利用URL語法在命令行方式下工作的文件傳輸工具。它支持很多協(xié)議:FTP, FTPS, HTTP, HTTPS, GOPHER, TELNET, DICT, FILE 以及 LDAP。curl同樣支持HTTPS認(rèn)證,HTTP POST方法, HTTP PUT方法, FTP上傳, kerberos認(rèn)證, HTTP上傳, 代理服務(wù)器, cookies, 用戶名/密碼認(rèn)證, 下載文件斷點(diǎn)續(xù)傳, 上載文件斷點(diǎn)續(xù)傳, http代理服務(wù)器管道( proxy tunneling), 甚至它還支持IPv6, socks5代理服務(wù)器, 通過http代理服務(wù)器上傳文件到FTP服務(wù)器等等,功能十分強(qiáng)大。Windows操作系統(tǒng)下的網(wǎng)絡(luò)螞蟻,網(wǎng)際快車(FlashGet)的功能它都可以做到。準(zhǔn)確的說,curl支持文件的上傳和下載,所以是一個(gè)綜合傳輸工具,但是按照傳統(tǒng),用戶習(xí)慣稱curl為下載工具。
curl是瑞典curl組織開發(fā)的,您可以訪問http://curl.haxx.se/獲取它的源代碼和相關(guān)說明。鑒于curl在Linux上的廣泛使用,IBM在AIX Linux Toolbox的光盤中包含了這個(gè)軟件,并且您可以訪問IBM網(wǎng)站http://www-1.ibm.com/servers/aix/products/aixos/linux/altlic.html下載它。curl的最新版本是7.10.8,IBM網(wǎng)站上提供的版本為7.9.3。在AIX下的安裝很簡(jiǎn)單,IBM網(wǎng)站上下載的rpm格式的包。
在http://curl.haxx.se/docs/,您可以下載到UNIX格式的man幫助,里面有詳細(xì)的curl工具的使用說明。curl的用法為:curl [options] [URL...] 其中options是下載需要的參數(shù),大約有80多個(gè),curl的各個(gè)功能完全是依靠這些參數(shù)完成的。具體參數(shù)的使用,用戶可以參考curl的man幫助。
下面,本文就將結(jié)合具體的例子來說明怎樣利用curl進(jìn)行下載。
1、獲得一張頁面
使用命令:curl http://curl.haxx.se
這是最簡(jiǎn)單的使用方法。用這個(gè)命令獲得了http://curl.haxx.se指向的頁面,同樣,如果這里的URL指向的是一個(gè)文件或者一幅圖都可以直接下載到本地。如果下載的是HTML文檔,那么缺省的將不顯示文件頭部,即HTML文檔的header。要全部顯示,請(qǐng)加參數(shù) -i,要只顯示頭部,用參數(shù) -I。任何時(shí)候,可以使用 -v 命令看curl是怎樣工作的,它向服務(wù)器發(fā)送的所有命令都會(huì)顯示出來。為了斷點(diǎn)續(xù)傳,可以使用-r參數(shù)來指定傳輸范圍。
2、表單(Form)的獲取
在WEB頁面設(shè)計(jì)中,form是很重要的元素。Form通常用來收集并向網(wǎng)站提交信息。提交信息的方法有兩種,GET方法和POST方法。先討論GET方法,例如在頁面中有這樣一段:
<form method="GET" action="junk.cgi">
<input type=text name="birthyear">
<input type=submit name=press value="OK">
</form>
那么瀏覽器上會(huì)出現(xiàn)一個(gè)文本框和一個(gè)標(biāo)為“OK”的按鈕。按下這個(gè)按鈕,表單就用GET方法向服務(wù)器提交文本框的數(shù)據(jù)。例如原始頁面是在www.hotmail.com/when/birth.html看到的,然后您在文本框中輸入1905,然后按OK按鈕,那么瀏覽器的URL現(xiàn)在應(yīng)該是:“www.hotmail.com/when/junk.cgi?birthyear=1905&press=OK”
對(duì)于這種網(wǎng)頁,curl可以直接處理,例如想獲取上面的網(wǎng)頁,只要輸入:
curl "www.hotmail.com/when/junk.cgi?birthyear=1905&press=OK"
就可以了。
表單用來提交信息的第二種方法叫做POST方法,POST方法和GET方法的區(qū)別在于GET方法使用的時(shí)候,瀏覽器中會(huì)產(chǎn)生目標(biāo)URL,而POST不會(huì)。類似GET,這里有一個(gè)網(wǎng)頁:
<form method="POST" action="junk.cgi">
<input type=text name="birthyear">
<input type=submit name=press value="OK">
</form>
瀏覽器上也會(huì)出現(xiàn)一個(gè)文本框和一個(gè)標(biāo)為“OK”的按鈕。按下這個(gè)按鈕,表單用POST方法向服務(wù)器提交數(shù)據(jù)。這時(shí)的URL是看不到的,因此需要使用特殊的方法來抓取這個(gè)頁面:
curl -d "birthyear=1905&press=OK" www.hotmail.com/when/junk.cgi
這個(gè)命令就可以做到。
1995年年末,RFC 1867定義了一種新的POST方法,用來上傳文件。主要用于把本地文件上傳到服務(wù)器。此時(shí)頁面是這樣寫的:
<form method="POST" enctype='multipart/form-data' action="upload.cgi">
<input type=file name=upload>
<input type=submit name=press value="OK">
</form>
對(duì)于這種頁面,curl的用法不同:
curl -F upload=@localfilename -F press=OK [URL]
這個(gè)命令的實(shí)質(zhì)是將本地的文件用POST上傳到服務(wù)器。有關(guān)POST還有不少用法,用戶可以自己摸索。
3、使用PUT方法。
HTTP協(xié)議文件上傳的標(biāo)準(zhǔn)方法是使用PUT,此時(shí)curl命令使用-T參數(shù):
curl -T uploadfile www.uploadhttp.com/receive.cgi
4、有關(guān)認(rèn)證。
curl可以處理各種情況的認(rèn)證頁面,例如下載用戶名/密碼認(rèn)證方式的頁面(在IE中通常是出現(xiàn)一個(gè)輸入用戶名和密碼的輸入框):
curl -u name:password www.secrets.com
如果網(wǎng)絡(luò)是通過http代理服務(wù)器出去的,而代理服務(wù)器需要用戶名和密碼,那么輸入:
curl -U proxyuser:proxypassword http://curl.haxx.se
任何需要輸入用戶名和密碼的時(shí)候,只在參數(shù)中指定用戶名而空著密碼,curl可以交互式的讓用戶輸入密碼。
5、引用。
有些網(wǎng)絡(luò)資源訪問的時(shí)候必須經(jīng)過另外一個(gè)網(wǎng)絡(luò)地址跳轉(zhuǎn)過去,這用術(shù)語來說是:referer,引用。對(duì)于這種地址的資源,curl也可以下載:
curl -e http://curl.haxx.se daniel.haxx.se
6、指定用戶客戶端。
有些網(wǎng)絡(luò)資源首先需要判斷用戶使用的是什么瀏覽器,符合標(biāo)準(zhǔn)了才能夠下載或者瀏覽。此時(shí)curl可以把自己“偽裝”成任何其他瀏覽器:
curl -A "Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)" [URL]
這個(gè)指令表示curl偽裝成了IE5.0,用戶平臺(tái)是Windows 2000。(對(duì)方服務(wù)器是根據(jù)這個(gè)字串來判斷客戶端的類型的,所以即使使用AIX也無所謂)。使用:
curl -A "Mozilla/4.73 [en] (X11; U; Linux 2.2.15 i686)" [URL]
此時(shí)curl變成了Netscape,運(yùn)行在PIII平臺(tái)的Linux上了。
7、COOKIES
Cookie是服務(wù)器經(jīng)常使用的一種記憶客戶信息的方法。如果cookie被記錄在了文件中,那么使用命令:
curl -b stored_cookies_in_file www.cookiesite.com
curl可以根據(jù)舊的cookie寫出新cookie并發(fā)送到網(wǎng)站:
curl -b cookies.txt -c newcookies.txt www.cookiesite.com
8、加密的HTTP――HTTPS。
如果是通過OpenSSL加密的https協(xié)議傳輸?shù)木W(wǎng)頁,curl可以直接訪問:
curl https://that.secure.server.com
9、http認(rèn)證。
如果是采用證書認(rèn)證的http地址,證書在本地,那么curl這樣使用:
curl -E mycert.pem https://that.secure.server.com
參考讀物和注意事項(xiàng):curl非常博大,用戶要想使用好這個(gè)工具,除了詳細(xì)學(xué)習(xí)參數(shù)之外,還需要深刻理解http的各種協(xié)議與URL的各個(gè)語法。這里推薦幾個(gè)讀物:
RFC 2616 HTTP協(xié)議語法的定義。
RFC 2396 URL語法的定義。
RFC 2109 Cookie是怎樣工作的。
RFC 1867 HTTP如何POST,以及POST的格式。
curl是免費(fèi)軟件,IBM公司對(duì)curl不提供技術(shù)支持。