一、連接至Web服務(wù)器
一個客戶端應(yīng)用(如Web瀏覽器)打開到Web服務(wù)器的HTTP端口的一個套接字(缺省為80)。
例如:http://www.myweb.com:8080/index.html, 在Java中,這將等同于代碼:
Soceet socket=new Socket("www.myweb.com",8080);
InputStream in=socket.getInputStream();
OutputStream out=socket.getOutputStream();
二、發(fā)送HTTP請求
通過連接,客戶端寫一個ASCII文本請求行,后跟0或多個HTTP頭標,一個空行和實現(xiàn)請求的任意數(shù)據(jù)。
一個請求由四個部分組成:請求行、請求頭標、空行和請求數(shù)據(jù)
1.請求行:請求行由三個標記組成:請求方法、請求URI和HTTP版本,它們用空格分隔。
例如:GET /index.html HTTP/1.1
HTTP規(guī)范定義了8種可能的請求方法:
l GET 檢索URI中標識資源的一個簡單請求
l HEAD 與GET方法相同,服務(wù)器只返回狀態(tài)行和頭標,并不返回請求文檔
l POST 服務(wù)器接受被寫入客戶端輸出流中的數(shù)據(jù)的請求
l PUT 服務(wù)器保存請求數(shù)據(jù)作為指定URI新內(nèi)容的請求
l DELETE 服務(wù)器刪除URI中命名的資源的請求
l OPTIONS 關(guān)于服務(wù)器支持的請求方法信息的請求
l TRACE Web服務(wù)器反饋Http請求和其頭標的請求
l CONNECT 已文檔化但當(dāng)前未實現(xiàn)的一個方法,預(yù)留做隧道處理
2.請求頭標:由關(guān)鍵字/值對組成,每行一對,關(guān)鍵字和值用冒號(:)分隔。
請求頭標通知服務(wù)器有關(guān)于客戶端的功能和標識,典型的請求頭標有:
l User-Agent 客戶端廠家和版本
l Accept 客戶端可識別的內(nèi)容類型列表
l Content-Length 附加到請求的數(shù)據(jù)字節(jié)數(shù)
3.空行:最后一個請求頭標之后是一個空行,發(fā)送回車符和退行,通知服務(wù)器以下不再有頭標。
4.請求數(shù)據(jù):使用POST傳送數(shù)據(jù),最常使用的是Content-Type和Content-Length頭標。
三、服務(wù)端接受請求并返回HTTP響應(yīng)
Web服務(wù)器解析請求,定位指定資源。服務(wù)器將資源副本寫至套接字,在此處由客戶端讀取。
一個響應(yīng)由四個部分組成;狀態(tài)行、響應(yīng)頭標、空行、響應(yīng)數(shù)據(jù)
1.狀態(tài)行:狀態(tài)行由三個標記組成:HTTP版本、響應(yīng)代碼和響應(yīng)描述。
l HTTP版本:向客戶端指明其可理解的最高版本。
l 響應(yīng)代碼:3位的數(shù)字代碼,指出請求的成功或失敗,如果失敗則指出原因。
l 響應(yīng)描述:為響應(yīng)代碼的可讀性解釋。
例如:HTTP/1.1 200 OK
HTTP響應(yīng)碼:
1xx:信息,請求收到,繼續(xù)處理
2xx:成功,行為被成功地接受、理解和采納
3xx:重定向,為了完成請求,必須進一步執(zhí)行的動作
4xx:客戶端錯誤:
2.響應(yīng)頭標:像請求頭標一樣,它們指出服務(wù)器的功能,標識出響應(yīng)數(shù)據(jù)的細節(jié)。
3.空行:最后一個響應(yīng)頭標之后是一個空行,發(fā)送回車符和退行,表明服務(wù)器以下不再有頭標。
4.響應(yīng)數(shù)據(jù):HTML文檔和圖像等,也就是HTML本身。
四、服務(wù)器關(guān)閉連接,瀏覽器解析響應(yīng)
1.瀏覽器首先解析狀態(tài)行,查看表明請求是否成功的狀態(tài)代碼。
2.然后解析每一個響應(yīng)頭標,頭標告知以下為若干字節(jié)的HTML。
3.讀取響應(yīng)數(shù)據(jù)HTML,根據(jù)HTML的語法和語義對其進行格式化,并在瀏覽器窗口中顯示它。
4.一個HTML文檔可能包含其它需要被載入的資源引用,瀏覽器識別這些引用,對其它的資源再進行額外的請求,此過程循環(huán)多次。
五、無狀態(tài)連接
HTTP模型是無狀態(tài)的,表明在處理一個請求時,Web服務(wù)器并不記住來自同一客戶端的請求。
六、實例
1.瀏覽器發(fā)出請求
GET /index.html HTTP/1.1
服務(wù)器返回響應(yīng)
HTTP /1.1 200 OK
Date: Apr 11 2006 15:32:08 GMT
Server: Apache/2.0.46(win32)
Content-Length: 119
Content-Type: text/html
<HTML>
<HEAD>
<LINK REL="stylesheet" HREF="index.css">
</HEAD>
<BODY>
<IMG SRC="image/logo.png">
</BODY>
</HTML>
2.瀏覽器發(fā)出請求
GET /index.css HTTP/1.1
服務(wù)器返回響應(yīng)
HTTP /1.1 200 OK
Date: Apr 11 2006 15:32:08 GMT
Server: Apache/2.0.46(win32)
Connection: Keep-alive, close
Content-Length: 70
Content-Type: text/plane
h3{
font-size:20px;
font-weight:bold;
color:#005A9C;
}
3.瀏覽器發(fā)出請求
GET image/logo.png HTTP/1.1
服務(wù)器返回響應(yīng)
HTTP /1.1 200 OK
Date: Apr 11 2006 15:32:08 GMT
Server: Apache/2.0.46(win32)
Connection: Keep-alive, close
Content-Length: 1280
Content-Type: text/plane
{Binary image data follows}
七、附錄
四種不同類型的頭標:
l 通用頭標:即可用于請求,也可用于響應(yīng),是作為一個整體而不是特定資源與事務(wù)相關(guān)聯(lián)。
l 請求頭標:允許客戶端傳遞關(guān)于自身的信息和希望的響應(yīng)形式。
l 響應(yīng)頭標:服務(wù)器和于傳遞自身信息的響應(yīng)。
l 實體頭標:定義被傳送資源的信息。即可用于請求,也可用于響應(yīng)。
頭標格式:<name>:<value><CRLF>
下表描述在HTTP/1.1中用到的頭標
l Accept定義客戶端可以處理的媒體類型,按優(yōu)先級排序,在一個以逗號為分隔的列表中,可以定義多種類型和使用通配符。例如:Accept: image/jpeg,image/png,*/*
l Accept-Charset 定義客戶端可以處理的字符集,按優(yōu)先級排序;在一個以逗號為分隔的列表中,可以定義多種類型和使用通配符。例如:Accept-Charset: iso-8859-1,*,utf-8
l Accept-Encoding定義客戶端可以理解的編碼機制。例如:Accept-Encoding:gzip,compress
l Accept-Language定義客戶端樂于接受的自然語言列表。例如:Accept-Language: en,de
l Accept-Ranges一個響應(yīng)頭標,它允許服務(wù)器指明:將在給定的偏移和長度處,為資源組成部分的接受請求。該頭標的值被理解為請求范圍的度量單位。例如Accept-Ranges: bytes或Accept-Ranges: none
l Age允許服務(wù)器規(guī)定自服務(wù)器生成該響應(yīng)以來所經(jīng)過的時間長度,以秒為單位。該頭標主要用于緩存響應(yīng)。例如:Age: 30
l Allow一個響應(yīng)頭標,它定義一個由位于請求URI中的次源所支持的HTTP方法列表。例如:Allow: GET,PUT
l aUTHORIZATION一個響應(yīng)頭標,用于定義訪問一種資源所必需的授權(quán)(域和被編碼的用戶ID與口令)。例如:Authorization: Basic YXV0aG9yOnBoaWw=
l Cache-Control一個用于定義緩存指令的通用頭標。例如:Cache-Control: max-age=30
l Connection一個用于表明是否保存socket連接為開放的通用頭標。例如:Connection: close或Connection: keep-alive
l Content-Base一種定義基本URI的實體頭標,為了在實體范圍內(nèi)解析相對URLs。如果沒有定義Content-Base頭標解析相對URLs,使用Content-Location URI(存在且絕對)或使用URI請求。例如:Content-Base: Http://www.myweb.com
l Content-Encoding一種介質(zhì)類型修飾符,標明一個實體是如何編碼的。例如:Content-Encoding: zip
l Content-Language用于指定在輸入流中數(shù)據(jù)的自然語言類型。例如:Content-Language: en
l Content-Length指定包含于請求或響應(yīng)中數(shù)據(jù)的字節(jié)長度。例如:Content-Length:382
l Content-Location指定包含于請求或響應(yīng)中的資源定位(URI)。如果是一絕。對URL它也作為被解析實體的相對URL的出發(fā)點。例如:Content-Location: http://www.myweb.com/news
l Content-MD5實體的一種MD5摘要,用作校驗和。發(fā)送方和接受方都計算MD5摘要,接受方將其計算的值與此頭標中傳遞的值進行比較。例如:Content-MD5: <base64 of 128 MD5 digest>
l Content-Range隨部分實體一同發(fā)送;標明被插入字節(jié)的低位與高位字節(jié)偏移,也標明此實體的總長度。例如:Content-Range: 1001-2000/5000
l Contern-Type標明發(fā)送或者接收的實體的MIME類型。例如:Content-Type: text/html
l Date發(fā)送HTTP消息的日期。例如:Date: Mon,10PR 18:42:51 GMT
l ETag一種實體頭標,它向被發(fā)送的資源分派一個唯一的標識符。對于可以使用多種URL請求的資源,ETag可以用于確定實際被發(fā)送的資源是否為同一資源。例如:ETag: "208f-419e-30f8dc99"
l Expires指定實體的有效期。例如:Expires: Mon,05 Dec 2008 12:00:00 GMT
l Form一種請求頭標,給定控制用戶代理的人工用戶的電子郵件地址。例如:From: webmaster@myweb.com
l Host被請求資源的主機名。對于使用HTTP/1.1的請求而言,此域是強制性的。例如:Host: www.myweb.com
l If-Modified-Since如果包含了GET請求,導(dǎo)致該請求條件性地依賴于資源上次修改日期。如果出現(xiàn)了此頭標,并且自指定日期以來,此資源已被修改,應(yīng)該反回一個304響應(yīng)代碼。例如:If-Modified-Since: Mon,10PR 18:42:51 GMT
l If-Match如果包含于一個請求,指定一個或者多個實體標記。只發(fā)送其ETag與列表中標記區(qū)配的資源。例如:If-Match: "208f-419e-308dc99"
l If-None-Match如果包含一個請求,指定一個或者多個實體標記。資源的ETag不與列表中的任何一個條件匹配,操作才執(zhí)行。例如:If-None-Match: "208f-419e-308dc99"
l If-Range指定資源的一個實體標記,客戶端已經(jīng)擁有此資源的一個拷貝。必須與Range頭標一同使用。如果此實體自上次被客戶端檢索以來,還不曾修改過,那么服務(wù)器只發(fā)送指定的范圍,否則它將發(fā)送整個資源。例如:Range: byte=0-499<CRLF>If-Range:"208f-419e-30f8dc99"
l If-Unmodified-Since只有自指定的日期以來,被請求的實體還不曾被修改過,才會返回此實體。例如:If-Unmodified-Since:Mon,10PR 18:42:51 GMT
l Last-Modified指定被請求資源上次被修改的日期和時間。例如:Last-Modified: Mon,10PR 18:42:51 GMT
l Location對于一個已經(jīng)移動的資源,用于重定向請求者至另一個位置。與狀態(tài)編碼302(暫時移動)或者301(永久性移動)配合使用。例如:Location: http://www2.myweb.com/index.jsp
l Max-Forwards 一個用于TRACE方法的請求頭標,以指定代理或網(wǎng)關(guān)的最大數(shù)目,該請求通過網(wǎng)關(guān)才得以路由。在通過請求傳遞之前,代理或網(wǎng)關(guān)應(yīng)該減少此數(shù)目。例如:Max-Forwards: 3
l Pragma一個通用頭標,它發(fā)送實現(xiàn)相關(guān)的信息。例如:Pragma: no-cache
l Proxy-Authenticate類似于WWW-Authenticate,便是有意請求只來自請求鏈(代理)的下一個服務(wù)器的認證。例如:Proxy-Authenticate: Basic realm-admin
l Proxy-Proxy-Authorization類似于授權(quán),但并非有意傳遞任何比在即時服務(wù)器鏈中更進一步的內(nèi)容。例如:Proxy-Proxy-Authorization: Basic YXV0aG9yOnBoaWw=
l Public列表顯示服務(wù)器所支持的方法集。例如:Public: OPTIONS,MGET,MHEAD,GET,HEAD
l Range指定一種度量單位和一個部分被請求資源的偏移范圍。例如:Range: bytes=206-5513
l Refener一種請求頭標域,標明產(chǎn)生請求的初始資源。對于HTML表單,它包含此表單的Web頁面的地址。例如:Refener: http://www.myweb.com/news/search.html
l Retry-After一種響應(yīng)頭標域,由服務(wù)器與狀態(tài)編碼503(無法提供服務(wù))配合發(fā)送,以標明再次請求之前應(yīng)該等待多長時間。此時間即可以是一種日期,也可以是一種秒單位。例如:Retry-After: 18
l Server一種標明Web服務(wù)器軟件及其版本號的頭標。例如:Server: Apache/2.0.46(Win32)
l Transfer-Encoding一種通用頭標,標明對應(yīng)被接受方反向的消息體實施變換的類型。例如:Transfer-Encoding: chunked
l Upgrade允許服務(wù)器指定一種新的協(xié)議或者新的協(xié)議版本,與響應(yīng)編碼101(切換協(xié)議)配合使用。例如:Upgrade: HTTP/2.0
l User-Agent定義用于產(chǎn)生請求的軟件類型(典型的如Web瀏覽器)。例如:User-Agent: Mozilla/4.0(compatible; MSIE 5.5; Windows NT; DigExt)
l Vary一個響應(yīng)頭標,用于表示使用服務(wù)器驅(qū)動的協(xié)商從可用的響應(yīng)表示中選擇響應(yīng)實體。例如:Vary: *
l Via一個包含所有中間主機和協(xié)議的通用頭標,用于滿足請求。例如:Via: 1.0 fred.com, 1.1 wilma.com
l Warning用于提供關(guān)于響應(yīng)狀態(tài)補充信息的響應(yīng)頭標。例如:Warning: 99 www.myweb.com Piano needs tuning
l www-Authenticate一個提示用戶代理提供用戶名和口令的響應(yīng)頭標,與狀態(tài)編碼401(未授權(quán))配合使用。響應(yīng)一個授權(quán)頭標。例如:www-Authenticate: Basic realm=zxm.mgmt