掌握HTTP雖然不是必須的,但是如果你知道它的工作原理,那么在學(xué)習(xí)JSP開(kāi)發(fā)中的某些知識(shí)就可以易如反掌了。
一,HTTP協(xié)議詳解之URL篇
http(超文本傳輸協(xié)議)是一個(gè)基于請(qǐng)求與響應(yīng)模式的、無(wú)狀態(tài)的、應(yīng)用層的協(xié)議,常基于TCP的連接方式,HTTP1.1版本中給出一種持續(xù)連接的機(jī)制,絕大多數(shù)的Web開(kāi)發(fā),都是構(gòu)建在HTTP協(xié)議之上的Web應(yīng)用。
HTTP URL (URL是一種特殊類(lèi)型的URI,包含了用于查找某個(gè)資源的足夠的信息)的格式如下:
http://host[":"port][abs_path]
http表示要通過(guò)HTTP協(xié)議來(lái)定位網(wǎng)絡(luò)資源;host表示合法的Internet主機(jī)域名或者IP地址;port指定一個(gè)端口號(hào),為空則使用缺省端口 80;abs_path指定請(qǐng)求資源的URI;如果URL中沒(méi)有給出abs_path,那么當(dāng)它作為請(qǐng)求URI時(shí),必須以“/”的形式給出,通常這個(gè)工作 瀏覽器自動(dòng)幫我們完成。
eg:
1、輸入:www.nit.edu.cn
瀏覽器自動(dòng)轉(zhuǎn)換成:http://www.nit.edu.cn/
2、http:192.168.0.116:8080/index.jsp
二、HTTP協(xié)議詳解之請(qǐng)求篇
http請(qǐng)求由三部分組成,分別是:請(qǐng)求行、消息報(bào)頭、請(qǐng)求正文
1、請(qǐng)求行以一個(gè)方法符號(hào)開(kāi)頭,以空格分開(kāi),后面跟著請(qǐng)求的URI和協(xié)議的版本,格式如下:Method Request-URI HTTP-Version CRLF
其中 Method表示請(qǐng)求方法;Request-URI是一個(gè)統(tǒng)一資源標(biāo)識(shí)符;HTTP-Version表示請(qǐng)求的HTTP協(xié)議版本;CRLF表示回車(chē)和換行(除了作為結(jié)尾的CRLF外,不允許出現(xiàn)單獨(dú)的CR或LF字符)。
請(qǐng)求方法(所有方法全為大寫(xiě))有多種,各個(gè)方法的解釋如下:
GET 請(qǐng)求獲取Request-URI所標(biāo)識(shí)的資源
POST 在Request-URI所標(biāo)識(shí)的資源后附加新的數(shù)據(jù)
HEAD 請(qǐng)求獲取由Request-URI所標(biāo)識(shí)的資源的響應(yīng)消息報(bào)頭
PUT 請(qǐng)求服務(wù)器存儲(chǔ)一個(gè)資源,并用Request-URI作為其標(biāo)識(shí)
DELETE 請(qǐng)求服務(wù)器刪除Request-URI所標(biāo)識(shí)的資源
TRACE 請(qǐng)求服務(wù)器回送收到的請(qǐng)求信息,主要用于測(cè)試或診斷
CONNECT 保留將來(lái)使用
OPTIONS 請(qǐng)求查詢(xún)服務(wù)器的性能,或者查詢(xún)與資源相關(guān)的選項(xiàng)和需求
應(yīng)用舉例:
GET方法:在瀏覽器的地址欄中輸入網(wǎng)址的方式訪問(wèn)網(wǎng)頁(yè)時(shí),瀏覽器采用GET方法向服務(wù)器獲取資源,eg:GET /form.html HTTP/1.1 (CRLF)
POST方法要求被請(qǐng)求服務(wù)器接受附在請(qǐng)求后面的數(shù)據(jù),常用于提交表單。
eg:POST /reg.jsp HTTP/ (CRLF)
Accept:image/gif,image/x-xbit,... (CRLF)
...
HOST:www.nit.edu.cn (CRLF)
Content-Length:22 (CRLF)
Connection:Keep-Alive (CRLF)
Cache-Control:no-cache (CRLF)
(CRLF) //該CRLF表示消息報(bào)頭已經(jīng)結(jié)束,在此之前為消息報(bào)頭
user=jeffrey&pwd=1234 //此行以下為提交的數(shù)據(jù)
HEAD方法與GET方法幾乎是一樣的,對(duì)于HEAD請(qǐng)求的回應(yīng)部分來(lái)說(shuō),它的HTTP頭部中包含的信息與通過(guò)GET請(qǐng)求所得到的信息是相同的。利 用這個(gè)方法,不必傳輸整個(gè)資源內(nèi)容,就可以得到Request-URI所標(biāo)識(shí)的資源的信息。該方法常用于測(cè)試超鏈接的有效性,是否可以訪問(wèn),以及最近是否 更新。
2、請(qǐng)求報(bào)頭后述
3、請(qǐng)求正文(略)
三,HTTP協(xié)議詳解之響應(yīng)篇
HTTP響應(yīng)也是由三個(gè)部分組成,分別是:狀態(tài)行、消息報(bào)頭、響應(yīng)正文
1、狀態(tài)行格式如下:
HTTP-Version Status-Code Reason-Phrase CRLF
其中,HTTP-Version表示服務(wù)器HTTP協(xié)議的版本;Status-Code表示服務(wù)器發(fā)回的響應(yīng)狀態(tài)代碼;Reason-Phrase表示狀態(tài)代碼的文本描述。
狀態(tài)代碼有三位數(shù)字組成,第一個(gè)數(shù)字定義了響應(yīng)的類(lèi)別,且有五種可能取值:
1xx:指示信息--表示請(qǐng)求已接收,繼續(xù)處理
2xx:成功--表示請(qǐng)求已被成功接收、理解、接受
3xx:重定向--要完成請(qǐng)求必須進(jìn)行更進(jìn)一步的操作
4xx:客戶(hù)端錯(cuò)誤--請(qǐng)求有語(yǔ)法錯(cuò)誤或請(qǐng)求無(wú)法實(shí)現(xiàn)
5xx:服務(wù)器端錯(cuò)誤--服務(wù)器未能實(shí)現(xiàn)合法的請(qǐng)求
常見(jiàn)狀態(tài)代碼、狀態(tài)描述、說(shuō)明:
200 OK //客戶(hù)端請(qǐng)求成功
400 Bad Request //客戶(hù)端請(qǐng)求有語(yǔ)法錯(cuò)誤,不能被服務(wù)器所理解
401 Unauthorized //請(qǐng)求未經(jīng)授權(quán),這個(gè)狀態(tài)代碼必須和WWW-Authenticate報(bào) //頭域一起使用
403 Forbidden //服務(wù)器收到請(qǐng)求,但是拒絕提供服務(wù)
404 Not Found //請(qǐng)求資源不存在,eg:輸入了錯(cuò)誤的URL
500 Internal Server Error //服務(wù)器發(fā)生不可預(yù)期的錯(cuò)誤
503 Server Unavailable //服務(wù)器當(dāng)前不能處理客戶(hù)端的請(qǐng)求,一段時(shí)間后, //可能恢復(fù)正常
eg:HTTP/1.1 200 OK (CRLF)
2、響應(yīng)報(bào)頭后述
3、響應(yīng)正文就是服務(wù)器返回的資源的內(nèi)容
四,HTTP協(xié)議詳解之消息報(bào)頭篇
HTTP消息由客戶(hù)端到服務(wù)器的請(qǐng)求和服務(wù)器到客戶(hù)端的響應(yīng)組成。請(qǐng)求消息和響應(yīng)消息都是由開(kāi)始行(對(duì)于請(qǐng)求消息,開(kāi)始行就是請(qǐng)求行,對(duì)于響應(yīng)消息,開(kāi)始行就是狀態(tài)行),消息報(bào)頭(可選),空行(只有CRLF的行),消息正文(可選)組成。
HTTP消息報(bào)頭包括普通報(bào)頭、請(qǐng)求報(bào)頭、響應(yīng)報(bào)頭、實(shí)體報(bào)頭。
每一個(gè)報(bào)頭域都是由名字+“:”+空格+值 組成,消息報(bào)頭域的名字是大小寫(xiě)無(wú)關(guān)的。
1、普通報(bào)頭
在普通報(bào)頭中,有少數(shù)報(bào)頭域用于所有的請(qǐng)求和響應(yīng)消息,但并不用于被傳輸?shù)膶?shí)體,只用于傳輸?shù)南ⅰ?br>eg:
Cache-Control 用于指定緩存指令,緩存指令是單向的(響應(yīng)中出現(xiàn)的緩存指令在請(qǐng)求中未必會(huì)出現(xiàn)),且是獨(dú)立的(一個(gè)消息的緩存指令不會(huì)影響另一個(gè)消息處理的緩存機(jī)制),HTTP1.0使用的類(lèi)似的報(bào)頭域?yàn)镻ragma。
請(qǐng)求時(shí)的緩存指令包括:no-cache(用于指示請(qǐng)求或響應(yīng)消息不能緩存)、no-store、max-age、max-stale、min-fresh、only-if-cached;
響應(yīng)時(shí)的緩存指令包括:public、private、no-cache、no-store、no-transform、must-revalidate、proxy-revalidate、max-age、s-maxage.
eg:為了指示IE瀏覽器(客戶(hù)端)不要緩存頁(yè)面,服務(wù)器端的JSP程序可以編寫(xiě)如下:response.sehHeader("Cache-Control","no-cache");
//response.setHeader("Pragma","no-cache");作用相當(dāng)于上述代碼,通常兩者//合用
這句代碼將在發(fā)送的響應(yīng)消息中設(shè)置普通報(bào)頭域:Cache-Control:no-cache
Date普通報(bào)頭域表示消息產(chǎn)生的日期和時(shí)間
Connection普通報(bào)頭域允許發(fā)送指定連接的選項(xiàng)。例如指定連接是連續(xù),或者指定“close”選項(xiàng),通知服務(wù)器,在響應(yīng)完成后,關(guān)閉連接
2、請(qǐng)求報(bào)頭
請(qǐng)求報(bào)頭允許客戶(hù)端向服務(wù)器端傳遞請(qǐng)求的附加信息以及客戶(hù)端自身的信息。
常用的請(qǐng)求報(bào)頭
Accept
Accept請(qǐng)求報(bào)頭域用于指定客戶(hù)端接受哪些類(lèi)型的信息。eg:Accept:image/gif,表明客戶(hù)端希望接受GIF圖象格式的資源;Accept:text/html,表明客戶(hù)端希望接受html文本。
Accept-Charset
Accept-Charset請(qǐng)求報(bào)頭域用于指定客戶(hù)端接受的字符集。eg:Accept-Charset:iso-8859-1,gb2312.如果在請(qǐng)求消息中沒(méi)有設(shè)置這個(gè)域,缺省是任何字符集都可以接受。
Accept-Encoding
Accept-Encoding請(qǐng)求報(bào)頭域類(lèi)似于Accept,但是它是用于指定可接受的內(nèi)容編碼。eg:Accept-Encoding:gzip.deflate.如果請(qǐng)求消息中沒(méi)有設(shè)置這個(gè)域服務(wù)器假定客戶(hù)端對(duì)各種內(nèi)容編碼都可以接受。
Accept-Language
Accept-Language請(qǐng)求報(bào)頭域類(lèi)似于Accept,但是它是用于指定一種自然語(yǔ)言。eg:Accept-Language:zh-cn.如果請(qǐng)求消息中沒(méi)有設(shè)置這個(gè)報(bào)頭域,服務(wù)器假定客戶(hù)端對(duì)各種語(yǔ)言都可以接受。
Authorization
Authorization請(qǐng)求報(bào)頭域主要用于證明客戶(hù)端有權(quán)查看某個(gè)資源。當(dāng)瀏覽器訪問(wèn)一個(gè)頁(yè)面時(shí),如果收到服務(wù)器的響應(yīng)代碼為401(未授權(quán)),可以發(fā)送一個(gè)包含Authorization請(qǐng)求報(bào)頭域的請(qǐng)求,要求服務(wù)器對(duì)其進(jìn)行驗(yàn)證。
Host(發(fā)送請(qǐng)求時(shí),該報(bào)頭域是必需的)
Host請(qǐng)求報(bào)頭域主要用于指定被請(qǐng)求資源的Internet主機(jī)和端口號(hào),它通常從HTTP URL中提取出來(lái)的,eg:
我們?cè)跒g覽器中輸入:http://www.nit.edu.cn/index.html
瀏覽器發(fā)送的請(qǐng)求消息中,就會(huì)包含Host請(qǐng)求報(bào)頭域,如下:
Host:www.nit.edu.cn
此處使用缺省端口號(hào)80,若指定了端口號(hào),則變成:Host:www.nit.edu.cn:指定端口號(hào)
User-Agent
我們上網(wǎng)登陸論壇的時(shí)候,往往會(huì)看到一些歡迎信息,其中列出了你的操作系統(tǒng)的名稱(chēng)和版本,你所使用的瀏覽器的名稱(chēng)和版本,這往往讓很多人感到很神奇,實(shí)際 上,服務(wù)器應(yīng)用程序就是從User-Agent這個(gè)請(qǐng)求報(bào)頭域中獲取到這些信息。User-Agent請(qǐng)求報(bào)頭域允許客戶(hù)端將它的操作系統(tǒng)、瀏覽器和其它 屬性告訴服務(wù)器。不過(guò),這個(gè)報(bào)頭域不是必需的,如果我們自己編寫(xiě)一個(gè)瀏覽器,不使用User-Agent請(qǐng)求報(bào)頭域,那么服務(wù)器端就無(wú)法得知我們的信息 了。
請(qǐng)求報(bào)頭舉例:
GET /form.html HTTP/1.1 (CRLF)
Accept:image/gif,image/x-xbitmap,image/jpeg,application/x-shockwave-flash,application/vnd.ms-excel,application/vnd.ms-powerpoint,application/msword,*/* (CRLF)
Accept-Language:zh-cn (CRLF)
Accept-Encoding:gzip,deflate (CRLF)
If-Modified-Since:Wed,05 Jan 2007 11:21:25 GMT (CRLF)
If-None-Match:W/"80b1a4c018f3c41:8317" (CRLF)
User-Agent:Mozilla/4.0(compatible;MSIE6.0;Windows NT 5.0) (CRLF)
Host:www.nit.edu.cn (CRLF)
Connection:Keep-Alive (CRLF)
(CRLF)
3、響應(yīng)報(bào)頭
響應(yīng)報(bào)頭允許服務(wù)器傳遞不能放在狀態(tài)行中的附加響應(yīng)信息,以及關(guān)于服務(wù)器的信息和對(duì)Request-URI所標(biāo)識(shí)的資源進(jìn)行下一步訪問(wèn)的信息。
常用的響應(yīng)報(bào)頭
Location
Location響應(yīng)報(bào)頭域用于重定向接受者到一個(gè)新的位置。Location響應(yīng)報(bào)頭域常用在更換域名的時(shí)候。
Server
Server響應(yīng)報(bào)頭域包含了服務(wù)器用來(lái)處理請(qǐng)求的軟件信息。與User-Agent請(qǐng)求報(bào)頭域是相對(duì)應(yīng)的。下面是
Server響應(yīng)報(bào)頭域的一個(gè)例子:
Server:Apache-Coyote/1.1
WWW-Authenticate
WWW-Authenticate響應(yīng)報(bào)頭域必須被包含在401(未授權(quán)的)響應(yīng)消息中,客戶(hù)端收到401響應(yīng)消息時(shí)候,并發(fā)送Authorization報(bào)頭域請(qǐng)求服務(wù)器對(duì)其進(jìn)行驗(yàn)證時(shí),服務(wù)端響應(yīng)報(bào)頭就包含該報(bào)頭域。
eg:WWW-Authenticate:Basic realm="Basic Auth Test!" //可以看出服務(wù)器對(duì)請(qǐng)求資源采用的是基本驗(yàn)證機(jī)制。
4、實(shí)體報(bào)頭
請(qǐng)求和響應(yīng)消息都可以傳送一個(gè)實(shí)體。一個(gè)實(shí)體由實(shí)體報(bào)頭域和實(shí)體正文組成,但并不是說(shuō)實(shí)體報(bào)頭域和實(shí)體正文要在一起發(fā)送,可以只發(fā)送實(shí)體報(bào)頭域。實(shí)體報(bào)頭定義了關(guān)于實(shí)體正文(eg:有無(wú)實(shí)體正文)和請(qǐng)求所標(biāo)識(shí)的資源的元信息。
常用的實(shí)體報(bào)頭
Content-Encoding
Content-Encoding實(shí)體報(bào)頭域被用作媒體類(lèi)型的修飾符,它的值指示了已經(jīng)被應(yīng)用到實(shí)體正文的附加內(nèi)容的編碼,因而要獲得Content- Type報(bào)頭域中所引用的媒體類(lèi)型,必須采用相應(yīng)的解碼機(jī)制。Content-Encoding這樣用于記錄文檔的壓縮方法,eg:Content- Encoding:gzip
Content-Language
Content-Language實(shí)體報(bào)頭域描述了資源所用的自然語(yǔ)言。沒(méi)有設(shè)置該域則認(rèn)為實(shí)體內(nèi)容將提供給所有的語(yǔ)言閱讀
者。eg:Content-Language:da
Content-Length
Content-Length實(shí)體報(bào)頭域用于指明實(shí)體正文的長(zhǎng)度,以字節(jié)方式存儲(chǔ)的十進(jìn)制數(shù)字來(lái)表示。
Content-Type
Content-Type實(shí)體報(bào)頭域用語(yǔ)指明發(fā)送給接收者的實(shí)體正文的媒體類(lèi)型。eg:
Content-Type:text/html;charset=ISO-8859-1
Content-Type:text/html;charset=GB2312
Last-Modified
Last-Modified實(shí)體報(bào)頭域用于指示資源的最后修改日期和時(shí)間。
Expires
Expires實(shí)體報(bào)頭域給出響應(yīng)過(guò)期的日期和時(shí)間。為了讓代理服務(wù)器或?yàn)g覽器在一段時(shí)間以后更新緩存中(再次訪問(wèn)曾訪問(wèn)過(guò)的頁(yè)面時(shí),直接從緩存中加載, 縮短響應(yīng)時(shí)間和降低服務(wù)器負(fù)載)的頁(yè)面,我們可以使用Expires實(shí)體報(bào)頭域指定頁(yè)面過(guò)期的時(shí)間。eg:Expires:Thu,15 Sep 2006 16:23:12 GMT
HTTP1.1的客戶(hù)端和緩存必須將其他非法的日期格式(包括0)看作已經(jīng)過(guò)期。eg:為了讓瀏覽器不要緩存頁(yè)面,我們也可以利用Expires實(shí)體報(bào)頭域,設(shè)置為0,jsp中程序如下:response.setDateHeader("Expires","0");
五,利用telnet觀察http協(xié)議的通訊過(guò)程
實(shí)驗(yàn)?zāi)康募霸恚?br>利用MS的telnet工具,通過(guò)手動(dòng)輸入http請(qǐng)求信息的方式,向服務(wù)器發(fā)出請(qǐng)求,服務(wù)器接收、解釋和接受請(qǐng)求后,會(huì)返回一個(gè)響應(yīng),該響應(yīng)會(huì)在telnet窗口上顯示出來(lái),從而從感性上加深對(duì)http協(xié)議的通訊過(guò)程的認(rèn)識(shí)。
實(shí)驗(yàn)步驟:
1、打開(kāi)telnet
1.1 打開(kāi)telnet
運(yùn)行-->cmd-->telnet
1.2 打開(kāi)telnet回顯功能
set localecho
2、連接服務(wù)器并發(fā)送請(qǐng)求
2.1 open www.nit.edu.cn 80 //注意端口號(hào)不能省略
HEAD /index.asp HTTP/1.0
Host:www.nit.edu.cn
/*我們可以變換請(qǐng)求方法,請(qǐng)求桂林電子主頁(yè)內(nèi)容,輸入消息如下*/
open www.nit.edu.cn 80
GET /index.asp HTTP/1.0 //請(qǐng)求資源的內(nèi)容
Host:www.nit.edu.cn
2.2 open www.sina.com.cn 80 //在命令提示符號(hào)下直接輸入telnet www.sina.com.cn 80
HEAD /index.asp HTTP/1.0
Host:www.sina.com.cn
3 實(shí)驗(yàn)結(jié)果:
3.1 請(qǐng)求信息2.1得到的響應(yīng)是:
HTTP/1.1 200 OK //請(qǐng)求成功
Server: Microsoft-IIS/5.0 //web服務(wù)器
Date: Thu,08 Mar 200707:17:51 GMT
Connection: Keep-Alive
Content-Length: 23330
Content-Type: text/html
Expries: Thu,08 Mar 2007 07:16:51 GMT
Set-Cookie: ASPSESSIONIDQAQBQQQB=BEJCDGKADEDJKLKKAJEOIMMH; path=/
Cache-control: private
//資源內(nèi)容省略
3.2 請(qǐng)求信息2.2得到的響應(yīng)是:
HTTP/1.0 404 Not Found //請(qǐng)求失敗
Date: Thu, 08 Mar 2007 07:50:50 GMT
Server: Apache/2.0.54 <Unix>
Last-Modified: Thu, 30 Nov 2006 11:35:41 GMT
ETag: "6277a-415-e7c76980"
Accept-Ranges: bytes
X-Powered-By: mod_xlayout_jh/0.0.1vhs.markII.remix
Vary: Accept-Encoding
Content-Type: text/html
X-Cache: MISS from zjm152-78.sina.com.cn
Via: 1.0 zjm152-78.sina.com.cn:80<squid/2.6.STABLES-20061207>
X-Cache: MISS from th-143.sina.com.cn
Connection: close
失去了跟主機(jī)的連接
按任意鍵繼續(xù)...
4 .注意事項(xiàng):1、出現(xiàn)輸入錯(cuò)誤,則請(qǐng)求不會(huì)成功。
2、報(bào)頭域不分大小寫(xiě)。
3、更深一步了解HTTP協(xié)議,可以查看RFC2616,在http://www.letf.org/rfc上找到該文件。
4、開(kāi)發(fā)后臺(tái)程序必須掌握http協(xié)議