• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
                正如上篇日志所述,當不能預先確定報文體的長度時,不可能在頭中包含Content-Length域來指明報文體長度,此時就需要通過Transfer-Encoding域來確定報文體長度。
                通常情況下,Transfer-Encoding域的值應當為chunked,表明采用chunked編碼方式來進行報文體的傳輸。chunked編碼是HTTP/1.1 RFC里定義的一種編碼方式,因此所有的HTTP/1.1應用都應當支持此方式。
                chunked編碼的基本方法是將大塊數據分解成多塊小數據,每塊都可以自指定長度,其具體格式如下(BNF文法):
                Chunked-Body   = *chunk            //0至多個chunk
                                 last-chunk         //最后一個chunk
                                 trailer            //尾部
                                 CRLF               //結束標記符

               chunk          = chunk-size [ chunk-extension ] CRLF  
                                    chunk-data CRLF
               chunk-size     = 1*HEX
               last-chunk     = 1*("0") [ chunk-extension ] CRLF

               chunk-extension= *( ";" chunk-ext-name [ "=" chunk-ext-val ] )
               chunk-ext-name = token
               chunk-ext-val  = token | quoted-string
               chunk-data     = chunk-size(OCTET)
               trailer        = *(entity-header CRLF)     
               
                解釋:
                Chunked-Body表示經過chunked編碼后的報文體。報文體可以分為chunk, last-chunk,trailer和結束符四部分。chunk的數量在報文體中最少可以為0,無上限;每個chunk的長度是自指定的,即,起始的數據必然是16進制數字的字符串,代表后面chunk-data的長度(字節數)。這個16進制的字符串第一個字符如果是“0”,則表示chunk-size為0,該chunk為last-chunk,無chunk-data部分。可選的chunk-extension由通信雙方自行確定,如果接收者不理解它的意義,可以忽略。
                trailer是附加的在尾部的額外頭域,通常包含一些元數據(metadata, meta means "about information"),這些頭域可以在解碼后附加在現有頭域之后。
                實例分析:
                下面分析用ethereal抓包使用Firefox與某網站通信的結果(從頭域結束符后開始):
            Address  0..........................  f
            000c0                                31
            000d0    66 66 63 0d 0a ...............   // ASCII碼:1ffc\r\n, chunk-data數據起始地址為000d5
                     很明顯,“1ffc”為第一個chunk的chunk-size,轉換為int為8188.由于1ffc后馬上就是
                     CRLF,因此沒有chunk-extension.chunk-data的起始地址為000d5, 計算可知下一塊chunk的起始
                     地址為000d5+1ffc + 2=020d3,如下:
            020d0    .. 0d 0a 31 66 66 63 0d 0a .... // ASCII碼:\r\n1ffc\r\n
                     前一個0d0a是上一個chunk的結束標記符,后一個0d0a則是chunk-size和chunk-data的分隔符。
                     此塊chunk的長度同樣為8188, 依次類推,直到最后一塊
            100e0                          0d 0a 31
            100f0    65 61 39 0d 0a......            //ASII碼:\r\n\1ea9\r\n
                     此塊長度為0x1ea9 = 7849, 下一塊起始為100f5 + 1ea9 + 2 = 11fa0,如下:
            100a0    30 0d 0a 0d 0a                  //ASCII碼:0\r\n\r\n
                     “0”說明當前chunk為last-chunk, 第一個0d 0a為chunk結束符。第二個0d0a說明沒有trailer部分,整個Chunk-body結束。
                解碼流程:
                對chunked編碼進行解碼的目的是將分塊的chunk-data整合恢復成一塊作為報文體,同時記錄此塊體的長度。
                RFC2616中附帶的解碼流程如下:(偽代碼)
                length := 0         //長度計數器置0
                read chunk-size, chunk-extension (if any) and CRLF      //讀取chunk-size, chunk-extension
                                                                      //和CRLF
                while(chunk-size > 0 )   {            //表明不是last-chunk
                      read chunk-data and CRLF            //讀chunk-size大小的chunk-data,skip CRLF
                      append chunk-data to entity-body     //將此塊chunk-data追加到entity-body后
                      read chunk-size and CRLF          //讀取新chunk的chunk-size 和 CRLF
                }
                read entity-header      //entity-header的格式為name:valueCRLF,如果為空即只有CRLF
                while (entity-header not empty)   //即,不是只有CRLF的空行
                {
                   append entity-header to existing header fields
                   read entity-header
                }
                Content-Length:=length      //將整個解碼流程結束后計算得到的新報文體length
                                             //作為Content-Length域的值寫入報文中
                Remove "chunked" from Transfer-Encoding  //同時從Transfer-Encoding中域值去除chunked這個標記
                length最后的值實際為所有chunk的chunk-size之和,在上面的抓包實例中,一共有八塊chunk-size為0x1ffc(8188)的chunk,剩下一塊為0x1ea9(7849),加起來一共73353字節。
                注:對于上面例子中前幾個chunk的大小都是8188,可能是因為:"1ffc" 4字節,"\r\n"2字節,加上塊尾一個"\r\n"2字節一共8字節,因此一個chunk整體為8196,正好可能是發送端一次TCP發送的緩存大小。
               
                    


            Feedback

            # re: HTTP協議中的Tranfer-Encoding:chunked編碼解析  回復  更多評論   

            2007-12-26 17:08 by K‘
            寫得很清楚,
            受益匪淺,謝謝了~

            # re: HTTP協議中的Tranfer-Encoding:chunked編碼解析  回復  更多評論   

            2008-11-01 11:45 by mjk
            good
            欧美激情精品久久久久久久九九九 | 久久精品午夜一区二区福利| 一本色道久久88—综合亚洲精品| 奇米影视7777久久精品| 久久精品国产亚洲网站| 深夜久久AAAAA级毛片免费看| 狠狠色狠狠色综合久久| 日本道色综合久久影院| 亚洲精品白浆高清久久久久久 | 免费一级做a爰片久久毛片潮| 无码8090精品久久一区| 99久久婷婷免费国产综合精品| 2021国产成人精品久久| 色欲久久久天天天综合网精品| 国内精品久久久久久不卡影院| 综合久久国产九一剧情麻豆| 99久久精品费精品国产| 人妻精品久久久久中文字幕一冢本 | 精品一二三区久久aaa片| 国产精品女同一区二区久久| 亚洲国产精品无码久久| 无码国内精品久久人妻麻豆按摩| 国产精品久久久久影视不卡| 亚洲AV无码成人网站久久精品大| 久久久久国产一区二区| 大蕉久久伊人中文字幕| 国产一区二区三区久久精品| 久久天天躁狠狠躁夜夜网站| 久久久久久综合网天天| 久久久久国产精品人妻| 久久综合九色综合网站| 久久天天躁狠狠躁夜夜不卡| 久久久久亚洲精品中文字幕 | 久久精品国产亚洲AV嫖农村妇女| 久久久亚洲AV波多野结衣| 思思久久好好热精品国产| 亚洲国产综合久久天堂| 性做久久久久久久久| 伊人久久大香线蕉无码麻豆| 伊人久久大香线蕉AV一区二区 | 国产99久久九九精品无码|