• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            隨筆-161  評(píng)論-223  文章-30  trackbacks-0
            字符集合 
               依據(jù)RFC3986 2規(guī)范,HTTP URI中允許出現(xiàn)的US-ASCII字符的子集,可以分成保留未保留轉(zhuǎn)義這幾類(lèi),每類(lèi)的全部字符列表如下
                  ● 保留:  : / ? # [ ] @ ! $ & '( ) * + ,; =共18個(gè),一般用于URI部件分隔符。
                  ● 未保留:  a-z A-Z 0-9 - . _ ~共66個(gè),一般用于部件內(nèi)數(shù)據(jù)。
                  ● 轉(zhuǎn)義:  %HEXHEX,HEX表示一個(gè)十六進(jìn)制數(shù)字[0-9A-F]或[0-9a-f],通常采用大寫(xiě),這兩個(gè)HEX就表示一個(gè)US-ASCII字符代碼,轉(zhuǎn)義用于在URI內(nèi)部插入保留字符及原本不支持的字符。


            編碼原理
             
               當(dāng)構(gòu)建URI的部件時(shí),其中的一個(gè)八位字節(jié)碼相應(yīng)的字符超出了允許的集合或被用作分隔符,就需要編碼,正是在這個(gè)時(shí)候,由實(shí)現(xiàn)決定保留字符的哪些被用于子部件分隔符,哪個(gè)被安全地用于數(shù)據(jù)。一個(gè)百分號(hào)編碼的八位字節(jié)碼被編碼成一個(gè)三重字符, 包括百分號(hào)字符"%"和隨后的兩個(gè)十六進(jìn)制數(shù)字展示那個(gè)八位字節(jié)的數(shù)值。

            字符映射表
               用于快速判斷一個(gè)字符是否為未保留字符,定義如下
             1const char http_uri_table[256= 
             2{
             3    /* 0 */
             4    00000000,   00000000,
             5    00000000,   00000000,
             6    00000000,   00000110,
             7    11111111,   11000000,
             8    /* 64 */
             9    01111111,   11111111,
            10    11111111,   11100001,
            11    01111111,   11111111,
            12    11111111,   11100010,
            13    /* 128 */
            14    00000000,   00000000,
            15    00000000,   00000000,
            16    00000000,   00000000,
            17    00000000,   00000000,
            18    /* 192 */
            19    00000000,   00000000,
            20    00000000,   00000000,
            21    00000000,   00000000,
            22    00000000,   00000000,
            23}
            ;
            24#define HTTP_CHAR_IS_UNRESERVED(c) (http_uri_table[(unsigned char)(c)])

            接口實(shí)現(xiàn)
               http_uri_encode有2個(gè)版本:一個(gè)帶uri長(zhǎng)度參數(shù)len,另一個(gè)則不帶。
             1void http_uri_encode(const char *uri, size_t len, std::string &str,bool space_as_plus/*=false*/)
             2{
             3    char c,buf[4];
             4
             5    for (size_t i = 0; i < len; i++{
             6        c = uri[i];
             7        if (HTTP_CHAR_IS_UNRESERVED(c)) {
             8            str.push_back(c);
             9        }
            else if(c == ' ' && space_as_plus) {
            10            str.push_back('+');
            11        }
            else{
            12            sprintf(buf,"%%%02X",(unsigned char)c);
            13            str.append(buf);
            14        }

            15    }

            16}

            17
            18void http_uri_encode(const char *uri, std::string &str,bool space_as_plus/*=false*/)
            19{
            20    char c,buf[4];
            21
            22    for (; c=*uri; ++uri) {
            23        if (HTTP_CHAR_IS_UNRESERVED(c)) {
            24            str.push_back(c);
            25        }
            else if(c == ' ' && space_as_plus) {
            26            str.push_back('+');
            27        }
            else{
            28            sprintf(buf,"%%%02X",(unsigned char)c);
            29            str.append(buf);
            30        }

            31    }

            32}


            解碼原理
               當(dāng)解析URI的時(shí)候,首先要根據(jù)HTTP協(xié)議分離各個(gè)部件,再將各部件內(nèi)可能的轉(zhuǎn)義數(shù)據(jù)進(jìn)行反轉(zhuǎn)義以還原。

            接口實(shí)現(xiàn)
               http_uri_decode有2種版本,一種提供存儲(chǔ)解碼后的uri參數(shù)str;另一種則不提供即在原uri上解碼,返回實(shí)際解碼后的字節(jié)數(shù)。每種版本又有2個(gè)版本,一個(gè)帶uri長(zhǎng)度參數(shù)len,另一個(gè)則不帶。
             1void http_uri_decode(const char *uri, size_t len, std::string &str, int decode_plus /*= 0*/)
             2{
             3    char c,t[3]={'\0'};
             4
             5    for (size_t i = 0; i < len; i++{
             6        c = uri[i];
             7        if (c == '?'{
             8            if(decode_plus < 0)
             9                decode_plus = 1;
            10        }
             else if (c == '+' && decode_plus) {
            11            c = ' ';
            12        }
             else if (c == '%' && isxdigit(uri[i+1]) && isxdigit(uri[i+2])) {
            13            t[0= uri[++i],t[1= uri[++i];
            14            c = (char)strtol(t, NULL, 16);
            15        }

            16        str.push_back(c);
            17    }

            18}

            19
            20void http_uri_decode(const char *uri, std::string &str, int decode_plus/*=0*/)
            21{
            22    char c,t[3]={'\0'};
            23
            24    for (; c=*uri; ++uri) {
            25        if (c == '?'{
            26            if(decode_plus < 0)
            27                decode_plus = 1;
            28        }
             else if (c == '+' && decode_plus) {
            29            c = ' ';
            30        }
             else if (c == '%' && isxdigit(*(uri+1)) && isxdigit(*(uri+2))) {
            31            t[0= *++uri,t[1= *++uri;
            32            c = (char)strtol(t, NULL, 16);
            33        }

            34        str.push_back(c);
            35    }

            36}

            37
            38//in place decode function
            39size_t http_uri_decode(char *uri, size_t len, int decode_plus/*=0*/)
            40{
            41    char c,t[3]={'\0'};
            42    size_t i,j;
            43
            44    for (i=j=0; i < len; ++i,++j) {
            45        c = uri[i];    
            46        if (c == '?'{
            47            if(decode_plus < 0)
            48                decode_plus = 1;
            49        }
             else if (c == '+' && decode_plus) {
            50            c = ' ';
            51        }
             else if (c == '%' && isxdigit(uri[i+1]) && isxdigit(uri[i+2])) {
            52            t[0= uri[++i],t[1= uri[++i];
            53            c = (char)strtol(t, NULL, 16);
            54        }

            55        uri[j] = c;
            56    }

            57
            58    uri[j] = '\0';
            59    return j;
            60}

            61
            62size_t http_uri_decode(char *uri,int decode_plus/*=0*/)
            63{
            64    char c,*s=uri,*d=uri,t[3]={'\0'};
            65
            66    for (; c=*s; ++s,++d) {
            67        if (c == '?'{
            68            if(decode_plus < 0)
            69                decode_plus = 1;
            70        }
             else if (c == '+' && decode_plus) {
            71            c = ' ';
            72        }
             else if (c == '%' && isxdigit(*(s+1)) && isxdigit(*(s+2))) {
            73            t[0= *++s,t[1= *++s;
            74            c = (char)strtol(t, NULL, 16);
            75        }

            76        *= c;
            77    }

            78
            79    *d= '\0';
            80    return d-uri;
            81}
            posted on 2015-02-10 18:40 春秋十二月 閱讀(4746) 評(píng)論(1)  編輯 收藏 引用 所屬分類(lèi): Network

            評(píng)論:
            # re: HTTP URI編解碼 2015-03-12 09:08 | wxj
            好文,收藏  回復(fù)  更多評(píng)論
              
            国产午夜福利精品久久| 麻豆久久| 精品久久久久久中文字幕人妻最新| 久久久久亚洲AV成人网人人网站| 伊人久久精品无码二区麻豆| 久久夜色精品国产噜噜亚洲AV| 色综合久久综合网观看| 亚洲欧洲中文日韩久久AV乱码| 天天躁日日躁狠狠久久| 久久伊人精品青青草原高清| 18禁黄久久久AAA片| 69SEX久久精品国产麻豆| 色欲综合久久躁天天躁| 国产成人久久精品区一区二区| 伊人久久大香线蕉成人| 亚洲精品高清国产一久久| 久久亚洲精品无码aⅴ大香| 99久久综合国产精品二区| 人妻无码αv中文字幕久久| 久久精品成人欧美大片| 国产精品青草久久久久婷婷| 国产精品久久久久久久人人看| 99久久夜色精品国产网站| 亚洲国产精品无码久久| 久久久久无码国产精品不卡| 91精品国产91热久久久久福利| 亚洲国产另类久久久精品| 国产精品久久久久久久久软件 | 国产69精品久久久久观看软件 | 久久久久亚洲AV片无码下载蜜桃| 国产AV影片久久久久久| 潮喷大喷水系列无码久久精品| 亚洲AV无码久久精品成人| 午夜精品久久久久久毛片| 伊人久久大香线蕉av不变影院| 久久只这里是精品66| 国产精品99久久久久久宅男小说| 综合久久给合久久狠狠狠97色 | 久久综合久久性久99毛片| AA级片免费看视频久久| 久久99国产一区二区三区|