大龍的博客

導(dǎo)航

<

2007年5月

>

日

一

二

三

四

五

六

29

30

1

2

3

4

5

6

7

8

9

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

留言簿(43)

收藏夾

ps (rss)

隨筆檔案

文章檔案

閱讀排行榜

評論排行榜

常用鏈接

統(tǒng)計

隨筆 - 864
文章 - 2
評論 - 378
引用 - 0

tcp_tw_recycle和tcp_timestamps導(dǎo)致connect失敗問題 --- 轉(zhuǎn)

   近來線上陸續(xù)出現(xiàn)了一些connect失敗的問題，經(jīng)過分析試驗，最終確認(rèn)和proc參數(shù)tcp_tw_recycle/tcp_timestamps相關(guān)；
1. 現(xiàn)象
    第一個現(xiàn)象：模塊A通過NAT網(wǎng)關(guān)訪問服務(wù)S成功，而模塊B通過NAT網(wǎng)關(guān)訪問服務(wù)S經(jīng)常性出現(xiàn)connect失敗，抓包發(fā)現(xiàn)：服務(wù)S端已經(jīng)收到了syn包，但沒有回復(fù)synack；另外，模塊A關(guān)閉了tcp timestamp，而模塊B開啟了tcp timestamp；
    第二個現(xiàn)象：不同主機上的模塊C（開啟timestamp），通過NAT網(wǎng)關(guān)（1個出口ip）訪問同一服務(wù)S，主機C1 connect成功，而主機C2 connect失敗；

2. 分析
    根據(jù)現(xiàn)象上述問題明顯和tcp timestmap有關(guān)；查看linux 2.6.32內(nèi)核源碼，發(fā)現(xiàn)tcp_tw_recycle/tcp_timestamps都開啟的條件下，60s內(nèi)同一源ip主機的socket connect請求中的timestamp必須是遞增的。
    源碼函數(shù)：tcp_v4_conn_request(),該函數(shù)是tcp層三次握手syn包的處理函數(shù)（服務(wù)端）；
    源碼片段：
       if (tmp_opt.saw_tstamp &&
            tcp_death_row.sysctl_tw_recycle &&
            (dst = inet_csk_route_req(sk, req)) != NULL &&
            (peer = rt_get_peer((struct rtable *)dst)) != NULL &&
            peer->v4daddr == saddr) {
            if (get_seconds() < peer->tcp_ts_stamp + TCP_PAWS_MSL &&
                (s32)(peer->tcp_ts - req->ts_recent) >
                            TCP_PAWS_WINDOW) {
                NET_INC_STATS_BH(sock_net(sk), LINUX_MIB_PAWSPASSIVEREJECTED);
                goto drop_and_release;
            }
        }
        tmp_opt.saw_tstamp：該socket支持tcp_timestamp
        sysctl_tw_recycle：本機系統(tǒng)開啟tcp_tw_recycle選項
        TCP_PAWS_MSL：60s，該條件判斷表示該源ip的上次tcp通訊發(fā)生在60s內(nèi)
        TCP_PAWS_WINDOW：1，該條件判斷表示該源ip的上次tcp通訊的timestamp 大于本次tcp

    分析：主機client1和 client2通過NAT網(wǎng)關(guān)（1個ip地址）訪問serverN，由于timestamp時間為系統(tǒng)啟動到當(dāng)前的時間，因此，client1和 client2的timestamp不相同；根據(jù)上述syn包處理源碼，在tcp_tw_recycle和tcp_timestamps同時開啟的條件下，timestamp大的主機訪問serverN成功，而timestmap小的主機訪問失敗；

    參數(shù)：/proc/sys/net/ipv4/tcp_timestamps - 控制timestamp選項開啟/關(guān)閉
          /proc/sys/net/ipv4/tcp_tw_recycle - 減少timewait socket釋放的超時時間

3. 解決方法
    echo 0 > /proc/sys/net/ipv4/tcp_tw_recycle;
    tcp_tw_recycle默認(rèn)是關(guān)閉的，有不少服務(wù)器，為了提高性能，開啟了該選項；
    為了解決上述問題，個人建議關(guān)閉tcp_tw_recycle選項，而不是timestamp；因為在tcp timestamp關(guān)閉的條件下，開啟tcp_tw_recycle是不起作用的；而tcp timestamp可以獨立開啟并起作用。
源碼函數(shù)： tcp_time_wait()
源碼片段：
if (tcp_death_row.sysctl_tw_recycle && tp->rx_opt.ts_recent_stamp)
    recycle_ok = icsk->icsk_af_ops->remember_stamp(sk);
        ......

        if (timeo < rto)
            timeo = rto;

        if (recycle_ok) {
            tw->tw_timeout = rto;
        } else {
            tw->tw_timeout = TCP_TIMEWAIT_LEN;
            if (state == TCP_TIME_WAIT)
                timeo = TCP_TIMEWAIT_LEN;
        }

        inet_twsk_schedule(tw, &tcp_death_row, timeo,
                   TCP_TIMEWAIT_LEN);

timestamp和tw_recycle同時開啟的條件下，timewait狀態(tài)socket釋放的超時時間和rto相關(guān)；否則，超時時間為TCP_TIMEWAIT_LEN，即60s；

    內(nèi)核說明文檔對該參數(shù)的介紹如下：
    tcp_tw_recycle - BOOLEAN
    Enable fast recycling TIME-WAIT sockets. Default value is 0.
    It should not be changed without advice/request of technical
    experts.

posted on 2013-02-17 18:58 大龍閱讀(369) 評論(0) 編輯收藏引用

只有注冊用戶登錄后才能發(fā)表評論。




網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品