listen函數(shù)是網(wǎng)絡(luò)編程一個基本的函數(shù),而且它的backlog參數(shù)卻是和TCP協(xié)議息息相關(guān)的。我們來看一下一個backlog參數(shù)到底有多少秘密。
一、 為了理解backlog參數(shù),我們必須首先認(rèn)識listen函數(shù)。
#include<sys/socket.h>
int listen(int sockfd, int backlog);
listen函數(shù)僅由TCP服務(wù)器調(diào)用,它做兩件事情:
1、當(dāng)socket函數(shù)創(chuàng)建一個套接口時,它被假設(shè)為一個主動套裝口,也就是說,它是一個將調(diào)用connet發(fā)起連接的客戶套接口。listen函數(shù)把一個未連接的套接口轉(zhuǎn)換成一個被動套接口,指示內(nèi)核應(yīng)接受指向該套接口的連接請求。根據(jù)TCP狀態(tài)轉(zhuǎn)換圖,調(diào)用listen導(dǎo)致套接口從CLOSED狀態(tài)轉(zhuǎn)換到LISTEN狀態(tài)。
2、本函數(shù)的第二個參數(shù)規(guī)定了內(nèi)核應(yīng)該為相應(yīng)套接口排隊的最大連接個數(shù)。
為了更好的理解backlog參數(shù),我們必須認(rèn)識到內(nèi)核為任何一個給定的監(jiān)聽套接口維護兩個隊列:
1、未完成連接隊列(incomplete connection queue),每個這樣的SYN分節(jié)對應(yīng)其中一項:已由某個客戶發(fā)出并到達服務(wù)器,而服務(wù)器正在等待完成相應(yīng)的TCP三路握手過程。這些套接口處于SYN_RCVD狀態(tài)。
2、已完成連接隊列(completed connection queue),每個已完成TCP三路握手過程的客戶對應(yīng)其中一項。這些套接口處于ESTABLISHED狀態(tài)。
當(dāng)來自客戶的SYN到達時,TCP在未完成連接隊列中創(chuàng)建一個新項,然后響應(yīng)以三路握手的第二個分節(jié):服務(wù)器的SYN響應(yīng),其中稍帶對客戶SYN的ACK(即SYN+ACK)。這一項一直保留在未完成連接隊列中,直到三路握手的第三個分節(jié)(客戶對服務(wù)器SYN的ACK)到達或者該項超時為止(曾經(jīng)源自Berkeley的實現(xiàn)為這些未完成連接的項設(shè)置的超時值為75秒)。如果三路握手正常完成,該項就從未完成連接隊列移到已完成連接隊列的隊尾。當(dāng)進程調(diào)用accept時,已完成連接隊列中的隊頭項將返回給進程,或者如果該隊列為空,那么進程將被投入睡眠,直到TCP在該隊列中放入一項才喚醒它。
二、查看man手冊。看看man listen怎么說
![clip_image002[1] clip_image002[1]](http://www.shnenglu.com/images/cppblog_com/lynch/Windows-Live-Writer/listenbacklog_DEE6/clip_image002%5B1%5D_thumb.jpg)
可以看到man手冊是這樣描述backlog參數(shù)的:“backlog參數(shù)確定了connection隊列可以增長的最大長度”,如果connection隊列已滿(達到backlog確定的長度),那么新的connection請求到來時,客戶端會得到一個ECONNREFUSED error,或者,如果底層協(xié)議支持重發(fā),那么這個請求會被服務(wù)器忽略而使客戶端重新發(fā)送connection請求。
![clip_image004[1] clip_image004[1]](http://www.shnenglu.com/images/cppblog_com/lynch/Windows-Live-Writer/listenbacklog_DEE6/clip_image004%5B1%5D_thumb.jpg)
現(xiàn)在backlog用來確定已完成隊列(完成三次握手等待accept)的長度,而不再是已完成隊列和未完成連接隊列之和(linux 2.2之前)。
未完成隊列(incomplete connection queue)的長度現(xiàn)在由/proc/sys/net/ipv4/tcp_max_syn_backlog設(shè)置,在現(xiàn)在大多數(shù)最新linux內(nèi)核都是默認(rèn)512,這個設(shè)置有效的前提是系統(tǒng)的syncookies功能被禁用,如果系統(tǒng)的syncookies功能被啟用,那么這個設(shè)置是無效的。Syncookies是在內(nèi)核編譯的時候設(shè)置的,查看syncookies是否啟動:
cat /proc/sys/net/ipv4/tcp_syncookies
如果是“1”說明已啟用,為“0”說明未啟用。
那么為syncookies是做什么的呢,為什么它會和未完成隊列有關(guān)系。簡單的說它是為防范SYN Flood攻擊的設(shè)計。具體請參考“syncookies介紹”(http://baike.baidu.com/view/9033755.htm)。
繼續(xù)看backlog,如果我們給listen的backlog參數(shù)設(shè)值超過了/proc/sys/net/core/somaxconn,那么backlog參數(shù)的值為自動被改寫為/proc/sys/net/core/somaxconn的值,它的默認(rèn)大小為128.
更多資料可以查看
1、 man tcp
2、 man listen
3、 《unix網(wǎng)絡(luò)編程卷一》
4、 百度百科syncookies介紹:http://baike.baidu.com/view/9033755.htm