超時與重傳
TCP是面向連接的可靠的運輸層。當數據丟失時,TCP需要重傳包。TCP通過設置定時器解決這種問題。
對每個連接,TCP有4個不同的定時器:
1)重傳定時器:用于當希望收到另一端的確認,而沒有收到時。
2)堅持定時器:使窗口大小信息保持不斷流動。
3)保活定時器:可檢測空閑連接另一端何時崩潰或重啟。
4)2MSL定時器:測量TIME_WAIT狀態的時間。
PTCP本身是沒有提供定時器的,而通過方法GetNextClock讓調用者獲取下一個定時器觸發的時機,當定時器觸發下一個超時時,需要調用方法NotifyClock。
超時時間設置
TCP設置獲得確認ACK包的超時時間設置序列可能為1.5S,3S,6S,12S,24S,48S,64S,當超時持續時間多于9分鐘時,TCP會被復位(RST),即“指數退避”。
那么這個超時值是怎么計算呢?
如果能很好的估計RTT話,如果確認包在一個RTT之內沒有收到回報,那么可以認為丟包發生。
TCP最初的RTT估算方法為
R = aR+(1-a)M
其中平滑因子a取為90%,M表示這次測量的RTT,即這個包發送到獲取ACK的時間間隔。
這個算法通過平滑因子來避免R的值受新的M的浮動過大的影響。然而這恰恰在RTT浮動比較大的連接中無法及時的反應連接情況。并且網絡處于飽和狀態時,頻繁重傳會導致火上燒油。Jacobson對此設計了新的算法:
Err = M - A
A = A+g*Err
D = D + h(|Err| -D)
RTO = A + 4D
增量g為0.125(1/8),Err為上一個得到的值和新的RTT的差。A為上一個測到的增量后的數據,h為0.25。
當RTT變化大時,Err也會變大,導致D也會變大,導致RTO快速上升。某一次連接的估值和真正的RTT關系估下:

PTCP實現如下:
PTCP設置最大超時時間為60S。當收到ACK時,計算RTT是通過PTCP頭部的TimeStamp差值計算,所以Karn算法在此不管用。RTO的算法和上面所述一致:
1)Err = rtt - m_rx_srtt
2)D=D+0.25*(abs(Err-D))
3)m_rx_srtt = m_rx_srtt + err/8
4)RTO = m_rx_srtt+D
下面的代碼實現,有一定的不同,但仔細分析和上面算法是一致的。
- bool PseudoTcp::process(Segment& seg) {
- ......
-
- if ((seg.ack > m_snd_una) && (seg.ack <= m_snd_nxt)) {
-
- if (seg.tsecr) {
- long rtt = talk_base::TimeDiff(now, seg.tsecr);
- if (rtt >= 0) {
- if (m_rx_srtt == 0) {
- m_rx_srtt = rtt;
- m_rx_rttvar = rtt / 2;
- } else {
- m_rx_rttvar = (3 * m_rx_rttvar + abs(long(rtt - m_rx_srtt))) / 4;
- m_rx_srtt = (7 * m_rx_srtt + rtt) / 8;
- }
- m_rx_rto = bound(MIN_RTO, m_rx_srtt +
- talk_base::_max<uint32>(1, 4 * m_rx_rttvar), MAX_RTO);
- } else {
- ASSERT(false);
- }
- }
- ......
- }
當重傳后,仍然超時時,PTCP也采用指數退避算法。
擁塞避免算法
擁塞避免算法通常和慢啟動算法一起使用,主要是限制發送方的流量。慢啟動的目的是,不要過快的發送數據導致中間的路由器填滿緩沖,而擁塞避免算法是當發現到網絡被擁塞時限制發送方處理丟失分組的一種方法。
擁塞避免算法和慢啟動算法同時在一個連接上維護兩個變量cwnd和ssthresh。
1)對一個給定連接cwnd初始化為1。
2)當擁塞發生時(超時或者受到重復的第三個ack)時ssthreth取當前窗口的一半,如果超時引起的擁塞,則cwnd取為1。
3)當新的數據包受到確認時,如果cwnd<ssthreth則進行慢啟動算法,否則cwnd在每個確認增加1/cwnd。
快速重傳與快速恢復算法
為什么上面判斷擁塞時,獲得三個以上重復的ACK時,認為產生擁塞了呢?
因為,當接收方收到失序的報文段時,立即發送需要收到的下一個報文段,然而發送方發送兩個以上報文時,因報文的路由不一樣,會產生短暫的失序,為了避免因此而產生的重傳,把擁塞判斷設置為3個以上。
當收到三個以上重復報文段時,發送方認為此包被丟失,于是立即重傳丟失報文段,不會等到超時定時器溢出。這就是快速重傳算法。
當發送方重傳后,會持續發送后面沒有發送的數據,而不啟動慢啟動,等待ACK,是因為發送方收到了連續的3個以上ACK說明,接收方收到了3個以上數據報文,并緩存起來了。這就是快速恢復算法,實現如下:
1)當收到3個重復ACK時ssthreth設置為當前窗口的一半,并cwnd設置為ssthresh+3。
2)每次收到另一個重復的ACK時,cwnd增加一個報文段并重傳。
3)當下一個ACK到達時cwdn設置為ssthreth,即采用擁塞避免,速率減半。
對于重傳PTCP有一點不同,就是上述第一步,當收到重復3個ACK時,ssthresh設置為還未確認的字節數的一半。
- bool PseudoTcp::process(Segment& seg) {
- ......
- if ((seg.ack > m_snd_una) && (seg.ack <= m_snd_nxt)) {
- ......
- if (m_dup_acks >= 3) {
- if (m_snd_una >= m_recover) {
- uint32 nInFlight = m_snd_nxt - m_snd_una;
- m_cwnd = talk_base::_min(m_ssthresh, nInFlight + m_mss);
- m_dup_acks = 0;
- } else {
- if (!transmit(m_slist.begin(), now)) {
- closedown(ECONNABORTED);
- return false;
- }
- m_cwnd += m_mss - talk_base::_min(nAcked, m_cwnd);
- }
- } else {
- m_dup_acks = 0;
-
- if (m_cwnd < m_ssthresh) {
- m_cwnd += m_mss;
- } else {
- m_cwnd += talk_base::_max<uint32>(1, m_mss * m_mss / m_cwnd);
- }
- }
- }
- else if (seg.ack == m_snd_una) {
-
- m_snd_wnd = static_cast<uint32>(seg.wnd) << m_swnd_scale;
-
- if (seg.len > 0) {
-
- } else if (m_snd_una != m_snd_nxt) {
- m_dup_acks += 1;
- if (m_dup_acks == 3) {
- if (!transmit(m_slist.begin(), now)) {
- closedown(ECONNABORTED);
- return false;
- }
- m_recover = m_snd_nxt;
- uint32 nInFlight = m_snd_nxt - m_snd_una;
- m_ssthresh = talk_base::_max(nInFlight / 2, 2 * m_mss);
- m_cwnd = m_ssthresh + 3 * m_mss;
- } else if (m_dup_acks > 3) {
- m_cwnd += m_mss;
- }
- } else {
- m_dup_acks = 0;
- }
- }
- ......
- }
重新分組
當TCP超時重傳時,可以允許以更大的且不大于MSS的報文發送,即合并后續的數據一起發送,PTCP也是如此處理的。