牽著老婆滿街逛

嚴以律己,寬以待人. 三思而后行.
GMail/GTalk: yanglinbo#google.com;
MSN/Email: tx7do#yahoo.com.cn;
QQ: 3 0 3 3 9 6 9 2 0 .

libjingle源碼解析(5)-【PseudoTcp】建立UDP之上的TCP(3)：對成塊數據流的處理

轉載自:http://blog.csdn.net/leehark/article/details/7671462

PseudoTcp對成塊數據流的處理

上一篇談論了TCP和PTCP對交互數據流的處理方法。這一篇談論另一個數據流--成塊數據流。成塊數據流主要采用滑動窗口協議和慢啟動算法來控制成塊數據的流量。

滑動窗口

滑動窗口允許發送方在停止并等待確認前可以連續發送多個分組。因此發送方不必每發一個就停下來等待，這樣可以加速數據的傳輸。這個Nagle算法沖突么？不會，因為成塊數據流的分組都是滿載傳輸的，根據Nagle算法，當等待發送數據的大小和窗口大小都大于MSS時，會立即發送。

如果發送方一直傳輸數據會出現經常丟包的現象，特別是快的發送方發給慢的接收方。當接收方還沒有處理數據，發送方就接連發來了數據會填滿接收方的緩沖區，從而后續的數據將被丟棄，為了減少網絡上丟包的次數，用一種機制來限制發送方傳輸數據。

因此出現了滑動窗口，如下圖：

滑動窗口分為4個部分：

上圖1~3為發送并確認的數據段

上圖4~6為已經發送，但是沒有被確認的數據段

上圖7~9為可用的窗口，即滑動窗口，發送方還可以發送的數據段空間

上圖10以上為不能夠發送。

當接收方確認數據后，滑動窗口兩邊不斷的向右移動。

窗口合攏：當發送方發送數據并等待確認時，滑動窗口的左邊向右移動。

窗口張開：當接收方收到數據并確認且釋放緩沖區數據時，右邊向右移動。

窗口收縮：當接收方的緩沖區大小變小時，右邊向左移動，但不建議使用這種方式。

滑動窗口時通過窗口大小來更新。當接收方收到數據后，重新計算接收緩沖區的大小，并通告發送方。如果通告窗口大小為0，則發送方不能再發送數據，等到窗口大小為非0，這樣可以有效的避免因接收方緩沖區滿導致的分組的丟失。

那么PTCP是怎么實現的呢？

PTCP通過m_rbuf_len來標示接收緩沖區大小。如果緩沖區大小小于65536時，m_rwnd_scale為0，m_rcv_wnd標示窗口大小，而大于65535時，通過如下算法來調整m_rbuf_len和m_rwnd_scale。調整后根據緩沖區中可用空間來更新窗口大小m_rcv_wnd 。為什么選擇65535為界限呢？因為在PTCP的頭部中window字段的長度為16個bit，只能支持窗口打小范圍0~65535（包含65535）。

[cpp] view plain copy

void
PseudoTcp::resizeReceiveBuffer(uint32 new_size) {
uint8 scale_factor = 0;
//處理大于65536字節的緩沖區，更新scale_factor
while (new_size > 0xFFFF) {
++scale_factor;
new_size >>= 1;
}
new_size <<= scale_factor;//當緩沖區大小大于65535時，大小會被調整
bool result = m_rbuf.SetCapacity(new_size);//更新緩沖區
m_rbuf_len = new_size;//更新緩沖區大小
m_rwnd_scale = scale_factor;//更新窗口擴大因子
m_ssthresh = new_size;
size_t available_space = 0;
m_rbuf.GetWriteRemaining(&available_space);
m_rcv_wnd = available_space;//更新可用窗口大小
}

當PTCP三次握手時，通過PTCP選項TCP_OPT_WND_SCALE來通告對方m_rwnd_scale的大小。

[cpp] view plain copy

void
PseudoTcp::queueConnectMessage() {
talk_base::ByteBuffer buf(talk_base::ByteBuffer::ORDER_NETWORK);
buf.WriteUInt8(CTL_CONNECT);
if (m_support_wnd_scale) {//判斷窗口擴大選項是否開啟
buf.WriteUInt8(TCP_OPT_WND_SCALE);//增加窗口擴大選項
buf.WriteUInt8(1);
buf.WriteUInt8(m_rwnd_scale);//窗口擴大擴大因子
}
m_snd_wnd = buf.Length();
queue(buf.Data(), buf.Length(), true);
}

PTCP接收窗口擴大因子對應的控制包之后，通過parseOptions方法來解析此包如下：

[cpp] view plain copy

void
PseudoTcp::parseOptions(const char* data, uint32 len) {
std::set<uint8> options_specified;
talk_base::ByteBuffer buf(data, len);
while (buf.Length()) {
uint8 kind = TCP_OPT_EOL;
buf.ReadUInt8(&kind);
if (kind == TCP_OPT_EOL) {//判斷是否到了緩沖區末
break;
} else if (kind == TCP_OPT_NOOP) {//空選項
continue;
}
UNUSED(len);
uint8 opt_len = 0;
buf.ReadUInt8(&opt_len);
if (opt_len <= buf.Length()) {
applyOption(kind, buf.Data(), opt_len);//更新選項對應的值
buf.Consume(opt_len);
} else {
return;
}
options_specified.insert(kind);
}
if (options_specified.find(TCP_OPT_WND_SCALE) == options_specified.end()) {
if (m_rwnd_scale > 0) {
resizeReceiveBuffer(DEFAULT_RCV_BUF_SIZE);//如果對端不支持窗口擴大因子，且本端的緩沖區大小超過了65535，則改為60K，因為必須兩端都支持窗口擴大因子才能使用m_swnd_scale。
m_swnd_scale = 0;
}
}
}

接收方調整窗口大小，如下：

窗口合攏：當接收方收到數據時，會從窗口大小里減去把接收緩沖區消耗的數據大小。

[cpp] view plain copy

bool PseudoTcp::process(Segment& seg) {
......
uint32 nOffset = seg.seq - m_rcv_nxt;
talk_base::StreamResult result = m_rbuf.WriteOffset(seg.data, seg.len,
nOffset, NULL);
ASSERT(result == talk_base::SR_SUCCESS);
UNUSED(result);
if (seg.seq == m_rcv_nxt) {//如果當前收到的分組恰好是下一個需要的分組
m_rbuf.ConsumeWriteBuffer(seg.len);//消耗接收緩沖區
m_rcv_nxt += seg.len;//更新下一個需要的分組
m_rcv_wnd -= seg.len;//更新窗口大小，減去剛才消耗的緩沖區
bNewData = true;
RList::iterator it = m_rlist.begin();
while ((it != m_rlist.end()) && (it->seq <= m_rcv_nxt)) {
if (it->seq + it->len > m_rcv_nxt) {
sflags = sfImmediateAck; // (Fast Recovery)
uint32 nAdjust = (it->seq + it->len) - m_rcv_nxt;
m_rbuf.ConsumeWriteBuffer(nAdjust);
m_rcv_nxt += nAdjust;//之前收到的分組包含了下一個需要的seq number，調整m_rcv_nxt
m_rcv_wnd -= nAdjust;//m_rcv_nxt增加了，且接收緩沖區被填充了，窗口大小也隨之更新。
}
it = m_rlist.erase(it);
}
} else {//拿到的分組不是所需要的，但是有效的分組
RSegment rseg;
rseg.seq = seg.seq;
rseg.len = seg.len;
RList::iterator it = m_rlist.begin();
while ((it != m_rlist.end()) && (it->seq < rseg.seq)) {
++it;
}
m_rlist.insert(it, rseg);//更新接收分組列表，當收到下一個所需要的分組時，重組恢復所用。
}
......
}

窗口張開：當應用層調用Recv來獲取PTCP接收的數據時，PTCP會把此部分數據清除，騰空緩沖區并擴大窗口大小。

[cpp] view plain copy

int PseudoTcp::Recv(char* buffer, size_t len) {
......
talk_base::StreamResult result = m_rbuf.Read(buffer, len, &read, NULL);
......
size_t available_space = 0;
m_rbuf.GetWriteRemaining(&available_space);//獲取接收緩沖區可用空間
if (uint32(available_space) - m_rcv_wnd >=
talk_base::_min<uint32>(m_rbuf_len / 2, m_mss)) {
bool bWasClosed = (m_rcv_wnd == 0); // !?! Not sure about this was closed business
m_rcv_wnd = available_space;//更新窗口大小，此為窗口張開過程
if (bWasClosed) {
attemptSend(sfImmediateAck);//如果窗口大小從0變為有可用空間時，立即通告對方可以繼續發送數據。
}
}
return read;
}

通告窗口大小給對方：

[cpp] view plain copy

IPseudoTcpNotify::WriteResult PseudoTcp::packet(uint32 seq, uint8 flags,
uint32 offset, uint32 len) {
ASSERT(HEADER_SIZE + len <= MAX_PACKET);
uint32 now = Now();
uint8 buffer[MAX_PACKET];
long_to_bytes(m_conv, buffer);
long_to_bytes(seq, buffer + 4);
long_to_bytes(m_rcv_nxt, buffer + 8);
buffer[12] = 0;
buffer[13] = flags;
short_to_bytes(static_cast<uint16>(m_rcv_wnd >> m_rwnd_scale), buffer + 14);//這里會把窗口擴大因子也算進去
......
}

當發送方收到接收方發送的窗口大小后，可發送大小計算為窗口大小減去已經發送但未被確認的數據大小。

[cpp] view plain copy

void PseudoTcp::attemptSend(SendFlags sflags) {
......
uint32 nWindow = talk_base::_min(m_snd_wnd, cwnd);//接收方窗口大小
uint32 nInFlight = m_snd_nxt - m_snd_una;//已經發送但未被確認的數據大小
uint32 nUseable = (nInFlight < nWindow) ? (nWindow - nInFlight) : 0;//發送方可發送數據大小
......
}

慢啟動

當接收方和發送方之間存在多個路由器和速率較慢的鏈路時，一些中間的路由器必須緩存分組。一開始發送方向接收方發送多個分組，可能會把緩存填滿，這會嚴重降低TCP的吞吐量。

TCP通過慢啟動算法解決上述問題：首先設置擁塞窗口cwnd為1，當發送方每收到一個ACK擁塞窗口加1個報文段。發送方取擁塞窗口和通告窗口的最小值為發送上限。擁塞窗口是發送方使用的流量控制，而通告窗口時接收方使用的流量控制。

發送方首先發送一個報文段，當收到ACK時，cwnd變為2，可以發送2個報文段，當收到2個ACK時cwnd變為4，發送方可以發送4個報文段，依次類推，慢啟動算法是指數增長的。

PTCP實現慢啟動算法如下：

Cwnd初始值為2個MSS，當收到ACK時cwnd增加一個MSS。

[cpp] view plain copy

Bool PseudoTcp::process(Segment& seg) {
......
// Check if this is a valuable ack
if ((seg.ack > m_snd_una) && (seg.ack <= m_snd_nxt)) {
if (m_dup_acks >= 3) {
......
}else{
m_dup_acks = 0;
// Slow start, congestion avoidance
if (m_cwnd < m_ssthresh) {
m_cwnd += m_mss;//當收到有效的ACK時，cwnd增加一個MSS。
} else {
m_cwnd += talk_base::_max<uint32>(1, m_mss * m_mss / m_cwnd);
}
}
}
......
}

當發送方發送數據時，取窗口大小為通告窗口（m_snd_wnd）和擁塞窗口（cwnd）的最小值，然后減去已經發送的未被確認的大小為當前可發送數據大小（nUseable ）。

[cpp] view plain copy

void PseudoTcp::attemptSend(SendFlags sflags) {
......
while (true) {
uint32 cwnd = m_cwnd;
if ((m_dup_acks == 1) || (m_dup_acks == 2)) { // Limited Transmit
cwnd += m_dup_acks * m_mss;
}
uint32 nWindow = talk_base::_min(m_snd_wnd, cwnd);//取窗口大小為通告窗口和擁塞窗口的最小值
uint32 nInFlight = m_snd_nxt - m_snd_una;
uint32 nUseable = (nInFlight < nWindow) ? (nWindow - nInFlight) : 0;//減去已經發送的未被確認的大小為當前可發送數據大小
size_t snd_buffered = 0;
m_sbuf.GetBuffered(&snd_buffered);
uint32 nAvailable =
talk_base::_min(static_cast<uint32>(snd_buffered) - nInFlight, m_mss);//已經緩存的數據中可發送數據大小
......
}

posted on 2013-09-01 14:07 楊粼波閱讀(512) 評論(0) 編輯收藏引用

只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

牽著老婆滿街逛

導航

統計

公告

常用鏈接

留言簿(11)

隨筆分類(466)

隨筆檔案(1513)

文章分類(46)

文章檔案(45)

相冊

收藏夾(39)

工具官網

技術網站

開源網站

其他窩點

收藏網站

銀行官網

友情鏈接

資源共享

搜索

積分與排名

最新評論

閱讀排行榜

libjingle源碼解析(5)-【PseudoTcp】建立UDP之上的TCP(3)：對成塊數據流的處理

滑動窗口

慢啟動