這兩天看csdn有一些關(guān)于socket粘包,socket緩沖區(qū)設(shè)置的問題,發(fā)現(xiàn)自己不是很清楚,所以查資料了解記錄一下:

一兩個簡單概念長連接與短連接:
1.長連接

??? Client方與Server方先建立通訊連接,連接建立后不斷開, 然后再進行報文發(fā)送和接收。

2.短連接

??? Client方與Server每進行一次報文收發(fā)交易時才進行通訊連接,交易完畢后立即斷開連接。此種方式常用于一點對多點
通訊,比如多個Client連接一個Server.

二 什么時候需要考慮粘包問題?

1:如果利用tcp每次發(fā)送數(shù)據(jù),就與對方建立連接,然后雙方發(fā)送完一段數(shù)據(jù)后,就關(guān)閉連接,這樣就不會出現(xiàn)粘包問題(因為只有一種包結(jié)構(gòu),類似于http協(xié)議)。關(guān)閉連接主要要雙方都發(fā)送close連接(參考tcp關(guān)閉協(xié)議)。如:A需要發(fā)送一段字符串給B,那么A與B建立連接,然后發(fā)送雙方都默認好的協(xié)議字符如"hello give me sth abour yourself",然后B收到報文后,就將緩沖區(qū)數(shù)據(jù)接收,然后關(guān)閉連接,這樣粘包問題不用考慮到,因為大家都知道是發(fā)送一段字符。
2:如果發(fā)送數(shù)據(jù)無結(jié)構(gòu),如文件傳輸,這樣發(fā)送方只管發(fā)送,接收方只管接收存儲就ok,也不用考慮粘包
3:如果雙方建立連接,需要在連接后一段時間內(nèi)發(fā)送不同結(jié)構(gòu)數(shù)據(jù),如連接后,有好幾種結(jié)構(gòu):
1)"hello give me sth abour yourself"
2)"Don't give me sth abour yourself"
?? 那這樣的話,如果發(fā)送方連續(xù)發(fā)送這個兩個包出去,接收方一次接收可能會是"hello give me sth abour yourselfDon't give me sth abour yourself" 這樣接收方就傻了,到底是要干嘛?不知道,因為協(xié)議沒有規(guī)定這么詭異的字符串,所以要處理把它分包,怎么分也需要雙方組織一個比較好的包結(jié)構(gòu),所以一般可能會在頭加一個數(shù)據(jù)長度之類的包,以確保接收。

三 粘包出現(xiàn)原因:在流傳輸中出現(xiàn),UDP不會出現(xiàn)粘包,因為它有消息邊界(參考Windows 網(wǎng)絡(luò)編程)
1 發(fā)送端需要等緩沖區(qū)滿才發(fā)送出去,造成粘包
2 接收方不及時接收緩沖區(qū)的包,造成多個包接收

解決辦法:
為了避免粘包現(xiàn)象,可采取以下幾種措施。一是對于發(fā)送方引起的粘包現(xiàn)象,用戶可通過編程設(shè)置來避免,TCP提供了強制數(shù)據(jù)立即傳送的操作指令push,TCP軟件收到該操作指令后,就立即將本段數(shù)據(jù)發(fā)送出去,而不必等待發(fā)送緩沖區(qū)滿;二是對于接收方引起的粘包,則可通過優(yōu)化程序設(shè)計、精簡接收進程工作量、提高接收進程優(yōu)先級等措施,使其及時接收數(shù)據(jù),從而盡量避免出現(xiàn)粘包現(xiàn)象;三是由接收方控制,將一包數(shù)據(jù)按結(jié)構(gòu)字段,人為控制分多次接收,然后合并,通過這種手段來避免粘包。

以上提到的三種措施,都有其不足之處。第一種編程設(shè)置方法雖然可以避免發(fā)送方引起的粘包,但它關(guān)閉了優(yōu)化算法,降低了網(wǎng)絡(luò)發(fā)送效率,影響應用程序的性能,一般不建議使用。第二種方法只能減少出現(xiàn)粘包的可能性,但并不能完全避免粘包,當發(fā)送頻率較高時,或由于網(wǎng)絡(luò)突發(fā)可能使某個時間段數(shù)據(jù)包到達接收方較快,接收方還是有可能來不及接收,從而導致粘包。第三種方法雖然避免了粘包,但應用程序的效率較低,對實時應用的場合不適合。


相關(guān)文章截取:

一個包沒有固定長度,以太網(wǎng)限制在46-1500字節(jié),1500就是以太網(wǎng)的MTU,超過這個量,TCP會為IP數(shù)據(jù)報設(shè)置偏移量進行分片傳輸,現(xiàn)在一般可允許應用層設(shè)置8k(NTFS系)的緩沖區(qū),8k的數(shù)據(jù)由底層分片,而應用看來只是一次發(fā)送。windows的緩沖區(qū)經(jīng)驗值是4k,Socket本身分為兩種,流(TCP)和數(shù)據(jù)報(UDP),你的問題針對這兩種不同使用而結(jié)論不一

樣。甚至還和你是用阻塞、還是非阻塞Socket來編程有關(guān)。

1、通信長度,這個是你自己決定的,沒有系統(tǒng)強迫你要發(fā)多大的包,實際應該根據(jù)需求和網(wǎng)絡(luò)狀況來決定。對于TCP,這個長度可以大點,但要知道,Socket內(nèi)部默認的收發(fā)緩沖區(qū)大小大概是8K,你可以用SetSockOpt來改變。但對于UDP,就不要太大,一般在1024至10K。注意一點,你無論發(fā)多大的包,IP層和鏈路層都會把你的包進行分片發(fā)送,一般局域網(wǎng)就是1500左右,廣域網(wǎng)就只有幾十字節(jié)。分片后的包將經(jīng)過不同的路由到達接收方,對于UDP而言,要是其中一個分片丟失,那么接收方的IP層將把整個發(fā)送包丟棄,這就形成丟包。顯然,要是一個UDP發(fā)包佷大,它被分片后,鏈路層丟失分片的幾率就佷大,你這個UDP包,就佷容易丟失,但是太小又影響效率。最好可以配置這個值,以根據(jù)不同的環(huán)境來調(diào)整到最佳狀態(tài)。

send()函數(shù)返回了實際發(fā)送的長度,在網(wǎng)絡(luò)不斷的情況下,它絕不會返回(發(fā)送失敗的)錯誤,最多就是返回0。對于TCP你可以字節(jié)寫一個循環(huán)發(fā)送。當send函數(shù)返回SOCKET_ERROR時,才標志著有錯誤。但對于UDP,你不要寫循環(huán)發(fā)送,否則將給你的接收帶來極大的麻煩。所以UDP需要用SetSockOpt來改變Socket內(nèi)部Buffer的大小,以能容納你的發(fā)包。明確一點,TCP作為流,發(fā)包是不會整包到達的,而是源源不斷的到,那接收方就必須組包。而UDP作為消息或數(shù)據(jù)報,它一定是整包到達接收方。

2、關(guān)于接收,一般的發(fā)包都有包邊界,首要的就是你這個包的長度要讓接收方知道,于是就有個包頭信息,對于TCP,接收方先收這個包頭信息,然后再收包數(shù)據(jù)。一次收齊整個包也可以,可要對結(jié)果是否收齊進行驗證。這也就完成了組包過程。UDP,那你只能整包接收了。要是你提供的接收Buffer過小,TCP將返回實際接收的長度,余下的還可以收,而UDP不同的是,余下的數(shù)據(jù)被丟棄并返回WSAEMSGSIZE錯誤。注意TCP,要是你提供的Buffer佷大,那么可能收到的就是多個發(fā)包,你必須分離它們,還有就是當Buffer太小,而一次收不完Socket內(nèi)部的數(shù)據(jù),那么Socket接收事件(OnReceive),可能不會再觸發(fā),使用事件方式進行接收時,密切注意這點。這些特性就是體現(xiàn)了流和數(shù)據(jù)包的區(qū)別。


相關(guān)參考文章:
http://www.cnblogs.com/alon/archive/2009/04/16/1437600.html

本文來自CSDN博客,轉(zhuǎn)載請標明出處:http://blog.csdn.net/binghuazh/archive/2009/05/28/4222516.aspx

解決TCP網(wǎng)絡(luò)傳輸“粘包”問題

當前在網(wǎng)絡(luò)傳輸應用中,廣泛采用的是TCP/IP通信協(xié)議及其標準的socket應用開發(fā)編程接口(API)。TCP/IP傳輸層有兩個并列的協(xié)議:TCP和UDP。其中TCP(transport control protocol,傳輸控制協(xié)議)是面向連接的,提供高可靠性服務(wù)。UDP(user datagram protocol,用戶數(shù)據(jù)報協(xié)議)是無連接的,提供高效率服務(wù)。在實際工程應用中,對可靠性和效率的選擇取決于應用的環(huán)境和需求。一般情況下,普通數(shù)據(jù)的網(wǎng)絡(luò)傳輸采用高效率的udp,重要數(shù)據(jù)的網(wǎng)絡(luò)傳輸采用高可靠性的TCP。

在應用開發(fā)過程中,筆者發(fā)現(xiàn)基于TCP網(wǎng)絡(luò)傳輸?shù)膽贸绦蛴袝r會出現(xiàn)粘包現(xiàn)象(即發(fā)送方發(fā)送的若干包數(shù)據(jù)到接收方接收時粘成一包)。針對這種情況,我們進行了專題研究與實驗。本文重點分析了TCP網(wǎng)絡(luò)粘包問題,并結(jié)合實驗結(jié)果提出了解決該問題的對策和方法,供有關(guān)工程技術(shù)人員參考。

一、TCP協(xié)議簡介

  TCP是一個面向連接的傳輸層協(xié)議,雖然TCP不屬于iso制定的協(xié)議集,但由于其在商業(yè)界和工業(yè)界的成功應用,它已成為事實上的網(wǎng)絡(luò)標準,廣泛應用于各種網(wǎng)絡(luò)主機間的通信。

  作為一個面向連接的傳輸層協(xié)議,TCP的目標是為用戶提供可靠的端到端連接,保證信息有序無誤的傳輸。它除了提供基本的數(shù)據(jù)傳輸功能外,還為保證可靠性采用了數(shù)據(jù)編號、校驗和計算、數(shù)據(jù)確認等一系列措施。它對傳送的每個數(shù)據(jù)字節(jié)都進行編號,并請求接收方回傳確認信息(ack)。發(fā)送方如果在規(guī)定的時間內(nèi)沒有收到數(shù)據(jù)確認,就重傳該數(shù)據(jù)。數(shù)據(jù)編號使接收方能夠處理數(shù)據(jù)的失序和重復問題。數(shù)據(jù)誤碼問題通過在每個傳輸?shù)臄?shù)據(jù)段中增加校驗和予以解決,接收方在接收到數(shù)據(jù)后檢查校驗和,若校驗和有誤,則丟棄該有誤碼的數(shù)據(jù)段,并要求發(fā)送方重傳。流量控制也是保證可靠性的一個重要措施,若無流控,可能會因接收緩沖區(qū)溢出而丟失大量數(shù)據(jù),導致許多重傳,造成網(wǎng)絡(luò)擁塞惡性循環(huán)。TCP采用可變窗口進行流量控制,由接收方控制發(fā)送方發(fā)送的數(shù)據(jù)量。

  TCP為用戶提供了高可靠性的網(wǎng)絡(luò)傳輸服務(wù),但可靠性保障措施也影響了傳輸效率。因此,在實際工程應用中,只有關(guān)鍵數(shù)據(jù)的傳輸才采用TCP,而普通數(shù)據(jù)的傳輸一般采用高效率的udp。

二、粘包問題分析與對策

  TCP粘包是指發(fā)送方發(fā)送的若干包數(shù)據(jù)到接收方接收時粘成一包,從接收緩沖區(qū)看,后一包數(shù)據(jù)的頭緊接著前一包數(shù)據(jù)的尾。

  出現(xiàn)粘包現(xiàn)象的原因是多方面的,它既可能由發(fā)送方造成,也可能由接收方造成。發(fā)送方引起的粘包是由TCP協(xié)議本身造成的,TCP為提高傳輸效率,發(fā)送方往往要收集到足夠多的數(shù)據(jù)后才發(fā)送一包數(shù)據(jù)。若連續(xù)幾次發(fā)送的數(shù)據(jù)都很少,通常TCP會根據(jù)優(yōu)化算法把這些數(shù)據(jù)合成一包后一次發(fā)送出去,這樣接收方就收到了粘包數(shù)據(jù)。接收方引起的粘包是由于接收方用戶進程不及時接收數(shù)據(jù),從而導致粘包現(xiàn)象。這是因為接收方先把收到的數(shù)據(jù)放在系統(tǒng)接收緩沖區(qū),用戶進程從該緩沖區(qū)取數(shù)據(jù),若下一包數(shù)據(jù)到達時前一包數(shù)據(jù)尚未被用戶進程取走,則下一包數(shù)據(jù)放到系統(tǒng)接收緩沖區(qū)時就接到前一包數(shù)據(jù)之后,而用戶進程根據(jù)預先設(shè)定的緩沖區(qū)大小從系統(tǒng)接收緩沖區(qū)取數(shù)據(jù),這樣就一次取到了多包數(shù)據(jù)(圖1所示)。

?
圖1

?
圖2

?
圖3

  粘包情況有兩種,一種是粘在一起的包都是完整的數(shù)據(jù)包(圖1、圖2所示),另一種情況是粘在一起的包有不完整的包(圖3所示),此處假設(shè)用戶接收緩沖區(qū)長度為m個字節(jié)。

  不是所有的粘包現(xiàn)象都需要處理,若傳輸?shù)臄?shù)據(jù)為不帶結(jié)構(gòu)的連續(xù)流數(shù)據(jù)(如文件傳輸),則不必把粘連的包分開(簡稱分包)。但在實際工程應用中,傳輸?shù)臄?shù)據(jù)一般為帶結(jié)構(gòu)的數(shù)據(jù),這時就需要做分包處理。

  在處理定長結(jié)構(gòu)數(shù)據(jù)的粘包問題時,分包算法比較簡單;在處理不定長結(jié)構(gòu)數(shù)據(jù)的粘包問題時,分包算法就比較復雜。特別是如圖3所示的粘包情況,由于一包數(shù)據(jù)內(nèi)容被分在了兩個連續(xù)的接收包中,處理起來難度較大。實際工程應用中應盡量避免出現(xiàn)粘包現(xiàn)象。

  為了避免粘包現(xiàn)象,可采取以下幾種措施。一是對于發(fā)送方引起的粘包現(xiàn)象,用戶可通過編程設(shè)置來避免,TCP提供了強制數(shù)據(jù)立即傳送的操作指令push,TCP軟件收到該操作指令后,就立即將本段數(shù)據(jù)發(fā)送出去,而不必等待發(fā)送緩沖區(qū)滿;二是對于接收方引起的粘包,則可通過優(yōu)化程序設(shè)計、精簡接收進程工作量、提高接收進程優(yōu)先級等措施,使其及時接收數(shù)據(jù),從而盡量避免出現(xiàn)粘包現(xiàn)象;三是由接收方控制,將一包數(shù)據(jù)按結(jié)構(gòu)字段,人為控制分多次接收,然后合并,通過這種手段來避免粘包。

  以上提到的三種措施,都有其不足之處。第一種編程設(shè)置方法雖然可以避免發(fā)送方引起的粘包,但它關(guān)閉了優(yōu)化算法,降低了網(wǎng)絡(luò)發(fā)送效率,影響應用程序的性能,一般不建議使用。第二種方法只能減少出現(xiàn)粘包的可能性,但并不能完全避免粘包,當發(fā)送頻率較高時,或由于網(wǎng)絡(luò)突發(fā)可能使某個時間段數(shù)據(jù)包到達接收方較快,接收方還是有可能來不及接收,從而導致粘包。第三種方法雖然避免了粘包,但應用程序的效率較低,對實時應用的場合不適合。

  一種比較周全的對策是:接收方創(chuàng)建一預處理線程,對接收到的數(shù)據(jù)包進行預處理,將粘連的包分開。對這種方法我們進行了實驗,證明是高效可行的。

三、編程與實現(xiàn)

  1.實現(xiàn)框架

  實驗網(wǎng)絡(luò)通信程序采用TCP/IP協(xié)議的socket api編程實現(xiàn)。socket是面向客戶機/服務(wù)器模型的。TCP實現(xiàn)框架如圖4所示。


圖4

  2.實驗硬件環(huán)境:

  服務(wù)器:pentium 350 微機

  客戶機:pentium 166微機

  網(wǎng)絡(luò)平臺:由10兆共享式hub連接而成的局域網(wǎng)

  3.實驗軟件環(huán)境:

  操作系統(tǒng):windows 98

  編程語言:visual c++ 5.0

  4.主要線程

  編程采用多線程方式,服務(wù)器端共有兩個線程:發(fā)送數(shù)據(jù)線程、發(fā)送統(tǒng)計顯示線程。客戶端共有三個線程:接收數(shù)據(jù)線程、接收預處理粘包線程、接收統(tǒng)計顯示線程。其中,發(fā)送和接收線程優(yōu)先級設(shè)為thread_priority_time_critical(最高優(yōu)先級),預處理線程優(yōu)先級為thread_priority_above_normal(高于普通優(yōu)先級),顯示線程優(yōu)先級為thread_priority_normal(普通優(yōu)先級)。

  實驗發(fā)送數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)如圖5所示:

?

圖5

  5.分包算法

  針對三種不同的粘包現(xiàn)象,分包算法分別采取了相應的解決辦法。其基本思路是首先將待處理的接收數(shù)據(jù)流(長度設(shè)為m)強行轉(zhuǎn)換成預定的結(jié)構(gòu)數(shù)據(jù)形式,并從中取出結(jié)構(gòu)數(shù)據(jù)長度字段,即圖5中的n,而后根據(jù)n計算得到第一包數(shù)據(jù)長度。

  1)若n<m,則表明數(shù)據(jù)流包含多包數(shù)據(jù),從其頭部截取n個字節(jié)存入臨時緩沖區(qū),剩余部分數(shù)據(jù)依此繼續(xù)循環(huán)處理,直至結(jié)束。

  2)若n=m,則表明數(shù)據(jù)流內(nèi)容恰好是一完整結(jié)構(gòu)數(shù)據(jù),直接將其存入臨時緩沖區(qū)即可。

  3)若n>m,則表明數(shù)據(jù)流內(nèi)容尚不夠構(gòu)成一完整結(jié)構(gòu)數(shù)據(jù),需留待與下一包數(shù)據(jù)合并后再行處理。

  對分包算法具體內(nèi)容及軟件實現(xiàn)有興趣者,可與作者聯(lián)系。

四、實驗結(jié)果分析

  實驗結(jié)果如下:

  1.在上述實驗環(huán)境下,當發(fā)送方連續(xù)發(fā)送的若干包數(shù)據(jù)長度之和小于1500b時,常會出現(xiàn)粘包現(xiàn)象,接收方經(jīng)預處理線程處理后能正確解開粘在一起的包。若程序中設(shè)置了“發(fā)送不延遲”:(setsockopt (socket_name,ipproto_tcp,tcp_nodelay,(char *) &on,sizeof on) ,其中on=1),則不存在粘包現(xiàn)象。

  2.當發(fā)送數(shù)據(jù)為每包1kb~2kb的不定長數(shù)據(jù)時,若發(fā)送間隔時間小于10ms,偶爾會出現(xiàn)粘包,接收方經(jīng)預處理線程處理后能正確解開粘在一起的包。

  3.為測定處理粘包的時間,發(fā)送方依次循環(huán)發(fā)送長度為1.5kb、1.9kb、1.2kb、1.6kb、1.0kb數(shù)據(jù),共計1000包。為制造粘包現(xiàn)象,接收線程每次接收前都等待10ms,接收緩沖區(qū)設(shè)為5000b,結(jié)果接收方收到526包數(shù)據(jù),其中長度為5000b的有175包。經(jīng)預處理線程處理可得到1000包正確數(shù)據(jù),粘包處理總時間小于1ms。

  實驗結(jié)果表明,TCP粘包現(xiàn)象確實存在,但可通過接收方的預處理予以解決,而且處理時間非常短(實驗中1000包數(shù)據(jù)總共處理時間不到1ms),幾乎不影響應用程序的正常工作。

?