一区二区在线免费观看,国产精品久久久久久超碰,亚洲欧美日韩系列

非boost版本的asio无法识别asio::placeholders::error和boost::system::error_code

��王 — Tue, 28 Mar 2023 03:01:00 GMT

asio::placeholders::error
改用
std::placeholders::_1

boost::system::error_code
改用
std::error_code

O�?img src ="http://www.shnenglu.com/jack-wang/aggbug/229784.html" width = "1" height = "1" />

��王 2023-03-28 11:01 发表评论

libevent 无法解析的外部符�?impWSASend

��王 — Wed, 04 May 2016 08:27:00 GMT

导入ws2_32.lib�Q�O了！

��王 2016-05-04 16:27 发表评论

UDT协议-��Z��UDP的可靠数据传输协�?

��王 — Tue, 13 Apr 2010 09:14:00 GMT

转：http://blog.csdn.net/windcsn/archive/2006/01/04/570242.aspx

1. 介绍
随着�|�络带宽时�g产品(BDP)的增加，通常的TCP协议开始变的低效。这是因为它的AIMD�Q�additive increase multiplicative decrease�Q�算法彻底减��了TCP拥塞�H�口�Q�但不能快速的恢复可用带宽。理��Z��的流量分析表明TCP在BDP增加到很高的时候比较容易受包损失攻凅R�?/p>

另外�Q��承自TCP拥塞控制的不公��^的RTT也成为在分布式数据密集程序中的严重问题。拥有不同RTT的�ƈ发TCP��将不公�q�_��分��n带宽。尽��在��的BDP�|�络中��用通常的TCP实现来相对��^�{�的�׃�n带宽�Q�但在拥有大量BDP的网�l�中�Q�通常的基于TCP的程序就必须承受严重的不公��^的问题。这个RTT��Z��的算法严重的限制了其在广域网分布式计��的效率�Q�例如：internet上的�|�格计算�?/p>

一直到今天�Q�对标准的TCP的提高一直都不能在高BDP环境中效率和公��^性方面达到满意的�E�度�Q�特别是��Z��RTT的问题）。例如：TCP的修改，RFC1423�Q�高性能扩展�Q�，RFC2018�Q�SACK�Q�、RFC2582�Q�New Reno�Q�、RFC2883�Q�D-SACK�Q�、和RFC2988�Q�RTO计算�Q�都或多或少的提高了�Ҏ��率，但最�Ҏ��的AIMD��法没有解决。HS TCP�Q�RFC 3649�Q�通过�Ҏ��上改变TCP拥塞控制��法来在高BDP�|�络中获得高带宽利用率，但公�q�x��问题仍然存在�?/p>

考虑��C��面的背景�Q�需要一�U�在高BDP�|�络支持高性能数据传输的传输协议。我们推荐一个应用程序��别的传输协议�Q�叫UDT或基于UDP的数据传输协议�ƈ拥有用塞控制��法�?/p>

本文描述两个正交的部分，UDP协议和UDT拥塞控制��法。一个应用层�U�别的协议，位于UDP之上�Q��用其他的拥塞��法�Q�然而这些本文中描述的算法也可以在其他协议中实现�Q�例如：TCP�?/p>

一个协议的参考实现叫[UDT]�Q�详�l�的拥塞控制��法的性能分析在[GHG04]中可以找到�?/p>

2. 设计目标
UDT主要用在��数量的bulk源共享富裕带宽的情况下，最典型的例子就是徏立在光纤�q�域�|�上的网��D��，一些研�I�所在这��L��|�络上运行他们的分布式的数据密集�E�序�Q�例如，�q�程讉K��仪器、分布式数据挖掘和高分��L率的多媒体流�?/p>

UDT的主要目标是效率、公�q�뀁稳定。单个的或少量的UDT��应该利用所有高速连接提供的可用带宽�Q�即使带宽变化的很剧烈。同�Ӟ��所有�ƈ发的��必��d��q�_��׃�n带宽�Q�不依赖于不同的带宽瓶劲、�v始时间、RTT。稳定性要求包发送速率应该一直会聚可用带宽非常快�Q��ƈ且必��避免拥塞碰撞�?/p>

UDT�q�不是在瓶劲带宽相对较小的和大量多元短文件流的情况下用来取代TCP的�?/p>

UDT主要作�ؓTCP的朋友，和TCP�q�存�Q�UDT分配的带宽不应该��过�Ҏ��MAX-MIN规则的最大最��公�q�_��享原则。（备注�Q�最大最��规则允许UDT在高BDP�q�接下分配TCP不能使用的可用带宽）。我�?/p>

3. 协议说明
3.1. 概述
UDT是双工的�Q�每个UDT实体有两个部分：发送和接收。发送者根据流量控制和速率控制来发送（和重传）应用�E�序数据。接收者接收数据包和控制包�Q��ƈ�Ҏ��接收到的包发送控制包。发送和接收�E�序�׃�n同一个UDP端口来发送和接收�?/p>

接收者也负责触发和处理所有的控制事�g�Q�包括拥塞控制和可靠性控制和他们的相�Ҏ��Ӟ��例如RTT估计、带宽估计、应�{�和重传�?/p>

UDT��L��试着��应用层数据打包成固定的大小�Q�除非数据不够这么大。和TCP�怼�的是�Q�这个固定的包大��叫做MSS�Q�最大包大小�Q�。由于期望UDT用来传输大块数据��，我们假定只有很小的一部分不规则的大小的包在UDT session中。MSS可以通过应用�E�序来安装，MTU是其最优��|��包括所有包��_��?/p>

UDT拥塞控制��法��速率控制和窗口（��量控制�Q�合�q��v来，前者调整包的发送周期，后者限制最大的位被应答的包。在速率控制中��用的参数通过带宽估计技术来更新�Q�它�l�承来自��Z��接收的包�Ҏ��。同�Ӟ��速率控制周期是估计RTT的常量，��控制参��C��赖于�Ҏ��的数据到��N��度�Q�另外接收端释放的缓冲区的大��?/p>

3.2. 包结�?br>UDT有两�U�包�Q�数据包和控制包。他们通过包头的第一位来区分�Q�标志位�Q�。如果是0�Q�表�C�是数据包，1表示是控制包�?/p>

3.2.1. 数据�?/p>

数据包结构如下显�C�：

0 1 3 4

0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1

0
包序�?br>
应用数据

包序��h��UDT数据包头中唯一的内宏V��它是一个无�W�号整数�Q��用标志位后的31位，UDT使用包基��的需要，例如�Q�每个非重传的包都增加序�?。序号在到达最大�?^31-1的时候覆盖。紧跟在�q�些数据后面的是应用�E�序数据�?/p>

3.2.2. 控制�?br>控制包结构如下：

0 1 3 4

0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1

1
�c�d��
保留
ACK序号

控制信息字段

�?�U�类型的控制包在UDT中，bit1-3表示�q�些信息。前32位在包头中必��d��在。控制信息字�D�包�?�Q�例如，它不存在�Q�或者多�?2位无�W�号整数�Q�这由包�c�d��军_��?/p>

UDT使用应答子序��L��Ҏ��。每个ACK/ACK2包有一个无�W�号�?6位序��P��它独立于数据包需要。它使用�?6-31。应�{�需要从0刎ͼ�2^16-1�Q�。位16-31在其他控制包中没有定义�?/p>

�c�d��
说明
控制信息

000
协议�q�接握手
1�Q?2�?UDT版本

2�Q?2�?内部��序�?/p>

3�Q?2�?MSS�Q�字节）

4�Q?2�?最大流量窗口大��（字节�Q?/p>

001
保活
没有

010
应答�Q�位16-31是应�{�序�?br> 1�Q?2位包序号�Q�先前接收到的包序号

2�Q?2位，RTT�Q�微�U�）

3�Q?2位，RTT 变量或者RTTVar (微秒)

4�Q?2位，��量�H�口大小�Q�包的数量）

5�Q?2位，�q�接定w��估计�Q�每�U�包的数量）

011
Negative应答�Q�NAK�Q?br> 丢失信息�?2位整数数�l�，�?.9�?br>
100
保留
�q�种�c�d��的控制信息保留作为拥塞警告��用，从接收到发送端。一个拥塞警告能被ECN或包延迟增加��势的度量方法触发�?br>
101
关闭

110
应答一个应�{�（ACK2�Q?br> 16-31位，应答序号�?br>
111
4-15的解�?br> 保留��来使用

注意�Q�对于数据和控制包来��_��可以从UDP协议头中得到实际的包大小。包大小信息能被用来得到有效的数据负载和NAK包中的控制信息字�D�大��?/p>

3.3. 定时�?br>UDT在接收端使用4个定时器来触发不同的周期事�g�Q�包括速率控制、应�{�、丢失报告（negative应答�Q�和重传/�q�接�l�护�?/p>

UDT中的定时器��用系�l�时间作为源。UDT接收端主动查询系�l�时间来��查一个定时器是否�q�期。对于某个定时器T来说�Q�其拥有周期TP�Q�将定变量t用来记录最�q�T被设�|�或复位的时间。如果T在系�l�时间t0�Q�t= t0�Q�被复位�Q�那么�Q何t1�Q�t1-t>=TP�Q�是T�q�期的条件�?/p>

四个定时器是�Q�RC定时器、ACK定时器、NAK定时器、EXP定时器。他们的周期分别是：RCTP、ATP、NTP、ETP�?/p>

RC定时器用来触发周期性的速率控制。ACK定时器用来触发周期性的有选择的应�{�（应答包）。RCTP和ATP是常量��|��gؓ�Q�RCTP=ATP=0.01�U��?/p>

NAK被用来触发negative应答�Q�NAK包）。重传定时器被用来触发一个数据包的重传和�l�护�q�接状态。他们周期依赖于对于RTT的估计。ETP��g��依赖于连�l�EXP旉��溢出的次数。推荐的RTT初始值是0.1�U�，而NTP和ETP的初始值是�Q�NTP=3*RTT�Q�ETP=3*RTT+ATP�?/p>

在每�ơbounded UDP接收操作�Q�如果收��C��个UDP包，一些额外的必须的数据处理时��_��时查询系�l�时间来��查四个定时器是否已经�q�期。推荐的周期�_�度是微�U�。UDP接收旉��溢出值是实现的一个选择�Q�这依赖于��@环查询的负担和事件周期精��度之间的权衡�?/p>

速率控制事�g更新包发送周期，UDT发送端使用STP来安排数据包的发送。假定一个在旉��t0被发送，那么下一�ơ包发送时间是�Q�t0+ STP�Q�。换句话��_��如果前面的包发送花费了t’旉��Q�发送端��等待（STP-t’�Q�来发送下一个数据包�Q�如果STP-t’ <0�Q�就不需要等待了�Q�。这个等待间隔需要一个高�_��度的实现�Q�推荐��用CPU旉��周期�_�度�?/p>

3.4. 发送端��法
3.4.1. 数据�l�构和变�?br>A�Q?SND PKT历史�H�口�Q�一个��@环数�l�记录每个数据包的开始时�?/p>

B�Q?发送端丢失链表�Q�发送段丢失列表是一个连接链表，用来存储被接收方NAK包中�q�回的丢失包序号。这些数字以增加的顺序存储�?/p>

3.4.2. 数据发送算�?br>A�Q?如果发送端的丢失链表是非空的，重传�W�一个在list中的包，�q�删除该成员�Q�到5�?/p>

B�Q?�{�待有应用程序数据需要发�?/p>

C�Q?如果未应�{�的包数量超�q�了两量�H�口的大��，转到1。如果不是包装一个新的包�q�发送它�?/p>

D�Q�如果当前包的序��h��16n�Q�n是一个整敎ͼ�转第2步�?/p>

E�Q?在SND PKT历史�H�口中记录包的发送时�?/p>

F�Q?如果�q�是自上�ơ发送速率降低之后的第一个包�Q�等外SYN旉��?/p>

G�Q�等外（STP – t�Q�时��_��t是第1到第4步之间的��L��_��然后转到1�?/p>

3.5. 接收端算�?br>3.5.1. 数据�l�构和变�?br>A�Q?接收端丢失链表：是一个duple�q�接链表�Q�元素的值包括：丢失数据包的序号、最�q�丢失包的反馈时间和包已�l�被反馈的次数。��g��包序号增序的方式存储�?/p>

B�Q?应答历史�H�口�Q�每个发送ACK的和旉��一个��@环数�l�；�׃��其��@环的�Ҏ��，意味着如果数组中没有更多空间的时候新的值将覆盖老的倹{�?/p>

C�Q?RCV PKT历史�H�口�Q�一个用来记录每个包到达旉��的��@环数�l��?/p>

D�Q�对包窗口：一个用来记录每个探��包对之间的旉��间隔�?/p>

E�Q?LRSN�Q�一个用来记录最大接收数据包需要的变量。LRSN被初始化为初始序号减1�?/p>

3.5.2. 数据接收��法
A�Q?查询�pȝ��旉��来检查RC、ACK、NAK、或EXP定时器是否过期。如果�Q一定时器过期，处理事�g�Q�本节下面介�l�）�q�复位过期的定时器�?/p>

B�Q?启动一个时间bounded UDP接收。如果每个包刎ͼ��?�?/p>

C�Q?讄��exp-count�?�Q��ƈ更新ETP为：ETP=RTT+4*RTTVar + ATP�?/p>

D�Q�如果所有的发送数据包已经被应�{�，复位EXP旉��变量�?/p>

E�Q?��查包头的标志位。如果是一个控制包�Q�根据类型处理它�Q�然后�{1�?/p>

F�Q?如果当前数据包的需要是16n+1�Q�n是一个整敎ͼ�记录当前包和上个在对包窗口中数据包的旉��间隔�?/p>

G�Q�在PKT历史�H�口中记录包到达旉��

H�Q?如果当前数据包的序号大于LRSN+1�Q�将所有在�Q�但不包括）�q�两个��g��间的序号攑օ�接收丢失链表�Q��ƈ在一个NAK包中��这些序号发送给发送端。如果序号小于LRSN�Q�从接收丢失链表中删除它�?/p>

I�Q?nbsp; 更新LRSN�Q��{1�?/p>

3.5.3. RC定时器到
通过速率控制��法来更新STP�Q�见3.6节）�?/p>

�q�程如下�Q?/p>

A�Q?按照下面的原则查找接收端所接收到的所有包之前的序��P��如果接收者丢失链表是�I�的�Q�ACK��L��是LRSN+1�Q�否则是在接收丢失队列中的最��序受��?/p>

B�Q?如果应答号不大于曄��被ACK2应答的最大应�{�号�Q�或�{�于上次应答的应�{�号�q�且两次应答之间的时间间隔小于RTT+4*RTTVar�Q�停止（不发送应�{�）�?/p>

C�Q?分配�q�个应答一个唯一增加的ACK序列��P��推荐采用ACK序列��h��步骤1增加�Q��ƈ且重叠在辑ֈ�最大��g��后�?/p>

D�Q�根据下面的��法来计��包的抵��N��度�Q��用PKT历史�H�口中的��D��最�q?6个包抵达间隔�Q�AI�Q�中倹{��在�q?6个��g��Q�删除那些大于AI*8或小于AI*8的包�Q�如果最后剩�?个��|��计算他们的��^均�?AI’)�Q�包抵达速度�?/AI’�Q�每�U�包的数量）�Q�否则是0�?/p>

E�Q?�Ҏ��3.7节中的内容�ؓ每端�Q�W�Q�计��流量窗口。然后计��有效的��量�H�口大小为：最大（W�Q�可用接收方�~�冲大小�Q�，2�Q��?/p>

F�Q?�Ҏ��下面的算法来计算�q�接定w��估计。如果流量控制快启动阶段�Q?.7�Q�一直��l�，�q�回0�Q�否则计��最�q?6个对包间隔（PI�Q�，�q�些值在对包�H�口中，那么�q�接定w��是1/PI�Q�每�U�包的数量）�?/p>

G�Q�打包应�{�序列号�Q�应�{�号�Q�RTT�Q�RTT 变量�Q�有效的��量�H�口大小�q�估计连接，��他们放入ACK包中�Q�然后发送出厅R�?/p>

H�Q?记录ACK序列��P��应答号和�q�个应答的开始时��_��q�放入历史窗口中�?/p>

3.5.4. 处理NAK定时器到�?br>Ø 查找接受方的丢失链表�Q�找到所有上�ơ反馈时间是�Q�k*�Q�RTT+4*RTTVar ) �Q�前的包�Q�k当前�q�个包的反馈�ơ数�?�Q�如果没有反馈丢失，停止�?/p>

Ø 压羃�W�一步中得到的序��P��?.9�Q�，然后在一个NAK包中发送他们到发送方�?/p>

Ø 如果不是停止��量控制快启动阶�D�c�?/p>

3.5.5. 处理EXP定时�?br>A�Q?nbsp; 如果发送端的丢失链表不是空的，停止

B�Q?nbsp; ��所有未应答的包攑ֈ�发送端的丢失链表中

C�Q?如果(exp-count>16)�q�且自上�ơ从�Ҏ��接收��C��个包以来的��L��间超�q?�U�，或者这个时间已�l�超�q?分钟了，�q�被认�ؓ是连接已�l�断开�Q�关闭UDT�q�接�?/p>

D�Q�如果没有数据，也就没有应答�Q�发送一个保�z�d��l�对端，否则��所有未应答包的序号攑օ�发送丢失列表中�?/p>

E�Q?nbsp; 更新exp-count为：exp-count= exp-count+1

F�Q?nbsp; 更新ETP为：ETP=exp-count*�Q�RTT+4*RTTVar�Q?ATP�?/p>

3.5.6. 收到应答�?br>A�Q?nbsp; 更新最大的应答序号

B�Q?更新RTT和RTTVar为：RTT = rtt�Q?RTTVar = rv�Q�rtt和rv是ACK包中的RTT和RTTVar倹{�?/p>

C�Q?nbsp; 更新NTP和ETP为：NTP=RTT+4*RTTVar�Q�ETP=exp-count*�Q�RTT+4*RTTVar�Q?ATP�?/p>

D�Q?nbsp; 更新�q�接定w��估计�Q�B=�Q�B*7+b�Q?8�Q�b是ACK包带的倹{�?/p>

E�Q?nbsp; 更新��量�H�口大小为ACK中的倹{�?/p>

F�Q?nbsp; 发送ACK2包，�q�设�|�与ACK序号相同的应�{�号到对�?/p>

G�Q?nbsp; 复位EXP定时�?/p>

3.5.7. 当收到NAK包的时�?br>A�Q?��所有NAK包中带的序号攑օ�发送方的丢失列表中

B�Q?通过速率控制来更新STP�Q�见3.6�Q?/p>

C�Q?复位EXP定时�?/p>

3.5.8. 当收到ACK2�?br>Ø 在ACK历史�H�口中根据接收到的ACK2序列��h��找行营的ACK包�?/p>

Ø 更新曄��被应�{�的最大应�{�号

Ø �Ҏ��ACK2的到达时间和ACK��d��旉��计算新的rtt��|��q�且更新RTT和RTTVar��gؓ�Q?/p>

RTTVar = (RTTVar *3 +abs(rtt-RTT)/4

RTT = (RTT *7+rtt)/8

RTT和RTTVar的初始值是0.1�U�和0.05�U��?/p>

Ø 更新NTP和ETP为：

NTP = RTT�Q?/p>

ETP = (exp-count +1)* RTT+ATP

3.5.9. 当收��C��z�d��的时�?br>什么也不做

3.5.10. 当收到连接握手和关闭包的时�?br>�?.8�?/p>

3.6. 速度控制��法
3.6.1. 速率控制快启�?br>STP被初始�ؓ最��的旉��_�ֺ��Q?个CPU周期�?毫秒�Q�。这是在快启动阶�D�，一般收��C��个ACK包其携带的估计带宽大�?�q�个阶段��停止了。包的发送周期被讄��?/W�Q�W是ACK携带的流量窗口的大小�?/p>

快启动阶�D�仅仅在开始一个UDT�q�接的时候发生，且不会在UDT�q�接的以后再出现。在快启动阶�D�之后，下面的算法就要工作了�?/p>

3.6.2. 当RC定时器时间到
1�Q?nbsp; 如果在上一个RCTP旉��内，没有收到一个ACK�Q�停�?/p>

2�Q?nbsp; 计算在上个RCTP旉��内的丢失率，计算�Ҏ��是根据��d��发送的包与NAK反馈中��d��丢失包的数量。如果丢��q��大于0.1%�Q�停止�?/p>

3�Q?nbsp; 下个RCTP旉��内发送包的增加数量如下计��：(inc)

If (B<=C) inc = 1/MSS

Else inc = max (10^(ceil(log10((B-C)*MSS*8)))*Beta/MSS,1/MSS)

B是连接容量估计，C是当前的发送速度。两个都计算为每�U�多��个包。MSS是以字节计算的；Beta是��gؓ0.0000015的常量�?/p>

4�Q?nbsp; 更新STP�Q�STP=�Q�STP*RCTP�Q?�Q�STP*inc + RCTP�Q?/p>

5�Q?nbsp; 计算真正的数据发送周期（rsp�Q�，从SND PKT历史�H�口中得刎ͼ�如果�Q�STP<0.5 *rsp�Q�设�|�STP为（0.5 * rsp�Q��?/p>

6�Q?nbsp; 如果�Q�STP<1.0�Q�，讄��STP�?.0�?/p>

3.6.3. 当收到NAK包时
3.6.3.1. 数据�l�构和变�?br>1�Q?nbsp; LSD�Q�自上次速率降低后发送的最大序�?/p>

2�Q?nbsp; NumNAK�Q�自上次LSD更新以后的NAK数量

3�Q?nbsp; AvgNAK�Q�当最大序号大于LSD时两�ơ事件之间的NAK�U�d��的��^均数�?/p>

4�Q?nbsp; DR�Q�在1到AvgNAK之间的随机��^均数�?/p>

3.6.3.2. ��法
1�Q?nbsp; 如果NAK中最大的丢失序列号大于LSD�Q?/p>

增加STP为：STP=STP*�Q?+1/8�Q?/p>

更新AvgNAK为：AvgNAK = �Q�AvgNAK *7 +NumNAK�Q?8

更新DR

复位 NumNAK = 0

记录LSD

2�Q?nbsp; 否则�Q�增加NumNAK按照1个步骤增加；如果NumNAK % DR = 0�Q�增加STP为：STP=STP*�Q?+1/8�Q�；记录LSD�?/p>

3.7. ��量控制��法
��量控制�H�口大小�Q�W�Q�初始值是16�?/p>

3.7.1. 当ACK定时器到的时�?br>1�Q?nbsp; ��量控制快启动：如果没有NAK产生或者W没有到达或超�q?5个包�Q��ƈ且AS>0�Q�流量窗口大��更��Cؓ应答包的��L��量�?/p>

2�Q?nbsp; 否则�Q�如果（AS>0�Q�，W更新为：�Q�AS是包的到��N��度�Q?/p>

W= ceil (W *0.875+AS* (RTT +ATP) *0.125)

3�Q?nbsp; 限制W到对�Ҏ��大流量窗口大��?/p>

3.8. �q�接建立和关�?br>一个UDT实体首先作�ؓ一个SERVER启动�Q�当一个客��L��需要连接的时候其发送握手包。客��L��在从服务端接收到一个握手响应包或时间溢��Z��前，应该每隔一�D�|��间发送一个握手包�Q�时间间隔由响应旉��和系�l�overhead来权衡）�?/p>

握手包有如下信息�Q?/p>

1�Q?nbsp; UDT版本�Q�这个值是兼容的目的。当前的版本�?

2�Q?nbsp; 初始序号�Q�这是发送这个UDT实体��来用于发送数据包的�v始序受��它必须是一个在1刎ͼ�2^31-1�Q�之间的随机倹{��另外，��q�个值在合理的时间历史窗口中不应该重复�?/p>

3�Q?nbsp; MSS�Q�数据包的大��（通过IP有效负蝲来度量）

4�Q?nbsp; 最大的��量�H�口大小�Q�这是接收到握手信息的UDT实体允许的最大流量窗口大��，�H�口大小通常限制为接收端的数据结构大��?/p>

服务器接收到一个握手包之后�Q�比较MSS值和他自��q��值�ƈ讄��它自��q��gؓ较小的倹{��结果��g��在握手响应中被发送到客户端，另外�q�有服务器的版本信息�Q�初始序列号�Q�最大流量窗口大��?/p>

版本字段用来��查两端的兼容性。初始序列号和最大流量窗口大��用于初始化接收到这个握手包的UDT实体参数�?/p>

服务器在�W�一步完成以后就准备发送或接收数据。然而，只要从同一个客��L��接收��M��握手包，其应该发送响应包�?/p>

客户端一旦得到服务器的一个握手响应其��p��入发送和接收数据状态。设�|�它自己的MSS为握手响应包中的值�ƈ初始化相应的参数为包中的��|��序列受��最大流量窗口）。如果收��C�Q何其他的握手信息�Q�丢掉它�?/p>

如果其中的UDT实体要关闭，它将发送一个关闭信息到对端�Q�对�Ҏ��到这个信息以后将自己关闭。这个关闭信息通过UDP传输�Q�仅仅发送一�ơ，�q�不保证一定收到。如果消息没有收刎ͼ��Ҏ��根据时间溢出机制来关闭�q�接�?/p>

3.9. 丢失信息的压�~�方�?br>NAK包中携带的丢�׃��息是一�?2-bit整数的数�l�。如果数�l�的中数字是一个正常的序号�Q�第1位是0�Q�，�q�意味着�q�个序号的包丢失了，如果�W?位是1�Q�意味着从这个号码开始（包括该号码）��C��一个数�l�中的元素（包括�q�个元素��|��之间的包�Q�它的第1位必��L��0�Q�都丢失�?/p>

例如�Q�下面的NAK中携带的信息�Q?/p>

0x00000002, 0x80000006, 0x0000000B, 0x0000000E

上面的信息表明序号�ؓ�Q?�Q?�Q?�Q?�Q?�Q?0�Q?1�Q?4的包都丢了�?/p>

4. 效率和公�q�x�?br>UDT能够充分利用当前有线�|�络的独立于�q�接定w��的可用带�?、RTT、后台共存流、给定的�q�接比特错误率。UDT在没有数据包丢失的情况下�?bits/s�?0%带宽需要一个常量时��_��q�个旉��?.5�U�。UDT�q�不适合无线�|�络�?/p>

UDT的确满��单瓶劲网�l�拓扑的最�?最��公�q�x��。在多个瓶劲情况下，�Ҏ��最大最��原则它能保证较��瓶劲连接或者至��一半的�q�等�׃�n(it guarantees that flows over smaller bottleneck links obtain at least half of their fair share according to max-min rule)。RTT对公�q�x��都一点媄响�?/p>

当和大块的TCP��共存的时候，TCP能占用比UDT更多的带宽，除了三种情况�Q?/p>

1�Q?nbsp; �|�络BDP非常大，TCP不能利用他们的公�q�_��享带宽。这�U�情况下�Q�UDT��占用TCP不能利用的带宽�?/p>

2�Q?nbsp; �q�接定w��是如此的��，从而导致UDT的带宽估计技术不能最有的工作�Q�模拟显�C��个极限连接容量大�U�是100kb/s�?/p>

3�Q?nbsp; 在��用FIFO队列作�ؓ�|�络路径的网�l�中�Q�如果队列大��大于BDP�Q�TCP的共享带宽随着队列大小的增加而降低。然而，抵达UDT的共享带宽是�Q�队列大��通常��过实际路由�?交换机提供的数量�?/p>

当短�Q�timewise�Q�类似web的TCP��和��的�q�发UDT��共存的时候，UDT在TCP��上的效果非常小�?/p>

更多的分析在[GHG03]�?/p>

5. 安全考虑
UDT�q�没有��用特定的安全机制�Q�相反，它依赖于应用�E�序提供的授权和底层提供的安全机制�?/p>

然而，�׃��UDP是无�q�接的，UDT实现应该��查所有达到的包是否是预期的来源。这是从socket的API�q�接概念中��承而来�Q�其�q�接只是接收指定来源的数据�?/p>

6.UDT SOURCE CODE LINK
http://sourceforge.net/projects/dataspace

本文来自CSDN博客�Q��{载请标明出处�Q?a >http://blog.csdn.net/windcsn/archive/2006/01/04/570242.aspx

��王 2010-04-13 17:14 发表评论

(TCP-over-UDP library)��Z��UDP协议之上实现通用、可靠、高效的TCP协议

��王 — Mon, 12 Apr 2010 08:35:00 GMT

转：http://www.shnenglu.com/fwxjj/archive/2009/03/17/76923.html

随着互联�|�应用广泛推�q�，出现了越来越多的�|�络应用�Q�其中基于p2p思想的各�U�网�l�技术的产品也越来越多的出现在我们的视野当中。从最早闻名的Napster到现在的Bittorrent、eMule、skype�{��品，P2P�q�种�|�络应用模式已经从各个方面深入�h心。这些��品在各自的网�l�实现技术上�Q�都以各自的�Ҏ��解决着同样面��的一个问题，如何让他们的软�g产品在各异的�|�络拓扑�l�构中顺利的�q�行P2P通信�?br> 众所周知�Q�在当今的网�l�拓扑结构中�Q�普遍存在��用NAT讑֤�来进行网�l�地址转换�Q�而让应用�E�序能跨��这些NAT讑֤��q�行全双工的通信�Q�就成�ؓ非常重要的一个问题。对于实现跨��NAT通信可以采取很多�U�办法（对于能够直接�q�接、反向连接的情况不在此列�Q�：首先是通过服务器进行�{发，�q�是比较�_�暴的方法，而且在用户量大的时候，转发服务器需要付出相当大的代��P��W�二�Q�可以��用NAT�I�K��技术。而大家知道关于NAT�I�K��中�Q�UDP�I�K��的成功率比起TCP�I�K��要高出许多�Q�这一点这里将不做多述�Q�可以参考Bryan Ford的文章《Peer-to-Peer Communication Across Network Address Translators》（http://www.brynosaurus.com/pub/net/p2pnat/�Q�。因此在UDP协议上构��Z��些大型的�|�络应用�E�序可能会成为很多�h的需求�?br> 当然也可能基于更多的原因�Q�会有很多�h希望能在UDP协议上进行大型应用程序的构徏。然而UDP协议本��n存在着不通信不可靠的�~�点�Q�于是对于基于UDP�q�行可靠通信的需求就��现出来了。目前在�|�络上有许多人正做着�q�一工作�Q�UDT、RakNet、eNet�{�都是构建在UDP之后�|�络可靠通信开发库。然后这些库开发时都针对了一些特�D�应用来�q�行设计的，不具备通用性。比如RakNet是�ؓ游戏应用而设计，对于实时性等游戏相关的网�l�需求有很好的支持，对于大批量数据传输却有点力所不及。而UDT��Z��一�U�基于带宽速率控制的拥塞控制算法进行设计（http://udt.sourceforge.net/doc/draft-gg-udt-01.txt�Q�，主要用在��数量的bulk源共享富裕带宽的情况下，最典型的例子就是徏立在光纤�q�域�|�上的网��D��，而在ISP提供带宽有限的情况下�q�行却显得消耗资源�ƈ性能不��。甚臛_��能被防火墙，或ISP服务商判断�ؓ恶意带宽使用��d��。这些都使用得他们不能被�q�泛地用于各�U�网�l�应用程序。另外大家也陆箋发现目前的UDT实现版本存在的一些问题。比如UDT做服务端接收�q�接�Ӟ��L��新开一个端口与客户端进行连接，�q�样会带来几个问题：1�Q�较多客��L��q�接上来�Ӟ��服务端新打开的众多端口中可能有的端口会被防火墙拦截而导致通信��p�|�Q?�Q�如果客��L��处于Symmetric NAT和Port-Restricted Cone NAT后面�Ӟ��导致服务器端与客户端连接无法成功徏立，3�Q�由于udp端口数最大值有限，所以UDT服务器端可接收的�q�接��C��因些受限。再有就是不仅仅是UDT库，基本上所有的UDP-based可靠通信库，都未提供�I�越proxy代理的功能（socks5�Q�；再有��是对UDP打洞技术有的支持得不完善或�q�不支持�?br> ��Z��q�些原因�Q��得我需要开发一个基于UDP协议之上实现一个可靠、高效、通用的通信库，来满��x��目前所开发的��目的需要。TCP协议��法已经是经�q�多斚w��及多�q�的验证�Q�是最具通用性，且可靠高效的。虽然UDT�{�各�U�库指出TCP在这��h��那样的网�l�环境下存在不��Q�但众多实现当中他仍然是最通用、可靠、高效的。相信有许多��我一��P��需要这么一个开发库�Q�所以我打算在开发过�E�中�Q�陆�l�公开相关的文档及�q�个开发库�?br>
二、设计目�?br>
TDP主要的目标就是在UDP层之上实现TCP的协议算法，使得应用�E�序能够在UDP层之上获得通用、可靠、高效的通信能力�?br> TDP�|�络开发库所实现的算法，都来自久�l�考验的TCP协议��法�Q�网上有着非常多的参考资料。在实现当中�Q�参考最多的是Richard Stevens的《TCP/IP详解》�?br> TDP提供的用于开发的应用�E�序接口与Socket API非常相像�Q�姑且称之�ؓTDP Socket API�Q�基本上的函数名与参数等都与Socket API�怸��_��但是TDP Socket API的API接口都位于命名空间TDP当中。只要��用过Socket API�q�行开发过的朋友，��都会��用TDP库进行开发。下图�ؓTDP及TDP Socket API所处在的协议栈应用中的位置�Q�以及与TCP协议栈应用的�Ҏ��?br>

三、协议说�?br>
1�Q�协议格�?br>
TDP的实现的��法虽然与TCP实现的算法是大致相同�?但TDP的协议格式只是从TCP协议格式获得参考，但�ƈ不完全与他相同。TDP的协议格式如下：

接下来介�l�一下协议格式的各个字段含义�?br> 4位首部长度：表示用户数据在数据包中的起始位置�?br> LIV�Q�连接保�z�L��志，用于表示TDP�q�接通�\存活状态�?br> ACK�Q�确认序��h��效�?br> PSH�Q�接收方应该��快��这个报文段交给应用层�?br> RST�Q�重��接�?br> SYN�Q�同步序��L��来发起一个连接�?br> FIN�Q�发端完成发送�Q务�?br> 16位窗口大��：接收端可接收数据的窗口大��?br> 选项�Q�只有一个选项字段�Q��ؓ最长报文大��，即MSS。TDP选项格式与TCP选项格式一��_��kind=0时表�C�选项�l�束�Q�kind=1时表�C�无操作�Q�kind=2时表�C�最大报文段长度。如下图�Q?br>

数据�Q�用户通过TDP传输的数据�?br>
2�Q�TDP�q�接建立与终�?br>
TDP的连接徏立与�l�止可以参考TCP的状态变�q�图(此图的详�l�解释请参考《TCP/IP详解卷一》第18�?�Q�如下：

2.1�q�接建立

2.1.1三次握手
�q�接建立分要�l�过三次握手�q�程�Q?)客户端发送一个SYN�D�到指明客户打算�q�接的服务器的端口，报文�D�中要设�|�客��L��初始序号�?�Q�服务器发回包含服务器的初始序号的SYN报文�D�作为应�{�。同�Ӟ��确认序可��|��ؓ客户的初始序号加1,�q�设�|�ACK位标志报文段为确认报文段�?�Q�客��L��必须��确认序可��|��ؓ服务器初始序号加1,�Ҏ��务器的SYN报文�D�进行确认�?br> TDP在全局�l�护一个初始序��L��子，�q�个初始序号为随时��生的32位整数�?br> �q�接建立的超时和重传初始��gؓ3�U�，��时采用指数退避算法，3�U�超时后��时��gؓ6�U�，然后�?2�U�，24�U?#8230;…。连接徏立最长时间限制�ؓ75�U��?br>
2.1.2 NAT UDP PUNCH模式
当TDP工作模式是NAT UDP PUNCH�Ӟ��在三�ơ握手之前，向对端NAT端口及预��端口间隔默�?ms发送默认�ؓ10个LIV报文�D�，一来用于打开自已的NAT端口�Q�二来是用于�q�入对端NAT端口。默认值可以由用户�E�序讄��。这时的LIV报文�D�中初始序号及确认序号都�?�?br> 当接收到对端LIV报文�D�后�Q�立卛_��止LIV报文�D�发送，发出SYN报文�D�进行连接徏立。这时有两种可能�Q�其一是另一端直到接收到该SYN报文�D�之前，都没有接收到LIV报文�D�，或是刚接收到但没有来得及发送SYN报文�D�，此时��会如上文描�q�的正常模式下连接徏立的�q�程一��_��经历三�ơ握手。基二是另一端在接收到该SYN报文�D�之前，也已�l�发送出SYN报文�D�，此时双方都需要对SYN报文�D�进行确认，可以�U�C��为四�ơ握手�?

2.1.3 最大传输报文大��（MSS�Q?br> TCP报文�D�在�q�接建立旉��要通报MSS�Q�在TDP的实��C��也进行通报�Q�默认通报�?460字节�Q�符合以太网标准�Q�这个默认值允�?0字节的IP首部�?字节的UDP首部�?2字节的TDP首部�Q�以适合 1500字节的IP数据报）默认值可以由用户�E�序讄��?br> TCP在对端地址为非本地IP�Ӟ��默认通报�?36字节。TDP之所以默认通报�?460�Q�是因�ؓTDP在数据传输过�E�中�Q�实��C��路径MTU发现技术，通过实际发现的MTU�Q�进行MSS的动态调��_��以尽量避免报文段在网�l�中的传输��生分片的情况。�\径MTU发现技术在传输数据��一节中�q�行描述�?br>
2.1.4 半打开�q�接及连接保�z?br> 半打开�q�接是指对端异常关闭�Q�如�|�线拔掉、突然断�늭�情况��引发一端导演关闭，而另一端的�q�接却仍然认��接处于打开当中�Q�这�U�情�늧�之�ؓ半打开�q�接。TDP中的一个TDP SOCKET描述�W�由本地IP、本地端口、远端IP、远端端口唯一��定。当�q�端客户端连接请求到来时�Q�服务端��接收到一个新的TDP SOCKET描述�W�，当这一个描�q�符唯一��定信息已经存在�Ӟ��Ҏ��的连接请求发送RST报文�D�，通知光��|�连接请求。对于旧的连接，�׃��z�L��制自动发现是否�ؓ半打开�q�接�Q�如果是半打开�q�接�Q�则自动关闭该连接。这里RST报文�D�与TCP中的RST报文�D�|��些不一��P��TCP的RST报文�D�工作描�q�请参考《TCP/IP详解卷一》�?br> �q�接建立之后�Q�TDP�q�接需要启动保�z�L��制。TCP�q�接在没有数据通信的情况下也能保持�q�接�Q�但TDP�q�接不行。TDP�q�接在一定时间段内如果没有数据交互的话，��主动发送保�z�LIV报文�D�c��这个时间段�Ҏ��TDP�q�接工作模块不同有所差异�Q�在NAT UDP PUNCH模式下，�q�个旉��D�默认��gؓ1分钟�Q�大多数的NAT中，UDP会话��时旉��?�Q?分钟左右�Q�；而在常规模块下这个时间段默认��gؓ5分钟。默认值可以由用户�E�序讄��Q�用��L��序需要指明两�U�模块下的保�z�L��间周期。这里TDP的保�z�L��制与TCP中的保活机制完全不一��P��TCP的保�z�L��制描�q�请参考《TCP/IP详解卷一》�?br>
2.2�q�接关闭

TDP�q�接与TCP�q�接一��h��全双工的�Q�因此每个方向必��d��独地�q�行关闭。客��h��l�服务器一个FIN报文�D�，然后服务器返回给客户端一个确认ACK报文�Q��ƈ且发送一个FIN报文�D�，当客��h��回复ACK报文后（四次握手�Q�，�q�接��q��束了�?br> TDP�q�接的一端接收到FIN报文�D�|��Q�如果还有数据要发送，需要��l�将数据�q�行发送完成，然后才发出FIN报文�D�；如果�q�有数据未从�~�存中取出，��取出数据，�q�进行确认，直到所有确认完成之后，然后才发出FIN报文�D�（此时如果有�ؕ序的报文�D�|��况不�q�行处理�Q�。上面的描述也表现出�Q�TDP是支持半关闭的，当一端发出FIN报文�D�|��Q�仍然允许接收另一端数据。但是半关闭可能��D��q�接永远停留在状态图中FIN_WAIT_2状态中�Q�此时保�z�L��制仍然在工作当中�Q�如果对端已�l�关闭，那么保活机制��在��到时立卛_��闭这一�q�接�?br>
下图是一个典型的�q�接建立与连接关闭的�C�意图，此图摘自《TCP/IP详解卷一》�?br>

四、TDP传输数据��?br>
1�Q�传输的报文�D?br>
在TDP工作�q�程中传输的所有报文段�Q�只有SYN报文�D�c��FIN报文�D�c��数据报文段是可靠的之外�Q�其它报文段如ACK报文�D�c��LIV报文�D�c��RST报文�D늭�都不是可靠的。SYN报文�D�与FIN报文�D�传输中都占用一个序��P��数据报文�D�在传输中根据传输的数据字节数占用相应的序号�Q�其它报文段不占用传输序受��?br> 成功接收数据报文�D�，应当��按序对下一个期望的数据报文�D늚�序号作�ؓ��认序号发送ACK报文�D�进行确认。当出现接收��Cؕ序的数据报文�D�|��Q�将乱序数据报文�D�|��序缓存，�q�发送期望报文段的ACK报文�D�进行确认。ACK报文�D늚�发送�ƈ非即时的�Q�也�q��是对应接收数据报�q�行一对一��认发送。ACK报文�D는�200ms定时触发发送，也就是说ACK报文�D�要�l�受最�?00ms的时延进行发送。ACK报文�D�对此时期望的数据序可��行确认，因此�q�不是与接收数据报相对应。ACK报文�D�|��不可靠的�Q�当丢失时对端将无法了解接收情况�Q�因此发送方��会有一个超时机�Ӟ��如果发现��认的ACK报文�D�超�Ӟ��发送方��重发该数据报，�q�一点在�W�五节进行详�l�描�q��?br>
2�Q��\径MTU发现及MSS通告

前面已经提到要在�q�接建立�q�程中会通告初始MSS�Q�这个值可以由用户�E�序�q�行讄��。但�q�个初始值是一个静态的。当通信的两个端点之间跨��多个网�l�时�Q��用设�|�的MSS�q�行报文�D�发送时�Q�可能导致传输的IP报文分片情况的��生。�ؓ了避免分片情�늚�产生�Q�TDP在数据传输过�E�中�q�行动态的路径MTU发现�Q��ƈ�q�行MSS的更新及通告�?br> TDP创徏UDP SOCKET�Ӟ��卛_��描述�W�设�|�IP选项��Z��允许�q�行分片�Q�setsockopt (clientSock, IPPROTO_IP, IP_DONTFRAGMENT,(char*)&dwFlags, sizeof(dwFlags))�Q�。在发送数据时以当前MSS大小��D��行数据发送，如果�q�回��gؓ错误码WSAEMSGSIZE�Q?0040�Q�表�C�Zؓ报文�D�尽寸大于MTU�Q�需要进行IP分片传输。此�Ӟ��~�减MSS大小再次�q�行报文�D�发送，直至不再�q�回错误码WSAEMSGSIZE�Q?0040�Q�。当MSS变更�q�能成功发送报文段后，需要向对端通报新的MSS倹{��每�ơMSS�~�小后，默认�?0�U�，TDP��默认扩大MSS大小�Q�以��查是否�\径MTU增大了（默认值可以由用户�E�序讄��Q�，之后�?0*2�U��?0*2*2�U�进行检��，如果三次都未发现MTU增大则停止进行检��。见RFC1191描述�Q�网�l�中MTU值的个数是有限的�Q�如下图描述�Q�摘自RFC1191�Q�。因此MSS的扩大及�~�减�Q�可依据一些由�q�似值按序构成的表，依照此表索引�q�行MSS值的扩大与羃减计��?br>
TDP中MSS与MTU之间关系的计��公式如下：
MSS = MTU – 20(IP首部) – 8(UDP首部) – 12(TDP首部)�?br>
3�Q�Nagle��法

有些��认�ؓ�l�受时�g的捎带ACK发送是Nagle��法�Q�其实不是。经受时延的捎带ACK发送是TCP的通常实现�Q�在TDP中也是如此。而Nagle��法是要求一个TCP�Q�TDP也是如此�Q�连接上最多只能有一个未被确认的未完成的报文�D�，在该报文�D늚��认到达之前不能发送其他的报文�D�c��相反，TCP�Q�TDP也是如此�Q�在�q�个时候收集这些报文段�Q�关在确认到来时合�ƈ作�ؓ一个报文段发送出厅R��Nagle��法对于处理应用�E�序产生大量��报文段的情况，有利于避免网�l�中�׃��发送太多的包而过载（�q�便是发送端的糊涂窗口综合症�Q�关于糊涂窗口综合症在下文将做更详细描述�Q��?br> Nagle��法适用于��生大量小报文�D늚�情况�Q�但有时我们需要关闭Nagle��法。一个典型的例子是X�H�口�pȝ��服务器：��消息（鼠标�U�d��Q�必��L��时�g地发送，以便��行某�U�操作的交互用户提供实时的反馈�?br> 默认的TDP实现中Nagle��法是关闭的�Q�用��L��序可以设�|�打开它�?br>
4�Q�窗口大��通告与滑动窗�?br>
双方接收模块需要依据各自的�~�冲区大��，�怺�通告�q�能接受�Ҏ��数据的尺寸。双方发送模块则必须�Ҏ��Ҏ��通告的接收窗口大��，�q�行数据发送。这�U�机制称之谓滑动�H�口�Q�它是TDP接收方的��量控制�Ҏ��。它允许发送方在停止�ƈ�{�待��认前可以连�l�发送多个分�l�（依据滑动�H�口的大��）�Q�由于发送方不必每发一个分�l�就停下来等待确认，因此可以加速数据的传输�?br> 参照《TCP/IP详解卷一 20.3滑动�H�口》一节，滑动�H�口在排序数据流上不时的向右�U�d��Q�窗口两个边沿的相对�q�动增加或减��了�H�口的大��，关于�H�口�Ҏ��的运动有三个术语�Q�窗口合拢（当左�Ҏ��向右�Ҏ��靠近�Q�、窗口张开�Q�当双��沿向右移动）、窗口收�~�（当右�Ҏ��向左�U�d��Q�。RFC文档强烈��不要在实现当中出现窗口收�~�的情况出现�Q�在我们的实��C��也将不会出现�?br> 当遇到快的发送方与慢的接收方的情冉|��Q�接收方的窗口会很快被发送方的数据填满，此时接收方将通告�H�口大小�?,发送方则停止发送数据。直到接收方用户�E�序取走数据后更新窗口大��，发送方可以�l�箋发送数据；另外�Q�因为ACK报文�D�|��可能丢失�Q�发送方可能没有成功接收到更新的�H�口大小�Q�因此发送方��启动一个坚持定时器�Q�当坚持定时器超�Ӟ��发送方��发送一个字节的数据到接收方�Q�尝试检查窗口大��的更新�?br> 在Nagle��法中接到过�p�涂�H�口�l�合症，在这里要�q�一步进行描�q�。糊涂窗口综合症是指众多��量数据的报文段��通过�q�接�q�行交换�Q�而不是满长度的报文段�Q�这��导致连接占用过多带宽，降低传输速率。糊涂窗口综合症产生是分两端的，接收方可以通告一个小的窗口（而不是一直等到有大的�H�口时才通告�Q�，发送方也可以发送少量的数据�Q�而不是等待其他的数据以便发送一个大的报文段�Q�。要以采用如下方法避免这一现象�Q?br> 1�Q�接收方不通告��窗口。通常的算法是接收方不通告一个比当前�H�口大的�H�口�Q�可以�ؓ0�Q�，除非�H�口可以增加一个报文段大小(也就是将要接收的MSS)或者可以增加缓存空间的一半，不论实际有多��?br> 2�Q�发送方避免出现�p�涂�H�口�l�合症的措施是只有以下条件之一满��时才发送数据：(a)可以发送一个满长度的报文段�Q?b)可以发送至��是接收斚w��告�H�口大小一半的报文�D�；(c)可以发送�Q何数据�ƈ且不希望接收ACK�Q�也��是��_��我们没有�q�未被确认的数据�Q�或者该�q�接上不能��用Nagle��法�?br>
5�Q�PUSH标志

PSUH标志的作用是发送方使用PUSH标志通知接收方将所收到的数据全部提交给接收�q�程。在TDP实现中，用户�E�序�q�不需要关心PUSH标志。因为TDP实现从不��接收到的数据推�q�交付给用户�E�序�Q�因此这个标志在TDP的实��C��是被忽略的�?br>
五、TDP��时与重�?br>
1�Q�带宽时延乘�U�与拥塞

每个�|�络通道都有一定的定w��Q�可以计��通道的容量大��：
Capacity(bit) = bandwidth(b/s) * round-trip time(s)
�q�个��g��般称之�ؓ带宽时�g乘积。这个��g��赖于�|�络速度和两端的RTT�Q�可以有很大的变动。不论是带宽�q�是时�g均会影响发送方与接收方之间通�\的容量�?br> 当数据到达一个大的网�l�通道�q�向一个小的网�l�通道发送，��发生拥塞现象。另外当多个输入��到达一个�\由器�Q�而�\由器的输出流��于�q�些输入��的��d��时也会发生拥塞。TDP��时与重传机制刚采用TCP的拥塞控制算法来�q�行发送端的流量控制�?br>
2�Q�往�q�时间与重传��时旉��量

��时与重传中最重要的部分就是对一个给定连接的往�q�时��_��RTT�Q�的��量。由于�\由器和网�l�流量均会发生变化，因此一般认为RTT可能�l�常会发生变化，TDP应该跟踪�q�些变化�q�相应地改变相应的超时时间�?br> 首先是必��L��量在发送一个带有特别序��L��字节和接收到包含字节的确认之间的RTT。由于数据报文段与ACK之间通常没有一一对应的关�p�，如下图（摘自《TCP/IP详解卷一》图20.1�Q�中�Q�这意味着发送方可以��量到的一个RTT�Q�是在发送报文段4和接收报文段7之间的时��_��用M表示所��量到的RTT�?br> �Ҏ��[Jacobson 1988]描述�Q�见《TCP/IP详解卷一》参考文献）�Q�用A表示被��^滑的RTT�Q�均��g��计器�Q�，用D表示被��^滑的均值偏差，用Err表示刚得到的��量�l�果M与当前RTT估计器之差，则可以计��下一个超旉��传时��_��用RTO表示下一个超旉��传时��_��?br> A = 0 �Q�未�q�行��量往�q�时间之前，A的初始��|��
D = 3 �Q�未�q�行��量往�q�时间之前，D的初始��|��
RTO = A + 2D = 6 �Q�未�q�行��量往�q�时间之前，RTO的初始��|��
A = M + 0.5 (�W�一�ơ测量到往�q�时间结果，对RTT估计器计��初始�?
D = A / 2 �Q�第一�ơ测量到往�q�时间结果，对均值偏差D计算初始��|��
RTO = A + 4D �Q�第一�ơ测量到往�q�时间结果，对均值偏差RTO计算初始��|��
之后的计��方法如下：
Err = M – A
A <- A + gErr
D <- D + h(|Err| - D)
RTO = A + 4D
其中g是常量增量，取��gؓ1/8(0.125)�Q�h也是帔R��增量�Q�取��gؓ1/4(0.25)�?br>

Karn��法�Q�Karn��法是解��x��谓的重传多义性问题的。[Karn and Partridge 1987]规定�Q�见《TCP/IP详解卷一》参考文献）�Q�当一个超时和重传发生�Ӟ��在重传数据的��认最后到达之前，不能更新RTT估计器，因�ؓ我们�q�不知道ACK对应哪次传输�Q�也许第一�ơ传输被延迟而�ƈ没有被丢弃，也有可能是第一�ơ传输的ACK被�g�q�丢弃）。�ƈ且，�׃��数据被重传，RTO已经得到了一个指数退避，我们在下一�ơ传输时使用�q�个退避后的RTO。对一个没有被重传的报文段而言�Q�除非收��C��一个确认，否则不要计算新的RTO�?br> 在�Q何时候对每个�q�接�q�行仅测量一�ơRTT��|��在发送一个报文段�Ӟ��如果�l�定�q�接的定时器已经被��用，则该报文�D�不被计�Ӟ��反之如果�l�定�q�接的定时器未被使用�Q�则开始计时以��量RTT倹{��即�q��每个发出报文�D�都�q�行��量RTT��|��同一旉��D�里只能有一个RTT值测量行��行，不会�q�行�q�行多个RTT值测量�?br>
3�Q�慢启动

如果发送方一开始便向网�l�发送多个报文段�Q�直臌��到接收方通告�H�口大小为止。当发送方与接收方在同一局域网�Ӟ��q�种方式是可以的。但如果在发送方与接收方之间存在多个路由器和速率较慢的链路时�Q�就可能出现问题。一些中间�\由器必须�~�存分组�Q��ƈ有可能耗尽存储器的�I�间�Q�将来得降低TCP�q�接的吞吐量。于是需要一�U�叫“慢启�?#8221;的拥塞控制算法�?br> 慢启动�ؓ发送方增加一个拥塞窗口，��Cؓcwnd�Q�当与另一个网�l�的��L��建立�q�接�Ӟ��拥塞�H�口被初始化�?个报文段。每收到一个ACK�Q�拥塞窗口就增加一个报文段�Q�cwnd以字节�ؓ单位�Q�但慢启动以报文�D�大��ؓ单位�q�行增加�Q�。发送方取拥塞窗口与通告�H�口中的最��g��为发送上限。拥塞窗口是发送方使用的流量控�Ӟ��而通告�H�口是接收方使用的流量控制�?br> 发送方开始时发送一个报文段�Q�然后等待ACK。当收到该ACK�Ӟ��拥塞�H�口�?增加�?,卛_��以发送两个报文段。当收到�q�两个报文段的ACK�Ӟ��拥塞�H�口��增加�ؓ4。这是一�U�指数增加的关系�?br>
4�Q�拥塞避�?br>
慢启动算法增加拥塞窗口大��到某些点上可能辑ֈ�了互联网的容量，于是中间路由器开始丢弃分�l�。这��通知发送方它的拥塞�H�口开得太大。拥塞避免算法是一�U�处理丢失分�l�的�Ҏ��。该��法假定�׃��分组受到损坏引�v的丢失是非常��的�Q�远��于1�Q�）�Q�因此分�l�丢失就意味着在源��L��和目标主��Z��间的某处�|�络上发生了拥塞。有两种分组丢失的指�C�：发生��时和接收到重复的确认。拥塞避免算法与慢启动算法是两个独立的算法，但实际中�q�两个算法通常在一起实现�?br> 拥塞避免��法和慢启动��法需要对每个�q�接�l�持两个变量�Q�一个拥塞窗口cwnd和一个慢启动门限ssthresh。算法的工作�q�程如下�Q?br> 1) 对一个给定的�q�接�Q�初始化cwnd�?个报文段�Q�ssthresh�?5535个字节�?br> 2) TCP输出例程的输��Z��能超�q�cwnd和接收方通告�H�口的大��。拥塞避免是发送方使用的流量控�Ӟ��而通告�H�口则是接收方进行的��量控制。前者是发送方感受到的�|�络拥塞的估计，而后者则与接收方在该�q�接上的可用�~�存大小有关�?br> 3) 当拥塞发生时�Q�超时或收到重复��认�Q�，ssthresh被设�|��ؓ当前�H�口大小的一半（cwnd和接收方通告�H�口大小的最��|��但最��ؓ2个报文段�Q�。此外，如果是超时引起了拥塞�Q�则cwnd被设�|��ؓ1个报文段�Q�这��是慢启动）�?br> 4) 当新的数据被�Ҏ��认�Ӟ��增加cwnd�Q�但增加的方法依赖于我们是否正在�q�行慢启动或拥塞避免。如果cwnd��于或等于ssthresh�Q�则正在�q�行慢启动，否则正在�q�行拥塞避免。慢启动一直持�l�到我们回到当拥塞发生时所处位�|�的半时候才停止�Q�因为我们记录了在步�?中给我们刉��麻烦的�H�口大小的一半）�Q�然后�{为执行拥塞避免�?br> 慢启动算法初始设�|�cwnd�?个报文段�Q�此后每收到一个确认就�?。这会�ɽH�口按指数方式增长：发�?个报文段�Q�然后是2个，接着�?�?#8230;…。拥塞避免算法要求每�ơ收��C��个确认时��cwnd增加1/cwnd。与慢启动的指数增加比�v来，�q�是一�U�加性增�ѝ��我们希望在一个往�q�时间内最多�ؓcwnd增加1个报文段�Q�不��在�q�个RT T中收��C��多少个ACK�Q�，然而慢启动��根据这个往�q�时间中所收到的确认的个数增加cwnd�?br> 处于拥塞避免状态时�Q�拥塞窗口的计算公式如下�Q�引公式参照BSD的实玎ͼ�segsize/8的值是一个匹配补充量�Q�不在算法描�q�当中）�Q?br> cwnd <- cwnd + segsize * segsize / cwnd + segsize / 8

5�Q�快速重传与快速恢�?br>
�׃��我们不知道一个重复的ACK是由一个丢��q��报文�D�引��L��Q�还是由于仅仅出��C��几个报文�D늚�重新排序�Q�因此我们等待少量重复的ACK到来。假如这只是一些报文段的重新排序，则在重新排序的报文段被处理�ƈ产生一个新的ACK之前�Q�只可能产生1 ~ 2个重复的ACK。如果一�q�串收到3个或3个以上的重复ACK�Q�就非常可能是一个报文段丢失了。于是我们就重传丢失的数据报文段�Q�而无需�{�待��时定时器溢出。这��是快速重传算法。接下来执行的不是慢启动��法而是拥塞避免��法。这��是快速恢复算法�?br> �q�个��法通常按如下过�E�进行实玎ͼ�
1) 当收到第3个重复的ACK�Ӟ��ssthresh讄��为当前拥塞窗口cwnd的一半。重传丢��q��报文�D�c��设�|�cwnd为ssthresh加上3倍的报文�D�大��?br> 2) 每次收到另一个重复的ACK�Ӟ��cwnd增加1个报文段大小�q�发�?个分�l�（如果新的cwnd允许发送）�?br> 3) 当下一个确认新数据的ACK到达�Ӟ��讄��cwnd为ssthresh�Q�在�W?步中讄��的��|��。这个ACK应该是在�q�行重传后的一个往�q�时间内�Ҏ��?中重传的��认。另外，�q�个ACK也应该是对丢��q��分组和收到的�W?个重复的A C K之间的所有中间报文段的确认。这一步采用的是拥塞避免，因�ؓ当分�l�丢失时我们��当前的速率减半�?br>
六、代理socks5支持

参照RFC1928、RFC1929�Q�在TDP实现中，支持匿名通过socks5代理以及用户�?密码验证方式通过socks5代理�?br> �׃��socks5代理是工作于�q�输层上�Q�因此连接当中对IP层选项的设�|�都��没有效果。socks5代理起到的作用只是应用数据的转发�Q�但�q�已�l�基本上能支持大部分用户�E�序的应用需求。在使用socks5代理�q�行工作中，路径MTU的发现机�Ӟ��无法有效工作，此时MSS默认�?36�Q�MTU默认�?76�Q?用户�E�序可以修改使用的MSS倹{�?br>
七、安全考虑

TDP协议及算法方面�ƈ不对数据的安全性做��M��考虑�Q�用��L��序在传输数据时如果对安全性有要求�Q�可以自行在应用数据层做相应的工作。但TDP实现中，会提供一个简单的AES256位加解密�Ҏ��Q�提供给用户�E�序使用。用��L��序可以调用该加解密方法，�Ҏ��据进行加密然后再通过�|�络�q�行发送，接收时将加密数据��进行解密再��会用户�E�序数据逻辑处理模块�q�行处理�?br>
八、定时器

如BSD的TCP实现�c�M��Q�TDP也�ؓ每条�q�接建立了六个定时器�Q�简要介�l�如下：
1�Q?#8220;�q�接建立”定时器，在发送SYN报文�D�徏立一条新的连接时启动。如果没有在75�U�内收到响应�Q�连接徏立将中止�?br> 2�Q?#8220;重传”定时器，在发送数据时讑֮�。如果定时器已超时而对端的��认�q�未到达�Q�将重传数据。重传定时器的值是动态计��的�Q�取��x��RTT与该报文�D�被重传的次数�?br> 3�Q?#8220;延迟ACK”定时器，收到必须��认但无需马上发出��认的数据时讑֮�。等�?00ms后发送确认响应。如果，在这200ms内，有数据要在该�q�接上发送，延迟的ACK响应��可随数据一起发送回对端�Q�称为捎带确认�?br> 4�Q?#8220;坚持”定时器，在连接对端通告接收�H�口�?,��L��l�箋发送数据时讑֮�。坚持定时器在超时后向对端发�?字节的数据，判定对端接收�H�口是否已经打开。坚持定时器的值是动态的计算的，取决于RTT��|��?�U�与60�U�之间取倹{�?br> 5�Q?#8220;保活”定时器。TDP�q�接在一定时间段内如果没有数据交互的话，��主动发送保�z�LIV报文�D�c��即�?#8220;保活”定时器超�Ӟ��说明没有数据交互�Q�则发送保�z�L��据包。保�z�d��时器默认旉��?分钟�Q�用��L��序可以进行设�|��?br> 6�Q�TIME_WAIT定时�?也可�U�Cؓ2MSL定时器（实现中，一个MSL�?分钟�Q�。当�q�接状态�{�U�d��TIME_WAIT�Ӟ��卌��接主动关闭时�Q�定时器启动�?br>
九、开发接�?br>
使用TDP�q�行�|�络�E�序开发是非常�Ҏ��的，它的开发接口（API�Q�与socket API是非常相似的�Q�尤其是对应功能的函数名�U�都是一致的�Q�需要注意的是TDP的所有API都处于名�U�空间TDP之下。开发接口见下表�Q?br>
函数描述
TDP::accept 接受一个链�?nbsp;
TDP::bind �l�定本地地址��C��个TDP::SOCKET句柄
TDP::cleanup 清除TDP全局资源�Q�一个进�E�中只需要调用一��?nbsp;
TDP::close 关闭已打开的TDP::SOCKET句柄�Q��ƈ关闭�q�接
TDP::connect �q�接到服务器�?nbsp;
TDP::getlasterror 获得TDP最后的一个错�?nbsp;
TDP::getpeername ��d��q�接的对端的地址信息
TDP::getsockname ��d��q�接的本地的地址信息
TDP::getsockopt ��d��TDP的选项信息
TDP::listen �{�待客户端来�q�接
TDP::recv 接收数据
TDP::select �{�待集合中的TDP SOCKET改变状�?nbsp;
TDP::send 发送数�?nbsp;
TDP::setsockopt 修改TDP的选项信息
TDP::shutdown 指定关闭�q�接上双工通信的部分或全部
TDP::socket 创徏一个TDP SOCKET
TDP::startup 初始化TDP全局信息�Q�一个进�E�中只需要调用一��?nbsp;

��王 2010-04-12 16:35 发表评论

��王 — Wed, 24 Mar 2010 03:32:00 GMT

刚接触TCP/IP通信设计的�h�Ҏ��范例可以很快�~�出一个通信�E?
序，据此一些�h可能会认为TCP/IP�~�程很简单。其实不�Ӟ��
TCP/IP�~�程��h��较�ؓ丰富的内宏V��其�~�程的丰富性主要体现在
通信方式和报文格式的多样性上�?

一。通信方式

主要有以下三大类:

(一)SERVER/CLIENT方式

1.一个Client方连接一个Server方，或称点对�?peer to peer)�Q?
2.多个Client方连接一个Server方，�q�也是通常的�ƈ发服务器方式�?
3.一个Client方连接多个Server方，�q�种方式很少见，主要
用于一个客户向多个服务器发送请求情��c�?

(�?�q�接方式

1.长连�?

Client方与Server方先建立通讯�q�接�Q�连接徏立后不断开�Q?
然后再进行报文发送和接收。这�U�方式下�׃��通讯�q�接一�?
存在�Q�可以用下面命��o查看�q�接是否建立�Q?

netstat –f inet|grep 端口�?�?678)�?

此种方式常用于点对点通讯�?

2.短连�?

Client方与Server每进行一�ơ报文收发交易时才进行通讯�q?
接，交易完毕后立��x��开�q�接。此�U�方式常用于一点对多点
通讯�Q�比如多个Client�q�接一个Server.

(�?发送接收方�?

1.异步

报文发送和接收是分开的，�怺�独立的，互不影响。这�U�方
式又分两�U�情况：

(1)异步双工�Q�接收和发送在同一个程序中�Q�有两个不同�?
子进�E�分别负责发送和接收
(2)异步单工�Q�接收和发送是用两个不同的�E�序来完成�?

2.同步

报文发送和接收是同步进行，既报文发送后�{�待接收�q�回报文�?
同步方式一般需要考虑��时问题�Q�即报文发上��d��不能无限�{?
待，需要设定超时时��_��过该时间发送方不再�{�待读返回报
文，直接通知��时�q�回�?nbsp;

实际通信方式是这三类通信方式的组合。比如一般书上提供的
TCP/IP范例�E�序大都是同步短�q�接的SERVER/CLIENT�E�序。有�?
�l�合是基本不用的�Q�比较常用的有�h值的�l�合是以下几�U�：

同步短连接Server/Client
同步长连接Server/Client
异步短连接Server/Client
异步长连接双工Server/Client
异步长连接单工Server/Client

其中异步长连接双工是最为复杂的一�U�通信方式�Q�有时候经
�怼�出现在不同银行或不同城市之间的两套系�l�之间的通信�?
比如金卡工程。由于这几种通信方式比较固定�Q�所以可以预
先编制这几种通信方式的模板程序�?

�?报文格式

通信报文格式多样性更多，相应地就必须设计对应的读写报文的�?
收和发送报文函数�?

(一)��d��与非��d��方式　

1.非阻塞方�?

��d��C��停地�q�行��d��作，如果没有报文接收刎ͼ��{�待一�D�|��间后
��时�q�回�Q�这�U�情况一般需要指定超时时间�?

2.��d��方式

如果没有报文接收刎ͼ�则读函数一直处于等待状态，直到有报文到达�?

(�?循环��d��方式

1.一�ơ直接读写报�?

在一�ơ接收或发送报文动作中一�ơ性不加分别地全部��d��或全�?
发送报文字节�?

2.不指定长度��@环读�?

�q�一般发生在短连接进�E�中�Q�受�|�络路由�{�限�Ӟ��一�ơ较长的�?
文可能在�|�络传输�q�程中被分解成了好几个包。一�ơ读取可能不
能全部读完一�ơ报文，�q�就需要��@环读报文�Q�直到读完�ؓ止�?

3.带长度报文头循环��d��

�q�种情况一般是在长�q�接�q�程中，�׃��在长�q�接中没有条件能�?
判断循环��d��什么时候结束，所以必��要加长度报文头。读函数
先是��d��报文头的长度�Q�再�Ҏ��q�个长度去读报文.实际情况中，
报头的码制格式还�l�常不一��P��如果是非ASCII码的报文��_��q�必��?
转换成ASCII,常见的报文头码制有：
(1)n个字节的ASCII�?
(2)n个字节的BCD�?
(3)n个字节的�|�络整型�?

以上是几�U�比较典型的��d��报文方式�Q�可以与通信方式模板一�?
预先提供一些典型的API��d��函数。当然在实际问题中，可能�q?
必须�~�写与对�Ҏ��文格式配套的��d��API.

在实际情况中�Q�往往需要把我们自己的系�l�与别�h的系�l�进行连接，
有了以上模板与API,可以说连接�Q何方式的通信�E�序都不存在问题�?

本文来自CSDN博客�Q��{载请标明出处�Q?a >http://blog.csdn.net/wgl_suc102/archive/2008/01/23/2060828.aspx

��王 2010-03-24 11:32 发表评论

拼包函数及网�l�封包的异常处理

��王 — Wed, 17 Feb 2010 18:27:00 GMT

拼包函数及网�l�封包的异常处理(含代�? 收藏
本文作者：sodme
本文出处�Q?a >http://blog.csdn.net/sodme
声明�Q�本文可以不�l�作者同意�Q意�{载、复制、传播，但�Q何对本文的引用都请保留作者、出处及本声明信息。谢谢！

　　常见的网�l�服务器�Q�基本上�?*24��时�q��{的，对于�|�游来说�Q�至��要求服务器要能�q�箋工作一周以上的旉��q�保证不出现服务器崩溃这��L��N��性事件。事实上�Q�要求一个服务器在连�l�的满负药��转下不出��M��异常�Q�要求它设计的近乎完��，�q�几乎是不太现实的。服务器本��n可以出异常（但要��可能少得出�Q�，但是�Q�服务器本��n应该被设计得��以健壮�Q?#8220;��病��灾”打不垮它�Q�这��p��求服务器在异常处理方面要下很多功夫�?/p>

　　服务器的异常处理包括的内定w��常广泛，本文仅就在网�l�封包方面出现的异常作一讨论�Q�希望能�Ҏ��从事相关工作的朋友有所帮助�?/p>

　　关于�|�络��包斚w��的异常，��M��来说�Q�可以分��Z��大类�Q�一是封包格式出现异常；二是��包内容�Q�即��包数据�Q�出现异常。在��包格式的异常处理方面，我们在最底端的网�l�数据包接收模块便可以加以处理。而对于封包数据内容出现的异常�Q�只有依靠游戏本�w�的逻辑��d��以判定和��验。游戏逻辑斚w��的异常处理，是随每个游戏的不同而不同的�Q�所以，本文随后的内容将重点阐述在网�l�数据包接收模块中的异常处理�?/p>

　　为方便以下的讨论�Q�先明确两个概念�Q�这两个概念是�ؓ了叙�q�方面，�W�者自行取的，�q�无标准可言�Q�：
　　1、逻辑包：指的是在应用层提交的数据包，一个完整的逻辑包可以表�C�Z��个确切的逻辑意义。比如登录包�Q�它里面��可以含有用户名字段和密码字�D�c��尽��它看上��M��是一�D늼�冲区数据�Q�但�q�个�~�冲区里的各个区间是代表一定的逻辑意义的�?br>　　2、物理包�Q�指的是使用recv(recvfrom)或wsarecv(wsarecvfrom)从网�l�底层接收到的数据包�Q�这��h��到的一个数据包�Q�能不能表示一个完整的逻辑意义�Q�要取决于它是通过UDP�cȝ��“数据报协�?#8221;发的包还是通过TCP�cȝ��“��协�?#8221;发的包�?/p>

　　我们知道�Q�TCP是流协议�Q?#8220;��协�?#8221;�?#8220;数据报协�?#8221;的不同点在于�Q?#8220;数据报协�?#8221;中的一个网�l�包本��n��是一个完整的逻辑包，也就是说�Q�在应用层��用sendto发送了一个逻辑包之后，在接收端通过recvfrom接收到的��是刚才使用sendto发送的那个逻辑包，�q�个包不会被分开发送，也不会与其它的包攑֜�一起发送。但对于TCP而言�Q�TCP会根据网�l�状况和neagle��法�Q�或者将一个逻辑包单独发送，或者将一个逻辑包分成若�q�次发送，或者会��若�q�个逻辑包合在一起发送出厅R��正因�ؓTCP在逻辑包处理方面的�q�种�_�合性，要求我们在作��Z��TCP的应用时�Q�一般都要编写相应的拼包、解包代码�?/p>

　　因此�Q�基于TCP的上层应用，一般都要定义自��q��包格式。TCP的封包定义中�Q�除了具体的数据内容所代表的逻辑意义之外�Q�第一步就是要��定以何�U�方式表�C�当前包的开始和�l�束。通常情况下，表示一个TCP逻辑包的开始和�l�束有两�U�方式：
　　1、以�Ҏ��的开始和�l�束标志表示�Q�比如FF00表示开始，00FF表示�l�束�?br>　　2、直接以包长度来表示。比如可以用�W�一个字节表�C�包总长度，如果觉得�q�样的话包比较小�Q�也可以用两个字节表�C�包长度�?/p>

　　下面��要�l�出的代码是以第2�U�方式定义的数据包，包长度以每个��包的前两个字节表示。我��结合着代码�l�出相关的解释和说明�?/p>

　　函数中用到的变量说明�Q?/p>

　　CLIENT_BUFFER_SIZE�Q�缓冲区的长度，定义为：Const int CLIENT_BUFFER_SIZE=4096�?br>　　m_ClientDataBuf�Q�数据整理缓冲区�Q�每�ơ收到的数据�Q�都会先被复制到�q�个�~�冲区的末尾�Q�然后由下面的整理函数对�q�个�~�冲��行整理。它的定义是�Q�char m_ClientDataBuf[2* CLIENT_BUFFER_SIZE]�?br>　　m_DataBufByteCount�Q�数据整理缓冲区中当前剩余的未整理字节数�?br>　　GetPacketLen(const char*)�Q�函敎ͼ�可以�Ҏ��传入的缓冲区首址按照应用层协议取出当前逻辑包的长度�?br>　　GetGamePacket(const char*, int)�Q�函敎ͼ�可以�Ҏ��传入的缓冲区生成相应的游戏逻辑数据包�?br>　　AddToExeList(PBaseGamePacket)�Q�函敎ͼ��指定的游戏逻辑数据包加入待处理的游戏逻辑数据包队列中�Q�等待逻辑处理�U�程对其�q�行处理�?br>　　DATA_POS�Q�指的是除了包长度、包�c�d��{�这些标志型字段之外�Q�真正的数据包内容的起始位置�?/p>

Bool SplitFun(const char* pData,const int &len)
{
    PBaseGamePacket pGamePacket=NULL;
    __int64 startPos=0, prePos=0, i=0;
    int packetLen=0;

　//先将本次收到的数据复制到整理�~�冲区尾�?br>    startPos = m_DataBufByteCount;
    memcpy( m_ClientDataBuf+startPos, pData, len );
    m_DataBufByteCount += len;

    //当整理缓冲区内的字节数少于DATA_POS字节�Ӟ��取不到长度信息则退�?br>　//注意�Q�退出时�q�不�|�m_DataBufByteCount�?
    if (m_DataBufByteCount < DATA_POS+1)
        return false;

    //�Ҏ��正常逻辑�Q�下面的情况不可能出玎ͼ�为稳妥�v见，�q�是加上
    if (m_DataBufByteCount > 2*CLIENT_BUFFER_SIZE)
    {
        //讄��m_DataBufByteCount�?�Q�意味着丢弃�~�冲��Z��的现有数�?br>        m_DataBufByteCount = 0;

　　//可以考虑开��N��误格式数据包的处理接口，处理逻辑交给上层
　　//OnPacketError()
return false;
}

//�q�原起始指针
startPos = 0;

//只有当m_ClientDataBuf中的字节个数大于最��包长度时才能执行此语句
packetLen = GetPacketLen( pIOCPClient->m_ClientDataBuf );

    //当逻辑层的包长度不合法�Ӟ��则直接丢弃该�?br>    if ((packetLen < DATA_POS+1) || (packetLen > 2*CLIENT_BUFFER_SIZE))
    {
        m_DataBufByteCount = 0;

　　//OnPacketError()
return false;
}

//保留整理�~�冲区的末尾指针
__int64 oldlen = m_DataBufByteCount;

    while ((packetLen <= m_DataBufByteCount) && (m_DataBufByteCount>0))
    {
        //调用拼包逻辑�Q�获取该�~�冲区数据对应的数据�?br>        pGamePacket = GetGamePacket(m_ClientDataBuf+startPos, packetLen);

        if (pGamePacket!=NULL)
        {
            //��数据包加入执行队列
            AddToExeList(pGamePacket);
        }

        pGamePacket = NULL;

　　//整理�~�冲区的剩余字节数和新逻辑包的起始位置�q�行调整
        m_DataBufByteCount -= packetLen;
        startPos += packetLen;

        //�D�留�~�冲区的字节数少于一个正常包大小�Ӟ��只向前复制该包随后退�?br>        if (m_DataBufByteCount < DATA_POS+1)
        {
            for(i=startPos; i                m_ClientDataBuf[i-startPos] = m_ClientDataBuf[i];

return true;
}

packetLen = GetPacketLen(m_ClientDataBuf + startPos );

         //当逻辑层的包长度不合法�Ӟ��丢弃该包及缓冲区以后的包
        if ((packetLen2*CLIENT_BUFFER_SIZE))
        {
            m_DataBufByteCount = 0;

    　　//OnPacketError()
            return false;
        }

         if (startPos+packetLen>=oldlen)
        {
            for(i=startPos; i                m_ClientDataBuf[i-startPos] = m_ClientDataBuf[i];

            return true;
        }
     }//取所有完整的�?/p>

return true;
}

　　以上便是数据接收模块的处理函敎ͼ�下面是几点简要说明：

　　1、用于拼包整理的�~�冲�?m_ClientDataBuf)应该比recv中指定的接收�~�冲�?pData)长度(CLIENT_BUFFER_SIZE)要大�Q�通常前者是后者的2�?2*CLIENT_BUFFER_SIZE)或更大�?/p>

　　2、�ؓ避免因�ؓ剩余数据前移而导致的额外开销�Q�徏议m_ClientDataBuf使用环�Ş�~�冲区实现�?/p>

　　3、�ؓ了避免出现无法拼装的包，我们�U�定每次发送的逻辑包，其单个逻辑包最大长度不可以��过CLIENT_BUFFER_SIZE�?倍。因为我们的整理�~�冲区只�?*CLIENT_BUFFER_SIZE�q�么长，更长的数据，我们��无法整理。这��p��求在协议的设计上以及最�l�的发送函数的处理上要加上�q�样的异常处理机制�?/p>

　　4、对于数据包�q�短或过长的包，我们通常的情冉|��|�m_DataBufByteCount�?�Q�即舍弃当前包的处理。如果此处不讄��m_DataBufByteCount�?也可�Q�但该客��L��只要发了一�ơ格式错误的包，则其后��发过来的包则也将�q�带着产生格式错误�Q�如果设�|�m_DataBufByteCount�?�Q�则可以比较好的避免后��的包受此包的格式错误影响。更好的作法是，在此处开放一个封包格式异常的处理接口(OnPacketError)�Q�由上层逻辑军_��对这�U�异常如何处�|�。比如上层逻辑可以对封包格式方面出现的异常�q�行计数�Q�如果错误的�ơ数��过一定的��|��则可以断开该客��L��的连接�?/p>

　　5、徏议不要在recv或wsarecv的函数后�Q�就紧接着作以上的处理。当recv收到一�D�|��据后�Q�生成一个结构体或对�?它主要含有data和len两个内容�Q�前者是数据�~�冲区，后者是数据长度)�Q�将�q�样的一个结构体或对象放��C��个队列中由后面的�U�程对其使用SplitFun函数�q�行整理。这��P��可以最大限度地提高�|�络数据的接攉��度�Q�不臛_��为数据整理的原因而在此处��费旉��?/p>

　　代码中，我已�l�作了比较详�l�的注释�Q�可以作为拼包函数的参考，代码是从偶的应用中提取、修改而来�Q�本�w�只为演�C�Z��用，所以未作调试，应用旉��要你自己��d��善。如有疑问，可以我的blog上留�a�提出�?/p>

本文来自CSDN博客�Q��{载请标明出处�Q?a >http://blog.csdn.net/clever101/archive/2008/10/12/3061679.aspx

��王 2010-02-18 02:27 发表评论

常用的setsockopt

��王 — Sat, 13 Feb 2010 07:39:00 GMT

��王 2010-02-13 15:39 发表评论

使用VC9+PlatformSDK�~�写WinSock�E�序�Ӟ��#include WinSock2.h文�g��D��c�d��重定义问题（麻��G隔壁的，微��Y又想搞什么花��P��

��王 — Sat, 13 Feb 2010 07:14:00 GMT

�~�写WinSock�E�序�Ӟ��如果不包含WinSock2.h文�g很多�pȝ��c�d��无法识别。可是如果包含了WinSock2.h文�g则报N多系�l�类型重定义的错误�?br>例如 �Q?br>      mswsock.h(69) : error C2065: 'SOCKET' : undeclared identifier
      winsock2.h(99) : error C2011: 'fd_set' : 'struct' type redefinition

      多亏了网上诸多网友的帖子�l�了我提�C�，问题解决了。跪谢了�?br>

Windows�|�络�~�程臛_��需要两个头文�g�Q�winsock2.h和windows.h�Q�而在WinSock2.0之前�q�存在一个老版本的winsock.h。正是这三个头文件的包含��序�Q�导致了上述问题的出现�?/p>

先看看winsock2.h的内容，在文件开头有如下宏定义：

#ifndef _WINSOCK2API_
#define _WINSOCK2API_
#define _WINSOCKAPI_ /* Prevent inclusion of winsock.h in windows.h */

_WINSOCK2API_很容易理解，�q�是最常见的防止头文�g重复包含的保护措施。_WINSOCKAPI_的定义则是�ؓ了阻止对老文件winsock.h的包含，��x��_��如果用户先包含了winsock2.h��׃��允许再包含winsock.h了，否则会导致类型重复定义。这是怎样做到的呢�Q�很��单，因�ؓwinsock.h的头部同样存在如下的保护措施�Q?/p>

#ifndef _WINSOCKAPI_
#define _WINSOCKAPI_

再回�q�头来看winsock2.h�Q�在上述内容之后紧跟着如下宏指令：

/*
* Pull in WINDOWS.H if necessary
*/
#ifndef _INC_WINDOWS
#include
#endif /* _INC_WINDOWS */

其作用是如果用户没有包含windows.h�Q�_INC_WINDOWS在windows.h中定义）��p��动包含它�Q�以定义WinSock2.0所需的类型和帔R��{��?/p>

现在切换到windows.h�Q�查找winsock�Q�我们会惊奇的发��C��下内容：

#ifndef WIN32_LEAN_AND_MEAN
#include
#include
#include
#include
#ifndef _MAC
#include
#include
#include
#include
#endif
#include
#ifndef _MAC
#include

#if(_WIN32_WINNT >= 0x0400)
#include
#include
#else
#include
#endif /* _WIN32_WINNT >= 0x0400 */

#endif
// �q�里省略掉一部分内容
#endif /* WIN32_LEAN_AND_MEAN */

看到没？windows.h会反向包含winsock2.h或者winsock.h�Q�相互间的包含便是万恶之源！

下面具体分析一下问题是怎么发生的�?/p>

错误情�Ş1�Q?/strong>我们在自��q��工程中先包含winsock2.h再包含windows.h�Q�如果WIN32_LEAN_AND_MEAN未定义且_WIN32_WINNT大于或等�?x400�Q�那么windows.h会在winsock2.h开头被自动引入�Q�而windows.h又会自动引入mswsock.h�Q�此�Ӟ��mswsock.h里所用的socket�c�d��q�尚未定义，因此会出现类型未定义错误�?/p>

错误情�Ş2�Q?/strong>先包含windows.h再包含winsock2.h�Q�如果WIN32_LEAN_AND_MEAN未定义且_WIN32_WINNT未定义或者其版本号小�?x400�Q�那么windows.h会自动导入旧有的winsock.h�Q�这样再当winsock2.h被包含时便会引�v重定义�?/p>

�q�里要说明的是，宏WIN32_LEAN_AND_MEAN的作用是减小win32头文件尺�总�加快�~�译速度�Q�一般由AppWizard在stdafx.h中自动定义。_WIN32_WINNT的作用是开启高版本操作�pȝ��下的�Ҏ��函数�Q�比如要使用可等待定时器�Q�WaitableTimer�Q�，��得要求_WIN32_WINNT的值大于或�{�于0x400。因此，如果你没有遇��C��q�C��个问题，很可能是你没有在�q�些条�g下进行网�l�编�E��?/p>

问题�q�没有结束，要知道除了VC自带windows库文件外�Q�MS的Platform SDK也含有这些头文�g。我们很可能发现在之前能够好好编译的�E�序在改变了windows头文件包含�\径后又出了问题。原因很��单，Platform SDK中的windows.h与VC自带的文件存在差异，其相同位�|�的代码如下�Q?/p>

#ifndef WIN32_LEAN_AND_MEAN
#include
#include
#include
#include
#ifndef _MAC
#include
#include
#include
#include
#endif
#include
#ifndef _MAC
#include
#include // �q�里直接包含winsock.h
#endif
#ifndef NOCRYPT
#include
#include
#include
#endif

#ifndef NOGDI
#ifndef _MAC
#include
#ifdef INC_OLE1
#include
#else
#include
#endif /* !INC_OLE1 */
#endif /* !MAC */
#include
#endif /* !NOGDI */
#endif /* WIN32_LEAN_AND_MEAN */

唉，我们不禁要问MS��Z��么要搞这么多花样�Q�更让�h气愤的是�Q�既然代码不一��P��windows.h里却没有��M��一个宏定义能够帮助�E�序辨别当前使用的文件是VC自带的还是PSDK里的�?/p>
    后来�Q�我写了一个头文�g专门处理winsock2.h的包含问题，名�ؓwinsock2i.h�Q�只需在要使用WinSock2.0的源文�g里第一个包含此文�g卛_��Q�不�q�由于前面提到的问题�Q�当使用PSDK�Ӟ��需要手工定义一下USING_WIN_PSDK�Q�源码如下：

//
// winsock2i.h - Include winsock2.h safely.
//
// Copyleft 02/24/2005 by freefalcon
//
//
// When WIN32_LEAN_AND_MEAN is not defined and _WIN32_WINNT is LESS THAN 0x400,
// if we include winsock2.h AFTER windows.h or winsock.h, we get some compiling
// errors as following:
//   winsock2.h(99) : error C2011: 'fd_set' : 'struct' type redefinition
//
// When WIN32_LEAN_AND_MEAN is not defined and _WIN32_WINNT is NOT LESS THAN 0x400,
// if we include winsock2.h BEFORE windows.h, we get some other compiling errors:
//   mswsock.h(69) : error C2065: 'SOCKET' : undeclared identifier
//
// So, this file is used to help us to include winsock2.h safely, it should be
// placed before any other header files.
//

#ifndef _WINSOCK2API_

// Prevent inclusion of winsock.h
#ifdef _WINSOCKAPI_
#error Header winsock.h is included unexpectedly.
#endif

// NOTE: If you use Windows Platform SDK, you should enable following definition:
// #define USING_WIN_PSDK

#if !defined(WIN32_LEAN_AND_MEAN) && (_WIN32_WINNT >= 0x0400) && !defined(USING_WIN_PSDK)
#include
#else
#include

��王 2010-02-13 15:14 发表评论

��王 — Mon, 08 Feb 2010 09:13:00 GMT

隧道技�?/h1>
　　隧道技术及其应�?br>
　　隧道技术（Tunneling�Q�是一�U�通过使用互联�|�络的基��设施在网�l�之间传递数据的方式。��用隧道传递的数据�Q�或负蝲�Q�可以是不同协议的数据��或包。隧道协议将其它协议的数据��或包重新��装然后通过隧道发送。新的��头提供�\�׃��息，以便通过互联�|�传递被��装的负载数据�?br>
　　�q�里所说的隧道�c�M��于点到点的连接。这�U�方式能够��来自许多信息源的�|�络业务在同一个基��设施中通过不同的隧道进行传输。隧道技术��用点对点通信协议代替了交换连接，通过路由�|�络来连接数据地址。隧道技术允许授权移动用��h��已授权的用户在�Q何时间、�Q何地点访问企业网�l��?br>
　　通过隧道的徏立，可实玎ͼ�

　　* ��数据流强制送到特定的地址

　　* 隐藏�U�有的网�l�地址

　　* 在IP�|�上传递非IP数据�?br>
　　* 提供数据安全支持

　　�q�来出现了一些新的隧道技术，�q�在不同的系�l�中得到�q�用和拓展�?br>
　　隧道技�?br>
　　为创建隧道，隧道的客��h��和服务器双方必须使用相同的隧道协议。隧道技术可分别以第2层或�W?层隧道协议�ؓ基础。第2层隧道协议对应于OSI模型的数据链路层�Q��用��作�ؓ数据交换单位。PPTP�Q�点对点隧道协议�Q�、L2TP�Q�第二层隧道协议�Q�和L2F�Q�第2层�{发协议）都属于第2层隧道协议，是将用户数据��装在点对点协议�Q�PPP�Q��中通过互联�|�发送。第3层隧道协议对应于OSI模型的网�l�层�Q��用包作�ؓ数据交换单位。IPIP�Q�IP over IP�Q�以及IPSec隧道模式属于�W?层隧道协议，是将IP包封装在附加的IP包头中，通过IP�|�络传送。无论哪�U�隧道协议都是由传输的蝲体、不同的��装格式以及用户数据包组成的。它们的本质区别在于�Q�用��L��数据包是被封装在哪种数据包中在隧道中传输�?br>
　　点对炚w��道协�?br>
　　PPTP�Q�Point to Point Tunneling Protocol�Q�提供PPTP客户机和PPTP服务器之间的加密通信。PPTP客户机是指运行了该协议的PC机，如启动该协议的Windows95/98�Q�PPTP服务器是指运行该协议的服务器�Q�如启动该协议的WindowsNT服务器。PPTP是PPP协议的一�U�扩展。它提供了一�U�在互联�|�上建立多协议的安全虚拟专用�|�（VPN�Q�的通信方式。远端用戯��够透过��M��支持PPTP的ISP讉K��公司的专用网�?br>
　　通过PPTP�Q�客户可采用拨号方式接入公用IP�|�。拨��L��户首先按常规方式拨到ISP的接入服务器�Q�NAS�Q�，建立PPP�q�接�Q�在此基��上，用户�q�行二次拨号建立到PPTP服务器的�q�接�Q�该�q�接�U�CؓPPTP隧道�Q�实质上是基于IP协议的另一个PPP�q�接�Q�其中的IP包可以封装多�U�协议数据，包括TCP�Q�IP、IPX和NetBEUI。PPTP采用了基于RSA公司RC4的数据加密方法，保证了虚拟连接通道的安全。对于直接连��C��联网的用户则不需要PPP的拨可��接，可以直接与PPTP服务器徏立虚拟通道。PPTP把徏立隧道的��d��权交�l�了用户�Q�但用户需要在其PC��Z��配置PPTP�Q�这样做既增加了用户的工作量�Q�又会给�|�络带来隐患。另外，PPTP只支持IP作�ؓ传输协议�?br>
　　�W�二层�{发协�?br>
　　L2F(Layer Two Forwarding protocol )是由Cisco公司提出的可以在多种介质�Q�如ATM、��中��、IP�|�上建立多协议的安全虚拟专用�|�的通信。远端用戯��通过��M��拨号方式接入公用IP�|�，首先按常规方式拨到ISP的接入服务器�Q�NAS�Q�，建立PPP�q�接�Q�NAS�Ҏ��用户名等信息�Q�徏立直达HGW服务器的�W�二重连接。在�q�种情况下，隧道的配�|�和建立对用��h��完全透明的。其体系�l�构见图1�?br>
　　�W�二层隧道协�?br>
　　L2TP�Q�Layer Two Tunneling Protocol�Q�结合了L2F和PPTP的优点，允许用户从客��L��或访问服务器端徏立VPN�q�接。L2TP是把链�\层的PPP帧装入公用网�l�设施，如IP、ATM、��中��中进行隧道传输的��装协议。其体系�l�构见图1�?br>
　　Cisco、Ascend、Microsoft和RedBack公司的专家们在修改了十几个版本后�Q�终于在1999�q?月公布了L2TP的标准RFC2661。目前用��h��可��问Internet�Ӟ��必须使用IP协议�Q��ƈ且其动态得到的IP地址也是合法的。L2TP的好处在于支持多�U�协议，用户可以保留原有的IPX、Appletalk�{�协议或公司原有的IP地址。L2TP�q�解决了多个PPP链�\的捆�l�问题，PPP链�\捆绑要求其成员均指向同一个NAS�Q�L2TP则允许在物理上连接到不同NAS的PPP链�\�Q�在逻辑上的�l�点为同一个物理设备。L2TP扩展了PPP�q�接�Q�在传统的方式中用户通过模拟电话�U�或ISDN/ADSL与网�l�访问服务器建立一个第2层的�q�接�Q��ƈ在其上运行PPP�Q�第2层连接的�l�点和PPP会话的终点均讑֜�同一个设备上(如NAS)。L2TP作�ؓPPP的扩充提供了更强大的功能�Q�包括允许第2层连接的�l�点和PPP会话的终点分别设在不同的讑֤�上�?br>
　　L2TP主要由LAC(L2TP Access Concentrator)和LNS(L2TP Network Server)构成。LAC支持客户端的L2TP�Q�发起呼叫，接收呼叫和徏立隧道；LNS是所有隧道的�l�点。在传统的PPP�q�接中，用户拨号�q�接的终�Ҏ��LAC�Q�而L2TP能把PPP协议的终点�g伸到LNS�?br>
　　L2TP的徏立过�E�如�?�?br>
　　1.用户通过公用电话�|�或ISDN拨号呼叫本地接入服务器LAC�Q�LAC接受呼叫�q�进行基本的识别�q�程�Q�这一�q�程可以采用几种标准�Q�如域名、呼叫线路识�?CLID)或拨号ID业务(DNIS)�{��?br>
　　2.当用戯��认为合法企业用��h��Q�就建立一个通向LNS的拨号VPN隧道�?br>
　　3.企业内部的安全服务器如TACACS+、RADIUS�Ҏ��L��戯��行验证�?br>
　　4.LNS与远�E�用户交换PPP信息�Q�分配IP地址。LNS可采用企业专用地址(未注册的IP地址)或服务提供商提供的地址�I�间分配IP地址。因为内部源IP地址与目的地IP地址实际上都通过服务提供商的IP�|�络在PPP信息包内传送，企业专用地址�Ҏ��供者的�|�络是透明的�?br>
　　5.端到端的数据从拨��L��户传到LNS�?br>
　　在实际应用中�Q�LAC��拨��L��L��PPP帧封装后�Q�传送到LNS�Q�后者去掉封装包��_��取出PPP帧，再去掉PPP帧头�Q�最后获得网�l�层数据包�?br>
　　L2TP方式�l�服务提供商和用户带来了许多方便。用户不需要在PC板上安装专门的客��L��软�g�Q�企业网可以使用未注册的IP地址�Q��ƈ在本地管理认证数据库�Q�从而降低了应用成本和培训维护费用�?br>
　　与PPTP和L2F相比�Q�L2TP的优点在于提供了差错和流量控�Ӟ��L2TP使用UDP��装和传送PPP帧。面向无�q�接的UDP无法保证�|�络数据的可靠传输，L2TP使用Nr�Q�下一个希望接受的信息序列��P��和Ns�Q�当前发送的数据包序列号�Q�字�D�进行流量和差错控制。双斚w��过序列��h��定数据包的��序和缓冲区�Q�一旦丢失数据，�Ҏ��序列号可以进行重发�?br>
　　作�ؓPPP的扩展协议，L2TP支持标准的安全特性CHAP和PAP�Q�可以进行用戯��n份认证。L2TP定义了控制包的加密传输，每个被徏立的隧道分别生成一个独一无二的随机钥匙，以便对付�ƺ骗性的��d��Q�但是它对传输中的数据�ƈ不加密�?br>
　　通用路由��装

　　通用路由��装�Q�GRE�Q�Generic Routing Encapsulation�Q�在RFC1701/RFC1702中定义，它规定了怎样用一�U�网�l�层协议��d��装另一�U�网�l�层协议的方法。GRE的隧道由两端的源IP地址和目的IP地址来定义，它允许用户��用IP��装IP、IPX、AppleTalk�Q��ƈ支持全部的�\由协议，如RIP、OSPF、IGRP、EIGRP。通过GRE�Q�用户可以利用公用IP�|�络�q�接IPX�|�络和AppleTalk�|�络�Q�还可以使用保留地址�q�行�|�络互联�Q�或对公�|�隐藏企业网的IP地址�?br>
　　GRE的包头包含了协议�c�d��Q�用于标明乘客协议的�c�d��Q�；校验和包括了GRE的包头和完整的乘客协议与数据�Q�密钥（用于接收端验证接收的数据�Q�；序列��P��用于接收端数据包的排序和差错控制�Q�和路由信息�Q�用于本数据包的路由�Q��?br>
　　GRE只提供了数据包的��装�Q�它没有防止�|�络侦听和攻�ȝ��加密功能。所以在实际环境中它常和IPsec一起��用，由IPsec为用��h��据的加密�Q�给用户提供更好的安全服务�?br>
　　IP安全协议

　　IP安全协议�Q�IPSec�Q�IP Security�Q�实际上是一套协议包而不是一个独立的协议�Q�这一点对于我们认识IPSec是很重要的。从1995�q�开始IPSec的研�I�以来，IETF IPSec工作�l�在它的主页上发布了几十个Internet草案文献�?2个RFC文�g。其中，比较重要的有RFC2409 IKE�Q�互�q�网密钥交换�Q�、RFC2401 IPSec协议、RFC2402 AH验证包头、RFC2406 ESP加密数据�{�文件�?br>
　　IPSec安全体系包括3个基本协议：AH协议为IP包提供信息源验证和完整性保证；ESP协议提供加密机制�Q�密钥管理协�?ISAKMP)提供双方交流时的�׃�n安全信息。ESP和AH协议都有相关的一�p�d��支持文�g�Q�规定了加密和认证的��法。最后，解释域（DOI�Q�通过一�p�d��命��o、算法、属性和参数�q�接所有的IPSec�l�文件�?br>
　　隧道技术应�?br>
　　虚拟专用�|�络

　　VPN是Internet技术迅速发展的产物�Q�其��单的定义是，在公用数据网上徏立属于自��q��专用数据�|�。也��是说不再��用长途专�U�徏立专用数据网�Q�而是充分利用完善的公用数据网建立自己的专用网。它的优�Ҏ��Q�既可连到公�|�所能达到的��M��地点�Q��n受其保密性、安全性和可管理性，又降低网�l�的使用成本�?br>
　　VPN依靠Internet服务提供商（ISP�Q�和其他的网�l�服务提供商�Q�NSP�Q�在公用�|�中建立自己的专�?#8220;隧道”�Q�不同的信息来源�Q�可分别使用不同�?#8220;隧道”�q�行传输�?br>
　　新出台的标准ISE CHEIP6版保证用��h��据的安全加密。由于用户对企业�|�传输个人数据很敏感�Q�因此集成度更高�?a href="http://www.shnenglu.com/view/105152.htm" target=_blank>VPN技�?/font>不久��会��行��h��?br>
　　Linux 中的IP隧道

　　��Z��在TCP/IP�|�络中传输其他协议的数据包，Linux采用了一�U�IP隧道技术。在已经使用多年的桥接技术中��是通过在源协议数据包上再套上一个IP协议帽来实现�?br>
　　利用IP隧道传送的协议包也包括IP数据包，Linux的IPIP包封指的��是�q�种情况�?a href="http://www.shnenglu.com/view/65888.htm" target=_blank>�U�d��IP�Q�Mobile-IP�Q�和IP多点�q�播�Q�IP-Multicast�Q�是两个��行的例子。目前，IP隧道技术在VPN中也昄��出极大的��力�?br>
　　�U�d��IP是在全球Internet上提供移动功能的一�U�服务，它允许节点在切换链�\时仍可保持正在进行的通信。它提供了一�U�IP路由机制�Q��ɿU�d��节点以一个永久的IP地址�q�接��C�Q何链路上。与特定��L��路由技术和数据链�\层方案不同，�U�d��IP�q�要解决安全性和可靠性问题，�q�与传输媒介无关。移动IP的可扩展性��其可以在整个互联�|�上应用�?br>
　　GPRS隧道协议

　　随着隧道技术的发展�Q�各�U�业务已�l�开始根据本业务的特点制定相应的隧道协议。GPRS�Q�General Packet Radio Service�Q�中的隧道协议GTP�Q�GPRS Tunnel Protocol�Q�就是一例�?br>
　　GPRS是GSM提供的分�l�交换和分组传输方式的新的承载业务，可以应用在PLMN�Q�Public Land Mobile Network�Q�内部或应用在GPRS�|�与外部互联分组数据�|�（IP、X.25�Q�之间的分组数据传送，GPRS能提供到现有数据业务的无�~�连接。它在GSM�|�络中增加了两个节点�Q�服务GPRS支持节点�Q�SGSN─serving GPRS support node�Q�和�|�关GPRS支持节点�Q�GGSN─Gateway GPRS support node�Q��?br>
　　SGSN是GPRS骨干�|�与无线接入�|�之间的接口�Q�它��分�l�交换到正确的基站子�pȝ��Q�BSS�Q�。其��d��包括提供对移动台的加密、认证、会话（session�Q�管理、移动性管理和逻辑链�\��理。它也提供到HLR�{�数据库的连接�?br>
　　通过GPRS隧道协议可�ؓ多种协议的数据分�l�通过GPRS骨干�|�提供隧道。GTP�Ҏ��所�q�蝲的协议需求，利用TCP或UDP协议来分别提供可靠的�q�接�Q�如支持X.25的分�l�传输）和无�q�接服务�Q�如IP分组�Q��?/div>

��王 2010-02-08 17:13 发表评论

Socket�E�序开发，发送端写入数据成功�Q�接收端收不到数据的现象分析

��王 — Thu, 28 Jan 2010 10:47:00 GMT

Problem:

1 client 1 server, connected with non-block tcp socket. Linux 2.6.*+.
Client 写入大概 3k 数据�?socket�?
Write()正确�q�回实际写入字节数�?
Server 什么也收不到�?

Causes:

发送端 MTU�E�大于�\由器上的MTU讄��
通知发送端需要拆包的ICMP在某处被杀掉了
发送端不停的重发包

讄��了DF标志的ip包当遇到路由器的MTU比包��的时候，不会被�\由器拆包。而�\由器发送icmp消息到发送端�Q�通知它应该拆包�?/p>

但icmp消息被防火墙拦截下来�?/p>

环境和现象：
�q�个例子中，MTU在client和server都是1500.

dump出来的包如下:

客户端看到的:
发送了2个包�Q�后1个包成功�Q�第1个过大而不停的被发�?

id 57558, offset 0, flags [DF], proto: TCP (6), length: 1500) 10.54.40.43.43145 > 10.29.14.74.http: ., cksum 0×5096 (incorrect (-> 0×5c4e), 0:1448(1448) ack 1 win 46

17:23:06.933580 IP (tos 0×0, ttl 64, id 57559, offset 0, flags [DF], proto: TCP (6), length: 730) 10.54.40.43.43145 > 10.29.14.74.http: P, cksum 0×4d94 (incorrect (-> 0×3933), 1448:2126(678) ack 1 win 46

17:23:07.167049 IP (tos 0×0, ttl 64, id 57560, offset 0, flags [DF], proto: TCP (6), length: 1500) 10.54.40.43.43145 > 10.29.14.74.http: ., cksum 0×5096 (incorrect (-> 0×5b5b), 0:1448(1448) ack 1 win 46

17:23:07.634922 IP (tos 0×0, ttl 64, id 57561, offset 0, flags [DF], proto: TCP (6), length: 1500) 10.54.40.43.43145 > 10.29.14.74.http: ., cksum 0×5096 (incorrect (-> 0×5987), 0:1448(1448) ack 1 win 46

接受端看到的:
只有730大小的包接受成功

17:23:08.605622 IP (tos 0×0, ttl 59, id 57559, offset 0, flags [DF], proto: TCP (6), length: 730) 202.108.3.204.43145 > 10.29.14.74.http: P, cksum 0×9d5b (correct), 1448:2126(678) ack 1 win 46

解决�Ҏ��:
调整发送端机器的配�|?�Q��Q�?个）

在网�l�层�?
Decrease mtu on network adapter:

ifconfig eth* mtu 1400

操作�pȝ��配置:
Clear the default ‘MTU discovery’ flag with sysctl:

net.ipv4.ip_no_pmtu_disc = 1

或在应用�E�序�?
Set socket option ‘IP_MTU_DISCOVER’ with setsockopt(2) to clear ‘DF’ flag of IP package.

Reference:

DF flag of IP package Header
Internet Control Message Protocol
IP fragmentation
MTU or Maximum transmission unit
IP programming
Path MTU Discovery
sysctl

Thanks�Q?/strong>

esx kobe steve

来自�Q?a >http://blog.developers.api.sina.com.cn/?p=672
原文�Q?a >http://drdr-xp-tech.blogspot.com/2009/04/black-hole-socket-problem.html

��王 2010-01-28 18:47 发表评论

asio异步方式

��王 — Tue, 18 Aug 2009 16:36:00 GMT
ASIO的异步方�?
异步方式和同步方式不同，从来不花旉��ȝ��那些龟速的IO操作�Q�只是向�pȝ��说一声要做什么，然后��可以做其它事去了�?br />如果�pȝ��完成了操作， �pȝ��׃��通过我之前给它的回调对象来通知我�?
在ASIO库中�Q�异步方式的函数或方法名�U�前面都有“async_�?前缀�Q�函数参数里会要求放一个回调函敎ͼ�或仿函数�Q��?br />异步操作执行后不��有没有完成都会立即�q�回�Q�这时可以做一些其它事�Q�直到回调函敎ͼ�或仿函数�Q�被调用�Q�说明异步操作已�l�完成�?br />在ASIO中很多回调函数都只接受一个boost::system::error_code参数�Q�在实际使用时肯定是不够的，所以一�?使用仿函数携带一堆相��x��据作为回调，或者��用boost::bind来绑定一堆数据�?
另外要注意的是，只有io_service�cȝ��run()�Ҏ��q�行之后回调对象才会被调用，否则即�ɾpȝ��已经完成了异步操作也不会有�Q 务动作�?br />好了�Q�就介绍到这里，下面是我带来的异步方式TCP Helloworld服务器端:
1.#include
2.#include
3.#include
4.#include
5.#include
6.
7.using namespace boost::asio;
8.using boost::system::error_code;
9.using ip::tcp;
10.
11.struct CHelloWorld_Service{
12. CHelloWorld_Service(io_service &iosev)
13. :m_iosev(iosev),m_acceptor(iosev, tcp::endpoint(tcp::v4(), 1000))
14. {
15. }
16.
17. void start()
18. {
19. // 开始等待连接（非阻塞）
20. boost::shared_ptr psocket(new tcp::socket(m_iosev));
21. // 触发的事件只有error_code参数�Q�所以用boost::bind把socket�l�定�q�去
22. m_acceptor.async_accept(*psocket,
23. boost::bind(&CHelloWorld_Service::accept_handler, this, psocket, _1)
24. );
25. }
26.
27. // 有客��L��q�接时accept_handler触发
28. void accept_handler(boost::shared_ptr psocket, error_code ec)
29. {
30. if(ec) return;
31. // �l�箋�{�待�q�接
32. start();
33. // 昄��q�程IP
34. std::cout << psocket->remote_endpoint().address() << std::endl;
35. // 发送信�?非阻�?
36. boost::shared_ptr pstr(new std::string("hello async world!"));
37. psocket->async_write_some(buffer(*pstr),
38. boost::bind(&CHelloWorld_Service::write_handler, this, pstr, _1, _2)
39. );
40. }
41.
42. // 异步写操作完成后write_handler触发
43. void write_handler(boost::shared_ptr pstr,
44. error_code ec, size_t bytes_transferred)
45. {
46. if(ec)
47. std::cout<< "发送失�?" << std::endl;
48. else
49. std::cout<< *pstr << " 已发�? << std::endl;
50. }
51.
52.private:
53. io_service &m_iosev;
54. ip::tcp::acceptor m_acceptor;
55.};
56.
57.int main(int argc, char* argv[])
58.{
59. io_service iosev;
60. CHelloWorld_Service sev(iosev);
61. // 开始等待连�?
62. sev.start();
63. iosev.run();
64.
65. return 0;
66.}
在这个例子中�Q�首先调用sev.start()开始接受客��L��q�接�?br />�׃��async_accept�?用后立即�q�回�Q�start()�?�?也就马上完成了�?
sev.start()�?瞬间�q�回后iosev.run()开始执行，iosev.run()�Ҏ��是一个��@环，负责分发异步回调事�g�Q?br />�?有所有异步操作全部完成才会返回�?br />�q�里有个问题�Q�就是要保证start()�Ҏ��中m_acceptor.async_accept�?作所用的tcp::socket对象在整个异步操作期间保持有�?br />(�?然系�l�底层异步操作了一半突然发现tcp::socket没了�Q�不是拿人家开涮嘛-_-!!!)�Q?br />而且客户端连接进来后�q�个tcp::socket对象�q?有用呢�?br />�q�里的解军_��法是使用一个带计数的智能指针boost::shared_ptr�Q��ƈ把这个指针作为参数绑定到回调函数上�?br />一旦有客户�q�接�Q�我们在start()里给的回调函数accept_handler��׃��?调用�Q?br />首先调用start()�l�箋异步�{�待�?它客��L��的连接，然后使用�l�定�q�来的tcp::socket对象与当前客��L��通信�?br />发送数据也使用了异步方�?async_write_some)�Q?同样要保证在整个异步发送期间缓冲区的有效性，
所以也用boost::bind�l�定了boost::shared_ptr�?br />对于客户端也一��P��在connect和read_some�Ҏ��前加一个async_前缀�Q�然后加入回调即可，大家自己�l�习写一写�?

��王 2009-08-19 00:36 发表评论

asio同步方式

��王 — Tue, 18 Aug 2009 16:29:00 GMT
ASIO的同步方�?br> Boost.Asio是一个跨�q�_��的网�l�及底层IO的C++�~�程库，它��用现代C++手法实现了统一的异步调用模型�?br>头文�?#include
名空�?using namespace boost::asio;
ASIO库能够��用TCP、UDP、ICMP、串口来发�?接收数据�Q?br>下面先介�l�TCP协议的读写操作对于读写方式，ASIO支持同步和异步两�U�方式，
首先��d��的是同步方式�Q?br>下面请同步方式自我介�l�一下：大家好！我是同步方式�Q�我的主要特点就是执着�Q?br>所有的操作都要完成或出错才会返回，不过偶的执着被大家称之�ؓ��d��Q�实在是郁闷~~�Q�场下一片嘘壎ͼ��Q?br>其实�q�样也是有好处的�Q�比如逻辑清晰�Q�编�E�比较容易�?br>在服务器端，我会做个socket交给acceptor对象�Q�让它一直等客户端连�q�来�Q�连上以后再通过�q�个socket与客��L��通信�Q?
而所有的通信都是以阻塞方式进行的�Q�读完或写完才会�q�回。在客户端也一��P��
�q�时我会拿着socket去连接服务器�Q�当然也是连上或出错了才�q�回�Q�最后也是以��d��的方式和服务器通信�?br>有�h认�ؓ同步方式没有异步方式高效�Q�其实这是片面的理解�?br>在单�U�程的情况下可能��实如此�Q�我不能利用耗时的网�l�操作这�D�|��间做别的�?情，不是好的�l�筹�Ҏ��?br>不过�q�个问题可以通过多线�E�来避免�Q�比如在服务器端让其中一个线�E�负责等待客��L��q�接�Q�连接进来后把socket交给另外的线�E�去和客��L��通信�Q�这样与一个客��L��通信的同时也能接受其它客��L��的连接，�ȝ��E�也完全被解放了出来�?br>我的介绍��有�q�里�Q�谢谢大�Ӟ��好，感谢同步方式的自我介�l�，
现在攑և�同步方式的演�C�Z��?��L��鼓掌!):
服务器端
1.#include
2.#include
3.
4.using namespace boost::asio;
5.
6.int main(int argc, char* argv[])
7.{
8. // 所有asio�c�都需要io_service对象
9. io_service iosev;
10. ip::tcp::acceptor acceptor(iosev,
11. ip::tcp::endpoint(ip::tcp::v4(), 1000));
12. for(;;)
13. {
14. // socket对象
15. ip::tcp::socket socket(iosev);
16. // �{�待直到客户端连接进�?
17. acceptor.accept(socket);
18. // 昄��q�接�q�来的客��L��
19. std::cout << socket.remote_endpoint().address() << std::endl;
20. // 向客��L��发送hello world!
21. boost::system::error_code ec;
22. socket.write_some(buffer("hello world!"), ec);
23.
24. // 如果出错�Q�打印出错信�?
25. if(ec)
26. {
27. std::cout <<
28. boost::system::system_error(ec).what() << std::endl;
29. break;
30. }
31. // 与当前客户交互完成后循环�l�箋�{�待下一客户�q�接
32. }
33. return 0;
34.}

客户�?
1.#include
2.#include
3.
4.using namespace boost::asio;
5.
6.int main(int argc, char* argv[])
7.{
8. // 所有asio�c�都需要io_service对象
9. io_service iosev;
10. // socket对象
11. ip::tcp::socket socket(iosev);
12. // �q�接端点�Q�这里��用了本机�q�接�Q�可以修改IP地址��试�q�程�q�接
13. ip::tcp::endpoint ep(ip::address_v4::from_string("127.0.0.1"), 1000);
14. // �q�接服务�?
15. boost::system::error_code ec;
16. socket.connect(ep,ec);
17. // 如果出错�Q�打印出错信�?
18. if(ec)
19. {
20. std::cout << boost::system::system_error(ec).what() << std::endl;
21. return -1; 22. }
23. // 接收数据
24. char buf[100];
25. size_t len=socket.read_some(buffer(buf), ec);
26. std::cout.write(buf, len);
27.
28. return 0;
29.}

从演�C�Z��码可以得�?
•ASIO的TCP协议通过boost::asio::ip�?�I�间下的tcp�c�进行通信�?
•IP地址�Q�address,address_v4,address_v6�Q��?端口号和协议版本�l�成一个端点（tcp:: endpoint�Q��?br>用于在服务器端生成tcp::acceptor�?象，�q�在指定端口上等待连接；或者在客户端连接到指定地址的服务器上�?
•socket�?服务器与客户端通信的桥梁，�q�接成功后所有的��d��都是通过socket�?象实现的�Q�当socket�?构后�Q�连接自动断开�?
•ASIO��d��所用的�~�冲区用buffer�?数生成，�q�个函数生成的是一个ASIO内部使用的缓冲区�c�，它能把数�l�、指针（同时指定�?��）、std::vector、std::string、boost::array包装成缓冲区�c�R�?br> •ASIO中的函数、类�Ҏ��都接受一个boost::system::error_code�c?型的数据�Q�用于提供出错码�?br>它可以�{换成bool��试是否出错�Q��ƈ通过boost::system::system_error�c?获得详细的出错信息�?br>另外�Q�也可以不向ASIO的函数或�Ҏ��提供 boost::system::error_code�Q�这时如果出错的话就会直接抛出异常，异常�c�d��是boost::system:: system_error(它是从std::runtime_error�l�承�?�?

��王 2009-08-19 00:29 发表评论

��王 — Tue, 18 Aug 2009 16:24:00 GMT

#pragma once
#include
#include
#include
#include
using namespace boost::asio::ip;
using namespace boost::asio;
class Client
{
public:
//boost::shared_ptr ClientPtr;
public:
Client(boost::asio::io_service& io_service, tcp::endpoint& endpoint);
~Client();
private:
void handle_connect(const boost::system::error_code& error);
void handle_read(const boost::system::error_code& error);
void handle_write(const boost::system::error_code& error);
private:
tcp::socket socket_;
char getBuffer[1024];
};

#include "stdafx.h"
#include "Client.h"
Client::Client(boost::asio::io_service& io_service, tcp::endpoint& endpoint):
socket_(io_service)
{
socket_.async_connect(endpoint, boost::bind(&Client::handle_connect, this, boost::asio::placeholders::error));
::memset(getBuffer, '\0', 1024);
}
Client::~Client()
{
}
void Client::handle_connect(const boost::system::error_code& error)
{
if (!error)
{
// 一�q�上�Q�就向服务端发送信�?nbsp;
boost::asio::async_write(socket_, boost::asio::buffer("hello,server!"),
boost::bind(&Client::handle_write, this, boost::asio::placeholders::error));
// boost::asio::async_read(...)��d��的字节长度不能大于数据流的长度，否则��׃��q�入
// ioservice.run()�U�程�{�待�Q�read后面的就不执行了�?nbsp;
//boost::asio::async_read(socket,
// boost::asio::buffer(getBuffer,1024),
// boost::bind(&client::handle_read,this,boost::asio::placeholders::error)
// );
socket_.async_read_some(boost::asio::buffer(getBuffer, 1024),
boost::bind(&Client::handle_read, this, boost::asio::placeholders::error));
}
else
{
socket_.close();
}
}
void Client::handle_read(const boost::system::error_code& error)
{
if (!error)
{
std::cout << getBuffer << std::endl;
//boost::asio::async_read(socket,
// boost::asio::buffer(getBuffer,1024),
// boost::bind(&client::handle_read,this,boost::asio::placeholders::error)
// );
//�q�样��可以实现��@环读取了�Q�相当于while�Q?�Q?nbsp;
//当然�Q�到了这里，做过�|�络的朋友就应该相当熟悉了，一些逻辑��可以自行扩展了
//惛_��聊天室的朋友可以用多�U�程来实�?nbsp;
socket_.async_read_some(boost::asio::buffer(getBuffer, 1024),
boost::bind(&Client::handle_read, this, boost::asio::placeholders::error));
}
else
{
socket_.close();
}
}
void Client::handle_write(const boost::system::error_code& error)
{
}

////////////////////////////////////////////////////////////////////////////////////////////////////////////////////
#include "stdafx.h"
#include "Client.h"
using namespace boost::asio::ip;
using namespace boost::asio;
int _tmain(int argc, _TCHAR* argv[])
{
io_service ioservice;
tcp::endpoint endpoint(address_v4::from_string("127.0.0.1"), 8100);
//ClientPtr client_ptr(new Client(io_service, endpoint));
Client client(ioservice, endpoint);
ioservice.run();
return 0;
}

��王 2009-08-19 00:24 发表评论

boost::asio 服务器端

��王 — Tue, 18 Aug 2009 16:21:00 GMT

#include
#include
#include
#include
#include "Session.h"
using namespace boost::asio::ip;
using namespace boost::asio;
class Acceptor
{
public:
typedef boost::shared_ptr SessionPtr;
public:
Acceptor(io_service& ioservice, tcp::endpoint& endpoint);

~Acceptor();
private:
void handle_accept(const boost::system::error_code& error, SessionPtr session);
private:
io_service& ioservice_;
tcp::acceptor acceptor_;
};

#include "stdafx.h"
#include "Acceptor.h"
Acceptor::Acceptor(boost::asio::io_service& ioservice, tcp::endpoint& endpoint) :
ioservice_(ioservice),
acceptor_(ioservice, endpoint)
{
SessionPtr new_session(new Session(ioservice));
acceptor_.async_accept(new_session->socket(),
boost::bind(&Acceptor::handle_accept, this, boost::asio::placeholders::error, new_session));
}
Acceptor::~Acceptor()
{
}
void Acceptor::handle_accept(const boost::system::error_code& error, SessionPtr session)
{
if (!error)
{
std::cout << "get a new client!" << std::endl; //实现�Ҏ��个客��L��的数据处�?nbsp;
session->start();
SessionPtr new_session(new Session(ioservice_));
acceptor_.async_accept(new_session->socket(),
boost::bind(&Acceptor::handle_accept, this, boost::asio::placeholders::error, new_session));
}
}

////////////////////////////////////////////////////////////////////////////////////////////////////////////////
#pragma once
#include
#include
#include
#include
#define max_len 1024
using namespace boost::asio::ip;
class Session : public boost::enable_shared_from_this
{
public:
Session(boost::asio::io_service& ioservice);
~Session();
tcp::socket& socket();
void start();
private:
void handle_write(const boost::system::error_code& error);
void handle_read(const boost::system::error_code& error);
private:
tcp::socket m_socket;
char data_[max_len];
};

��王 2009-08-19 00:21 发表评论

��王 — Thu, 01 Jan 2009 19:54:00 GMT

�|�络游戏服务器设�?/font>收藏

原文�Q?br>http://blog.csdn.net/staryy/archive/2008/11/29/3410388.aspx
http://www.yq8.cn/html/15/215-47957.html

�|�络游戏服务器设�?/h1>
上一��?/font> / 下一��?/font> 2008-02-22 17:34:18 / 个�h分类�Q?a >回收�?/font>

　谈这个话题之前，首先要让大家知道�Q�什么是服务�?/font>。在�|�络游戏中，服务器所扮演的角色是同步�Q�广播和服务器主动的一些行为，比如说天气，NPC AI之类的，之所以现在的很多�|�络游戏服务器都需要负担一些游戏逻辑上的�q�算是因��Zؓ了防止客��L��?a onclick="javascript:tagshow(event, '%D7%F7%B1%D7');" href="javascript:;" target=_self>作弊行�ؓ。了解到�q�一点，那么本系列的文章��分��Z��部分来谈谈网�l�游戏服务器�?a onclick="javascript:tagshow(event, '%C9%E8%BC%C6');" href="javascript:;" target=_self>设计�Q�一部分是讲如何做好服务器的�|�络�q�接�Q�同步，�q�播以及NPC的设�|�，另一部分则将着重谈谈哪些逻辑攑֜�服务器比较合适，�q�且用什么样的结构来安排�q�些逻辑�?br>

服务器的�|�络�q�接

　　大多数的�|�络游戏的服务器都会选择非阻塞select�q�种�l�构�Q��ؓ什么呢�Q�因为网�l�游戏的服务器需要处理的�q�接非常之多�Q��ƈ且大部分会选择在Linux/Unix下运行，那么为每个用户开一个线�E�实际上是很不划��的�Q�一斚w��因�ؓ在Linux/Unix下的�U�程是用�q�程�q�么一个概忉|��拟出来的�Q�比较消�?a onclick="javascript:tagshow(event, '%CF%B5%CD%B3');" href="javascript:;" target=_self>�pȝ��资源�Q�另外除了I/O之外�Q�每个线�E�基本上没有什么多余的需要�ƈ行的��d���Q�而且�|�络游戏是互交性非常强的，所以线�E�间的同步会成�ؓ很麻烦的问题。由此一来，对于�q�种含有大量�|�络�q�接的单�U�程服务器，用阻塞显然是不现实的。对于网�l�连接，需要用一个结构来储存�Q�其中需要包含一个向客户端写消息的缓�Ԍ��q�需要一个从客户端读消息的缓�Ԍ��具体的大��根据具体的消息�l�构来定了。另外对于同步，需要一些时间校对的��|��q�需要一些各�U�不同的值来记录当前状态，下面�l�出一个初步的�q�接的结构：

typedef connection_s {

    user_t *ob; /* 指向处理服务器端逻辑的结�?*/

    int fd; /* socket�q�接 */

    struct sockaddr_in addr; /* �q�接的地址信息 */

    char text[MAX_TEXT]; /* 接收的消息缓�?*/

    int text_end; /* 接收消息�~�冲的尾指针 */

    int text_start; /* 接收消息�~�冲的头指针 */

    int last_time; /* 上一条消息是什么时候接收到�?*/

    struct timeval latency; /* 客户端本地时间和服务器本地时间的差�?*/

    struct timeval last_confirm_time; /* 上一�ơ验证的旉�� */

    short is_confirmed; /* 该连接是否通过验证�q?*/

    int ping_num; /* 该客��L��到服务器端的ping�?*/

    int ping_ticker; /* 多少个IO周期处理更新一�ơping�?*/

    int message_length; /* 发送缓冲消息长�?*/

    char message_buf[MAX_TEXT]; /* 发送缓冲区 */

    int iflags; /* 该连接的状�?*/

} connection_t;

　　服务器��@环的处理所有连接，是一个死循环�q�程�Q�每�ơ��@环都用select��查是否有新连接到达，然后循环所有连接，看哪个连接可以写或者可以读�Q�就处理该连接的��d��。由于所有的处理都是非阻塞的�Q�所以所有的Socket IO都可以用一个线�E�来完成�?br>
　　�׃��|�络传输的关�p�，每次recv()到的数据可能不止包含一条消息，或者不��C��条消息，那么怎么处理呢？所以对于接收消息缓冲用了两个指针，每次接收都从text_start开始读��P��因�ؓ里面�D�留的可能是上次接收到的多余的半条消息，然后text_end指向消息�~�冲的结��。这��L��两个指针��可以很方便的处理这�U�情况，另外有一点值得注意的是�Q?a onclick="javascript:tagshow(event, '%BD%E2%CE%F6');" href="javascript:;" target=_self>解析消息的过�E�是一个��@环的�q�程�Q�可能一�ơ接收到两条以上的消息在消息�~�冲里面�Q�这个时候就应该执行到消息缓冲里面只有一条都不到的消息�ؓ止，大体��程如下�Q?br>
while ( text_end – text_start > 一条完整的消息长度 )

{

    从text_start处开始处�?

    text_start += 该消息长�?

}

memcpy ( text, text + text_start, text_end – text_start );

　　对于消息的处理，�q�里首先��需要知道你的游戏��d��有哪些消息，所有的消息都有哪些�Q�才能设计出比较合理的消息头。一般来��_��消息大概可分��Z��角消息，场景消息�Q�同步消息和界面消息四个部分。其中主角消息包括客��L��所控制的角色的所有动作，包括走�\�Q�跑步，战斗之类的。场景消息包括天气变化，一定的旉��在场景里出现一些东西等�{�之�cȝ��Q�这�c�L��息的特点是所有消息的发�v者都是服务器�Q�广播对象则是场景里的所有玩家。而同步消息则是针对发起对象是某个玩家�Q�经�q�服务器�q�播�l�所有看得见他的玩家�Q�该消息也是包括所有的动作�Q�和主角消息不同的是该种消息是服务器�q�播�l�客��L��的，而主角消息一般是客户端主动发�l�服务器的。最后是界面消息�Q�界面消息包括是服务器发�l�客��L��的聊天消息和各种属�?/font>及状态信息�?br>
　　下面来谈谈消息的�l�成。一般来��_��一个消息由消息头和消息体两部分�l�成�Q�其中消息头的长度是不变的，而消息体的长度是可变的，在消息体中需要保存消息体的长度。由于要�l�每条消息一个很明显的区分，所以需要定义一个消息头�Ҏ��的标志，然后需要消息的�c�d��以及消息ID。消息头大体�l�构如下�Q?br>
type struct message_s {

    unsigned short message_sign;

    unsigned char message_type;

    unsigned short message_id

    unsigned char message_len

}message_t;

服务器的�q�播

　　服务器的�q�播的重点就在于如何计算出广播的对象。很昄��Q�在一张很大的地图里面�Q�某个玩家在最东边的一个动作，一个在最西边的玩家是应该看不到的�Q�那么怎么来计��广播的对象呢？最��单的办法�Q�就是把地图分块�Q�分成大��合适的��块�Q�然后每�ơ只象周围几个小块的玩家�q�行�q�播。那么究竟切到多大比较合适呢�Q�一般来��_��切得块大了，内存的消耗会增大�Q�切得块��了�Q�CPU的消耗会增大�Q�原因会在后面提刎ͼ�。个��得切成一屏左右的��块比较合适，每次�q�播�q�播周围九个��块的玩�Ӟ��׃��q�播的操作非帔R��J�，那么遍利周围九块的操作就会变得相当的频繁�Q�所以如果块分得��了�Q�那么遍利的范围��׃��扩大�Q�CPU的资源会很快的被吃完�?br>
　　切好块以后，怎么让玩家在各个块之间走来走��d��Q�让我们来想惛_��切换一�ơ块的时候要做哪些工作。首先，要算��Z��个块的周围九块的玩家有哪些是现在当前块没有的�Q�把自己的信息广播给那些玩家�Q�同时也要算��Z��个块周围九块里面有哪些物件是现在没有的，把那些物件的信息�q�播�l�自己，然后把下个块的周围九快里没有的，而现在的块周围九块里面有的物件的消失信息�q�播�l�自己，同时也把自己消失的消息广播给那些物�g。这个操作不仅烦琐而且会吃掉不��CPU资源�Q�那么有什么办法可以很快的��出�q�些物�g呢？一个个做比较？昄��看�v来就不是个好办法�Q�这里可以参照二�l�矩�늢�撞检��的一些思�\�Q�以自己周围九块��Z��个矩阵，目标块周围九块�ؓ另一个矩阵，��这两个矩阵是否��撞�Q�如果两个矩�늛�交，那么没相交的那些块怎么��。这里可以把�怺�的块的坐标�{换成内部坐标�Q�然后再�q�行�q�算�?br>
　　对于�q�播�q�有另外一�U?a onclick="javascript:tagshow(event, '%BD%E2%BE%F6');" href="javascript:;" target=_self>解决�Ҏ��Q�实施�v来不如切块来的简单，�q�种�Ҏ��需要客��L��来协助进行运��。首先在服务器端的连接结构里面需要增加一个广播对象的队列�Q�该队列在客��L��登陆服务器的时候由服务器传�l�客��L��Q�然后客��L��自己来维护这个队列，当有��出客��L��视野的时候，由客��L��d��要求服务器给那个物�g发送消��q��消息。而对于有人总进视野的情况，则比较麻烦了�?br>
　　首先需要客��L��在每�ơ给服务器发送update position的消息的时候，服务器都�l�该�q�接��出一个视野范��_��然后在需要广播的时候，循环整张地图上的玩家�Q�找到坐标在其视野范围内的玩家。��用这�U�方法的好处在于不存在�{换块的时候需要一�ơ性广播大量的消息�Q�缺点就是在计算�q�播对象的时候需要遍历整个地图上的玩�Ӟ��如果当一个地图上的玩家多得比较离��q��时候，该操作就会比较的慢�?br>

服务器的同步

　　同步在网�l�游戏中是非帔R��要的�Q�它保证了每个玩家在屏幕上看到的东西大体是一��L��。其实呢�Q�解军_��步问题的最��单的�Ҏ��是把每个玩家的动作都向其他玩家�q�播一遍，�q�里其实��存在两个问题：1�Q�向哪些玩家�q�播�Q�广播哪些消息�?�Q�如果网�l��g�q�怎么办。事实上呢，�W�一个问题是个非常简单的问题�Q�不�q�之所以我提出�q�个问题来，是提醒大家在设计自己的消息结构的时候，需要把�q�个因素考虑�q�去。而对于第二个问题�Q�则是一个挺�ȝ��的问题，大家可以来看�q�么个例子：

　　比如有一个玩家A向服务器发了�?a onclick="javascript:tagshow(event, '%D6%B8%C1%EE');" href="javascript:;" target=_self>指��o�Q�说我现在在P1点，要去P2炏V��指令发出的旉��是T0�Q�服务器收到指��o的时间是T1�Q�然后向周围的玩家广播这条消息，消息的内�Ҏ��“玩家A从P1到P2”有一个在A附近的玩家B�Q�收到服务器的这则广播的消息的时间是T2�Q�然后开始在客户端上��d��Q�A从P1到P2炏V��这个时候就存在一个不同步的问题，玩家A和玩家B的屏�q�上昄��的画面相差了T2-T1的时间。这个时候怎么办呢�Q?br>

　　有个解决�Ҏ��Q�我�l�它取名�?预测拉扯�Q�虽然有些怪异了点�Q�不�q�基本上大家也能从字面上来理解它的意思。要解决�q�个问题�Q�首先要定义一个值叫�Q�预��误差。然后需要在服务器端每个玩家�q�接的类里面加一��属性，叫latency�Q�然后在玩家登陆的时候，对客��L��的时间和服务器的旉��q�行比较�Q�得出来的差��g��存在latency里面。还是上面的那个例子�Q�服务器�q�播消息的时候，��根据要�q�播对象的latency�Q�计��出一个客��L��的CurrentTime�Q�然后在消息头里面包含这个CurrentTime�Q�然后再�q�行�q�播。�ƈ且同时在玩家A的客��L��本地建立一个队列，保存该条消息�Q�只到获得服务器验证��׃��未被验证的消息队列里面将该消息删除，如果验证��p�|�Q�则会被拉扯回P1炏V��然后当玩家B收到了服务器发过来的消息“玩家A从P1到P2”�q�个时候就��查消息里面服务器发出的时间和本地旉��做比较，如果大于定义的预��误差，��q��出在T2�q�个旉��Q�玩家A的屏�q�上走到的地点P3�Q�然后把玩家B屏幕上的玩家A直接拉扯到P3�Q�再�l�箋��C��去，�q�样��p��保证同步。更�q�一步，��Z��保证客户端运行�v来更加smooth�Q�我�q�不推荐直接把玩家拉扯过去，而是��出P3偏后的一点P4�Q�然后用(P4-P1)/T(P4-P3)来算��Z��个很快的速度S�Q�然后让玩家A用速度S快速移动到P4�Q�这��L��处理�Ҏ��是比较合理的�Q�这�U�解��x��案的原�Ş在国际上被称为（Full plesiochronous�Q�，当然�Q�该原�Ş被我��改了很多来适应�|�络游戏的同步，所以而变成所谓的�Q�预��拉扯�?br>
　　另外一个解��x��案，我给它取名叫验证同步�Q�听名字也知道，大体的意思就是每条指令在�l�过服务器验证通过了以后再执行动作。具体的思�\如下�Q�首先也需要在每个玩家�q�接�c�d��里面定义一个latency�Q�然后在客户端响应玩安��标行走的同时�Q�客��L��q�不会先行走动，而是发一条走路的指��o�l�服务器�Q�然后等待服务器的验证。服务器接受到这条消息以后，�q�行逻辑层的验证�Q�然后计��出需要广播的范围�Q�包括玩家A在内�Q�根据各个客��L��不同的latency生成不同的消息头�Q�开始广播，�q�个时候这个玩家的走�\信息��是完全同步的了。这个方法的优点是能保证各个客户端之间绝对的同步�Q�缺�Ҏ��当网�l��g�q�比较大的时候，玩家的客��L��的行��Z��变得比较不流畅，�l�玩家带来很不爽的感觉。该�U�解��x��案的原�Ş在国际上被称为（Hierarchical master-slave synchronization�Q�，80�q�代以后被广泛应用于�|�络的各个领域�?br>
　　最后一�U�解��x��案是一�U�理惛_��的解��x��案，在国际上被称为Mutual synchronization�Q�是一�U�对未来�|�络的前景的良好预测出来的解��x��案。这里之所以要提这个方案，�q�不是说我们已经完全的实��C��q�种�Ҏ��Q�而只是在�|�络游戏领域的某些方面应用到�q�种�Ҏ��的某些思想。我对该�U�方案取名�ؓ�Q�半服务器同步。大体的设计思�\如下�Q?br>
　　首先客户端需要在登陆世界的时候徏立很多张�q�播列表�Q�这些列表在客户端后台和服务器要�q�行不及时同步，之所以要建立多张列表�Q�是因�ؓ要广播的�c�d��是不止一�U�的�Q�比如说有local message,有remote message,�q�有global message �{�等�Q�这些列表都需要在客户端登陆的时候根据服务器发过来的消息建立好。在建立列表的同�Ӟ��q�需要获得每个列表中�q�播对象的latency�Q��ƈ且要�l�护一张完整的用户状态列表在后台�Q�也是不及时的和服务器进行同步，�Ҏ��本地的用��L��态表�Q�可以做��C��部分决策由客��L��自己来决定，当客��L��发送这部分决策的时候，则直接将最�l�决�{�发送到各个�q�播列表里面的客��L��Q��ƈ对其旉��q�行校对�Q�保证每个客��L��在收到的消息的时间是和根据本地时间进行校对过的。那么再采用预测拉扯中提到过的计��提前量�Q�提高速度行走�q�去的方法，��会使同步变得非常的smooth。该�Ҏ��的优�Ҏ��不通过服务器，客户端自�׃��间进行同步，大大的降低了�׃��|�络延迟而带来的误差�Q��ƈ且由于大部分决策都可以由客户端来做，也大大的降低了服务器的资源。由此带来的弊端��是�׃��消息和决�{�权都放在客��L��本地�Q�所以给外挂提供了很大的可乘之机�?/font>

　下面我想来谈谈关于服务器上NPC的设计以及NPC��{�一些方面涉及到的问题。首先，我们需要知道什么是NPC�Q�NPC需要做什么。NPC的全�U�是�Q�Non-Player Character�Q�，很显�Ӟ��他是一个character�Q�但不是玩家�Q�那么从�q�点上可以知道，NPC的某些行为是和玩家类似的�Q�他可以行走�Q�可以战斗，可以呼吸�Q�这点将在后面的NPC��里面提到�Q�，另外一点和玩家物�g不同的是�Q�NPC可以复生�Q�即NPC被打��M��后在一定时间内可以重新出来�Q�。其实还有最重要的一点，��是玩家物�g的所有决�{�都是玩家做出来的，而NPC的决�{�则是由计算机做出来的，所以在对NPC做何�U�决�{�的时候，需要所谓的NPC��来进行决�{��?br>
　　下面我将分两个部分来谈谈NPC�Q�首先是NPC��Q�其�ơ是服务器如何对NPC�q�行�l�织。之所以要先谈NPC��是因为只有当我们了解清楚我们需要NPC做什么之后，才好开始设计服务器来对NPC�q�行�l�织�?br>

NPC��

　　NPC��分�ؓ两种�Q�一�U�是被动触发的事�Ӟ��一�U�是��d��触发的事件。对于被动触发的事�g�Q�处理�v来相�Ҏ��说简单一些，可以�׃��件本�w�来呼叫NPC�w�上的函敎ͼ�比如说NPC的死亡，实际上是在NPC的HP��于一定值的时候，来主动呼叫NPC�w�上的OnDie() 函数�Q�这�U�由事�g来触发NPC行�ؓ的NPC��Q�我�U�Cؓ被动触发。这�U�类型的触发往往分�ؓ两种�Q?br>
一�U�是由别的物件导致的NPC的属性变化，然后属性变化的同时会导致NPC产生一些行为。由此一来，NPC物�g里面臛_��包含以下几种函数�Q?br>
class NPC {

public:

    // 是谁在什么地方导致了我哪��属性改变了多少�?br>
    OnChangeAttribute(object_t *who, int which, int how, int where);

Private:

    OnDie();

    OnEscape();

    OnFollow();

    OnSleep();

    // 一�p�d��的事件�?br>
}

　　�q�是一个基本的NPC的结构，�q�种被动的触发NPC的事�Ӟ��我称它�ؓNPC的反��。但是，�q�样的结构只能让NPC被动的接收一些信息来做出决策�Q�这��L��NPC是愚蠢的。那么，怎么栯��一个NPC能够��d��的做��Z��些决�{�呢�Q�这里有一�U�方法：呼吸。那么怎么栯��NPC有呼吸呢�Q?br>
　　一�U�很��单的�Ҏ��Q�用一个计时器�Q�定时的触发所有NPC的呼吸，�q�样��可以让一个NPC有呼吸�v来。这��L��话会有一个问题，当NPC太多的时候，上一�ơNPC的呼吸还没有呼吸完，下一�ơ呼吸又来了�Q�那么怎么解决�q�个问题呢。这里有一�U�方法，让NPC异步的进行呼吸，��x��个NPC的呼吸周期是�Ҏ��NPC出生的时间来定的�Q�这个时候计时器需要做的就是隔一�D�|��间检查一下，哪些NPC到时间该呼吸了，��来触发�q�些NPC的呼吸�?br>
　　上面提到的是�pȝ��如何来触发NPC的呼吸，那么NPC本��n的呼吔R��率该如何讑֮�呢？�q�个��好象现实中的�h一��P��睡觉的时候和�q�行�Ȁ烈运动的时候，呼吸频率是不一��L��。同��P��NPC在战斗的时候，和��^常的时候，呼吸频率也不一栗��那么就需要一个Breath_Ticker来设�|�NPC当前的呼吔R��率�?br>
　　那么在NPC的呼�怺�仉��面，我们怎么��h��讄��NPC的智能呢�Q�大体可以概括�ؓ��查环境和做出决策两个部分。首先，需要对当前环境�q�行数字上的�l�计�Q�比如说是否在战斗中�Q�战斗有几个敌�h�Q�自��q��HP�q�剩多少�Q�以及附�q�有没有敌�h�{�等之类的统计。统计出来的数据传入本��n的决�{�模块，决策模块则根据NPC自��n的性格取向来做��Z��些决�{�，比如说野蛮型的NPC会在HP比较��的时候仍然猛扑猛打，又比如说智慧型的NPC则会在HP比较��的时候选择逃跑。等�{�之�cȝ��?br>
　　��x��Q�一个可以呼吸，反射的NPC的结构已�l�基本构成了�Q�那么接下来我们��来谈谈�pȝ��如何�l�织让一个NPC出现在世界里面�?br>

NPC的组�l?/strong>

　　�q�里有两�U�方案可供选择�Q�其一�Q�NPC的位�|�信息保存在场景里面�Q�蝲入场景的时候蝲入NPC。其二，NPC的位�|�信息保存在NPC�w�上�Q�有专门的事件让所有的NPC登陆场景。这两种�Ҏ��有什么区别呢�Q�又各有什么好坏呢�Q?br>
　　前一�U�方法好处在于场景蝲入的时候同时蝲入了NPC�Q�场景就可以对NPC�q�行��理�Q�不需要多余的处理�Q�而弊端则在于在刷新的时候是同步��h��的，也就是说一个场景里面的NPC可能会在同一旉��内长出来。而对于第二种�Ҏ��呢，设计��h��会稍微麻烦一些，需要一个统一的机制让NPC登陆到场景，�q�需要一些比较麻烦的设计�Q�但是这�U�方案可以实现NPC异步的刷斎ͼ�是目前网�l�游戏普遍采用的�Ҏ��Q�下面我们就来着重谈谈这�U�方法的实现�Q?br>
　　首先我们要引入一�?#8220;灵魂”的概念，即一个NPC在死后，消失的只是他的肉体，他的灵魂仍然在世界中存在着�Q�没有呼吸，在死亡的附近漂��Q�Q�等着到时间投胎，投胎的时候把之前的所有属性清�Ӟ��重新在场景上构徏其肉体。那么，我们怎么来设计这样一个结构呢�Q�首先把一个场景里面要出现的NPC制作成图量表�Q�给每个NPC一个独一无二的标识符�Q�在载入场景之后�Q�根据图量表来蝲入属于该场景的NPC。在NPC的OnDie() 事�g里面不直接把该物件destroy 掉，而是关闭NPC的呼吸，然后打开一个重生的计时器，最后把该物件设�|��ؓinvisable。这��L��设计�Q�可以实现NPC的异步刷斎ͼ�在节省服务器资源的同时也让玩家觉得更加的真实�?br>
�Q�这一章节已经牉|��C��些服务器脚本相关的东西，所以下一章节��谈谈服务器脚本相关的一些设计）

补充的谈谈启发式搜烦�Q�heuristic searching�Q�在NPC��中的应用�?br>
　　其主要思�\是在�q�度优先搜烦的同�Ӟ��下一层的所有节点经�q�一个启发函数进行过滤，一定范围内�~�小搜烦范围。众所周知的寻路A*��法��是典型的启发式搜烦的应用，其原理是一开始设计一个Judge(point_t* point)函数�Q�来获得point�q�个一点的代�h�Q�然后每�ơ搜索的时候把下一步可能到辄��所有点都经�q�Judge()函数评�h一下，获取两到三个代�h比较��的点，�l�箋搜烦�Q�那些没被选上的点��׃��会在�l�箋搜烦下去了，�q�样带来的后果的是可能求出来的不是最优�\径，�q�也是�ؓ什么A*��法在寻路的时候会走到障碍物前面再�l�过去，而不是预先就走斜�U�来�l�过该障��物。如果要��d��最优化的�\径的话，是不能用A*��法的，而是要用动态规划的�Ҏ��Q�其消耗是�q�大于A*的�?br>
　　那么�Q�除了在寻�\之外�Q�还有哪些地方可以应用到启发式搜索呢�Q�其实说得大一点，NPC的�Q何决�{�都可以用启发式搜烦来做�Q�比如说逃跑吧，如果是一�?D的网�l�游戏，有八个方向，NPC选择哪个方向逃跑呢？��可以设�|�一个Judge(int direction)来给定每个点的代��P��在Judge里面��上该点的敌人的强弱�Q�或者该敌�h的敏捷如何等�{�，最后选择代�h最��的地方逃跑。下面，我们��来谈谈对于几种NPC常见的智能的启发式搜索法的设计：

Target select �Q�选择目标�Q�：

　　首先获得地图上离该NPC附近的敌人列表。设计Judge() 函数�Q�根据敌人的强弱�Q�敌人的�q�近�Q�算��Z��仗��然后选择代�h最��的敌�h�q�行��d��d��?br>
Escape�Q�逃跑�Q�：

　　在呼�怺�仉��面检查自��q��HP�Q�如果HP低于某个值的时候，或者如果你是远�E�兵�U�，而敌��w�的话，则触发逃跑函数�Q�在逃跑函数里面也是对周围的所有的敌�h�l�织成列表，然后设计Judge() 函数�Q�先选择出对你构成威胁最大的敌�h�Q�该Judge() 函数需要判断敌人的速度�Q�战斗力强弱�Q�最后得��Z��个主要敌人，然后针对该主要敌��行�\径的Judge() 的函数的设计�Q�搜索的范围只可能是和主要敌人相反的方向�Q�然后再�Ҏ��该几个方向的敌�h的强弱来计算代�h�Q�做出最后的选择�?br>
Random walk�Q�随��路）�Q?br>
　　�q�个我�ƈ不推荐用A*��法�Q�因为NPC一旦多��h��Q�那么这个对CPU的消耗是很恐怖的�Q�而且NPC大多不需要长距离的寻路，只需要在附近走走卛_��Q�那么，��在附近随机的给几个点，然后让NPC走过去，如果��到障碍物就停下来，�q�样几乎无�Q何负担�?br>
Follow Target�Q�追随目标）�Q?br>
　　�q�里有两�U�方法，一�U�方法NPC看上��L��较愚蠢，一�U�方法看上去NPC比较聪明�Q�第一�U�方法就是让NPC跟着目标的�\点走卛_��Q�几乎没有资源消耗。而后一�U�则是让NPC在跟随的时候，在呼�怺�仉��面判断对方的当前位置�Q�然后走直线�Q�碰上障��物了用A*�l�过去，该种设计会消耗一定量的系�l�资源，所以不推荐NPC大量的追随目标，如果需要大量的NPC�q�随目标的话�Q�还有一个比较简单的�Ҏ��Q�让NPC和目标同步移动，卌��他们的速度�l�一�Q�移动的时候走同样的�\点，当然�Q�这�U�设计只适合NPC所跟随的目标不是追杀的关�p�，只是跟随着玩家走而已了�?/font>

　在这一章节�Q�我惌��谈关于服务器端的脚本的相兌��计。因为在上一章节里面�Q�谈NPC��相关的时候已�l�接触到一些脚本相关的东东了。还是先来谈谈脚本的作用吧�?br>　　在基于编译的服务器端�E�序中，是无法在�E�序的运行过�E�中构徏一些东西的�Q�那么这个时候就需要脚本语�a�的支持了�Q�由于脚本语�a�涉及到逻辑判断�Q�所以光提供一些函数接口是没用的，�q�需要提供一些简单的语法和文法解析的功能。其实说到底�Q��Q何的事�g都可以看成两个部分：�W�一是对自��n�Q�或者别的物件的数值的改变�Q�另外一个就是将该事件以文字或者图形的方式�q�播出去。那么，�q�里牉|��C��个很重要的话题，��是�Ҏ��一物�g�q�行��d��。恩�Q�谈到这�Q�我惛_��本章节分��Z��个部分来谈，首先是服务器如何来管理动态创建出来的物�g�Q�服务器内存��理�Q�，�W�二是如何对某一物�g�q�行��d��Q�第三则是脚本语�a�的组�l�和解释。其实之所以到�W�四章再来谈服务器的内存��理是因为在前几章谈�q�个的话�Q�大家对其没有一个感性的认识�Q�可能不知道服务器的内存��理�I�竟有什么用�?br>
4.1、服务器内存��理
　　对于服务器内存管理我们将采用内存池的�Ҏ��Q�也�U�Cؓ静态内存管理。其概念为在服务器初始化的时候，甌��一块非常大的内存，�U�Cؓ内存池（Memory pool�Q�，同时也申请一��块内存�I�间�Q�称为垃圑֛�收站�Q?span class=English>Garbage recollecting station�Q�。其大体思�\如下�Q�当�E�序需要申请内存的时候，首先��查垃圑֛�收站是否为空�Q�如果不为空的话�Q�则从垃圑֛�收站中找一块可用的内存地址�Q�在内存池中�Ҏ��地址扑ֈ�相应的空��_��分配�l�程序用�Q�如果垃圑֛�收站是空的话�Q�则直接从内存池的当前指针位�|�申请一块内存；当程序释攄��间的时候，�l�那块内存打上已�l�释放掉的标讎ͼ�然后把那块内存的地址攑օ�垃圾回收站�?br>　　下面具体谈谈该方法的详细设计�Q�首先，我们��采用类��g��操作�pȝ��的段��式�pȝ��来管理内存，�q�样的好处是可以充分的利用内存池�Q�其�~�点是管理�v来比较麻烦。嗯�Q�下面来具体看看我们怎么��h��定义��和�D늚��l�构�Q?br>
　　typedef struct m_segment_s
　　{
　　　　struct m_segment_s *next;　/* 双线链表 + 静态内存可以达到随��问和��序讉K��的目的，
　　　　　　　　　　　　　　　　　　　真正的想怎么讉K��Q�就怎么讉K��?*/
　　　　struct m_segment_s *pre; int flags;　　// 该段的一些标记�?/font>
　　　　int start;　　　　　　　　　　　　　　// 相对于该��늚�首地址�?/font>
　　　　int size;　　　　　　　　　　　　　　　// 长度�?/span>
　　　　struct m_page_s *my_owner;　　　　　　// 我是属于哪一��늚��?/span>
　　　　char *data;　　　　　　　　　　　　　　// 内容指针�?/span>
　　}m_segment_t;

　　typedef struct m_page_s
　　{
　　　　unsigned int flags;　　　/* 使用标记�Q�是否完全��用，是否�q�有�I�Z�� */
　　　　int size;　　　　　　　　/* 该页的大��，一般都是统一的，最后一��除�?*/
　　　　int end;　　　　　　　　/* 使用��C��么地方了 */
　　　　int my_index;　　　　　　/* 提供随机讉K��的烦�?*/
　　　　m_segment_t *segments;　　// ��内�D늚�头指针�?/font>
　　}m_page_t;

　　那么内存池和垃圾回收站怎么构徏呢？下面也给��Z��些构建相关的�?a onclick="javascript:tagshow(event, '%B4%FA%C2%EB');" href="javascript:;" target=_self>代码�Q?br>
　　static m_page_t *all_pages;
　　// total_size是��d��要申��L��内存敎ͼ�num_pages是��d��打算创徏多少个页面�?/font>
　　void initialize_memory_pool( int total_size, int num_pages )
　　{
　　　　int i, page_size, last_size;　　　　// ��出每个��面的大��?/font>
　　　　page_size = total_size / num_pages;　// 分配��_��的页面�?/font>
　　　　all_pages = (m_page_t*) calloc( num_pages, sizeof(m_page_t*) );
　　　　for ( i = 0; i < num_pages; i ++ )
　　　　{
　　　　　　// 初始化每个页面的�D�|��针�?/font>
　　　　　　all_pages[i].m_segment_t = (m_segment_t*) malloc( page_size );
　　　　　　// 初始化该��面的标记�?/font>
　　　　　　all_pages[i].flags |= NEVER_USED;
　　　　　　// 除了最后一个页面，其他的大��都是page_size 大小�?/font>
　　　　　　all_pages[i].size = page_size;
　　　　　　// 初始化随��问的索引�?/font>
　　　　　　all_pages[i].my_index = i;
　　　　　　// �׃��没有用过�Q�所以大��都�?
　　　　　　all_pages[i].end = 0;
　　　　}

　　　　// 讄��最后一个页面的大小�?/span>
　　　　if ( (last_size = total_size % num_pages) != 0 )
　　　　　　all_pages[i].size = last_size;
　　}

　　下面看看垃圾回收站怎么设计�Q?br>
　　int **garbage_station;
　　void init_garbage_station( int num_pages, int page_size )
　　{
　　　　int i;
　　　　garbage_station = (int**) calloc( num_pages, sizeof( int* ) );
　　　　for ( i = 0; i < num_pages; i ++)
　　　　{
　　　　　　// �q�里用unsigned short的高8位来储存首相对地址�Q�低8位来储存长度�?/font>
　　　　　　garbage_station[i] = (int*) calloc( page_size, sizeof( unsigned short ));
　　　　　　memset( garbage_station[i], 0, sizeof( garbage_station[i] ));
　　　　}
　　}

　　也许�q�样的脓代码会让大家觉得很不明白�Q�嗯�Q�我的代码水�q�确实不怎么��P��那么下面我来用文字方式来叙说一下大体的概念吧。对于段��式内存��理�Q�首先分成N个页面，�q�个是固定的�Q�而对于每个页面内的段则是动态的�Q�段的大��事先是不知道的�Q�那么我们需要回收的不仅仅是��面的内存，�q�包括段的内存，那么我们��需要一个二�l�数�l�来保存是哪个页面的那块�D늚�地址被释放了。然后对于申请内存的时候，则首先检查需要申请内存的大小�Q�如果不够一个页面大��的话，则在垃圾回收站里面寻扑֏�用的�D늩�间分配，如果找不刎ͼ�则申请一个新的页面空间�?br>　　�q�样用内存池的方法来��理整个游戏世界的内存可以有效的减少内存��片�Q�一定程度的提高游戏�q�行的稳定性和效率�?br>
4.2、游戏中物�g的寻址
　　�W�一个问题，我们��Z��么要��d��Q�加入了脚本语言的概念之后，游戏中的一些逻辑物�g�Q�比如说NPC�Q�某个ITEM之类的都是由脚本语言在游戏运行的�q�程中动态生成的�Q�那么我们通过什么样的方法来对这些物件进行烦引呢�Q�说得简单一点，��是如何扑ֈ�他们呢？有个很简单的�Ҏ��Q�全部遍历一�ơ。当�Ӟ��q�是个简单而有效的�Ҏ��Q�但是效率上的消耗是��M��一台服务器都吃不消的，特别是在游戏的规模比较大之后�?br>　　那么�Q�我们怎么来在游戏世界中很快的��L��q�些物�g呢？我想在谈�q�个之前�Q�说一下Hash Table�q�个数据�l�构�Q�它叫哈希表�Q�也有�h叫它散列表，其工作原理是不是��序讉K��Q�也不是随机讉K��Q�而是通过一个散列函数对其key�q�行计算�Q�算出在内存中这个key对应的value的地址�Q�而对其进行访问。好处是不管面对多大的数据，只需要一�ơ计��就能找到其地址�Q�非常的快捷�Q�那么弊端是什么呢�Q�当两个key通过散列函数计算出来的地址是同一个地址的时候，�ȝ��来了，会��生碰撞，其的解决�Ҏ��非常的麻烦，�q�里��׃��详细谈其解决�Ҏ��了，否则估计再写个四�Q�五章也未必谈得清楚�Q�不�q�如果大家对其感兴趣的话�Q�欢�q�讨论�?br>　　嗯，我们��用散列表来�Ҏ��戏中的物件进行烦引，具体怎么做呢�Q�首先，在内存池中申请一块两倍大于游戏中物�g��L��的内存，��Z��么是两倍大呢？防止散列表碰撞。然后我们选用物�g的名�U�C��为散列表的烦引key�Q�然后就可以开始设计散列函��C��。下面来看个例子�Q?br>
　　static int T[] =
　　{
　　　　1, 87, 49, 12, 176, 178, 102, 166, 121, 193, 6, 84, 249, 230, 44, 163,
　　　　14, 197, 213, 181, 161, 85, 218, 80, 64, 239, 24, 226, 236, 142, 38, 200,
　　　　110, 177, 104, 103, 141, 253, 255, 50, 77, 101, 81, 18, 45, 96, 31, 222,
　　　　25, 107, 190, 70, 86, 237, 240, 34, 72, 242, 20, 214, 244, 227, 149, 235,
　　　　97, 234, 57, 22, 60, 250, 82, 175, 208, 5, 127, 199, 111, 62, 135, 248,
　　　　174, 169, 211, 58, 66, 154, 106, 195, 245, 171, 17, 187, 182, 179, 0, 243,
　　　　132, 56, 148, 75, 128, 133, 158, 100, 130, 126, 91, 13, 153, 246, 216, 219,
　　　　119, 68, 223, 78, 83, 88, 201, 99, 122, 11, 92, 32, 136, 114, 52, 10,
　　　　138, 30, 48, 183, 156, 35, 61, 26, 143, 74, 251, 94, 129, 162, 63, 152,
　　　　170, 7, 115, 167, 241, 206, 3, 150, 55, 59, 151, 220, 90, 53, 23, 131,
　　　　125, 173, 15, 238, 79, 95, 89, 16, 105, 137, 225, 224, 217, 160, 37, 123,
　　　　118, 73, 2, 157, 46, 116, 9, 145, 134, 228, 207, 212, 202, 215, 69, 229,
　　　　27, 188, 67, 124, 168, 252, 42, 4, 29, 108, 21, 247, 19, 205, 39, 203,
　　　　233, 40, 186, 147, 198, 192, 155, 33, 164, 191, 98, 204, 165, 180, 117, 76,
　　　　140, 36, 210, 172, 41, 54, 159, 8, 185, 232, 113, 196, 231, 47, 146, 120,
　　　　51, 65, 28, 144, 254, 221, 93, 189, 194, 139, 112, 43, 71, 109, 184, 209,
　　};

　　// s是需要进行烦引的字符串指针，maxn是字�W�串可能的最大长度，�q�回值是相对地址�?/font>
　　inline int whashstr(char *s, int maxn)
　　{
　　　　register unsigned char oh, h;
　　　　register unsigned char *p;
　　　　register int i;

　　　　if (!*s)
　　　　　　return 0;
　　　　p = (unsigned char *) s;
　　　　oh = T[*p]; h = (*(p++) + 1) & 0xff;
　　　　for (i = maxn - 1; *p && --i >= 0; )
　　　　{
　　　　　　oh = T[oh ^ *p]; h = T[h ^ *(p++)];
　　　　}
　　　　return (oh << 8) + h;
　　}

　　具体的算法就不说了，上面的那一大段东西不要问我��Z��么，�q�个��法的出处是CACM 33-6中的一个叫Peter K.Pearson的鬼子写的论文中介绍的算法，据说速度非常的快。有了这个散列函敎ͼ�我们��可以通过它来对世界里面的��L��物�g�q�行非常快的��d��了�?br>
4.3、脚本语�a�解释
　　在设计脚本语�a�之前�Q�我们首先需要明白，我们的脚本语�a�要实��C��么样的功能？否则随心所�Ʋ的做下��d��Z��C的解释器之类的也说不定。我们要实现的功能只是简单的逻辑判断和��@环，其他所有的功能都可以由事先提供好的函数来完成。嗯�Q�这��h��们就可以列出一张工作量的表单：设计物�g在底层的保存�l�构�Q�提供脚本和底层间的讉K��接口�Q�设计支持逻辑判断和��@环的解释器�?br>　　下面先来谈谈物�g在底层的保存�l�构。具体到每种不同属性的物�g�Q�需要采用不同的�l�构�Q�当�Ӟ��如果你愿意的话，你可以所有的物�g都采同同��L��l�构�Q�然后在�l�构里面设计一个散列表来保存各�U�不同的属性。但�q��ƈ不是一个好�Ҏ��Q�过分的依赖散列表会让你的游戏的逻辑变得�J�杂不清。所以，��量的区分每�U�不同的物�g采用不同的结构来设计。但是有一点值得注意的是�Q�不��是什么结构，有一些东西是�l�一的，��是我们所说的物�g��_��那么我们怎么来设计这样一个物件头呢？

　　typedef struct object_head_s
　　{
　　　　char* name;
　　　　char* prog;
　　}object_head_t;

　　其中name是在散列表中�q�个物�g的烦引号�Q�prog则是脚本解释器需要解释的�E�序内容。下面我们就以NPC��Z��来设计一个结构：

　　typedef struct npc_s
　　{
　　　　object_head_t header;　　　　// 物�g�?/font>
　　　　int hp;　　　　　　　　　　　// NPC的hp倹{�?/font>
　　　　int level;　　　　　　　　　// NPC的等�U��?/font>
　　　　struct position_s position;　// 当前的位�|�信息�?/font>
　　　　unsigned int personality;　　// NPC的个性，一个unsigned int可以保存24�U�个性�?/span>
　　}npc_t;

　　OK�Q�结构设计完成，那么我们怎么来设计脚本解释器呢？�q�里有两�U�法�Q�一�U�是用虚拟机的模式来解析脚本语言�Q�另外一中则是用�c�M��汇编语言的那�U�结构来设计�Q�设�|�一些条件蟩转和循环��可以实现逻辑判断和��@环了�Q�比如：

　　set name, "路�h�?;
　　CHOOSE: random_choose_personality;　　// 随机选择NPC的个�?/font>
　　compare hp, 100;　　　　　　　　　　　// 比较气血�Q�比较出的值可以放在一个固定的变量里面
　　ifless LESS;　　　　　　　　　　　　　// hp < 100的话�Q�则�q�回�?/font>
　　jump CHOOSE;　　　　　　　　　　　　　// 否则�l�箋选择�Q�只到选到一个hp < 100的�?/span>
　　LESS: return success;

　　�q�种脚本�l�构��q��似CPU的指令的�l�构�Q�一条一条指令按照顺序执行，对于脚本�E�序员（Script. Programmer�Q�也可以培养他们汇编能力的说�?br>　　那么怎么来模仿这�U�结构呢�Q�我们拿CPU的指令做参照�Q�首先得讄��一些寄存器�Q�CPU的寄存器的大��和数量是受��g影响的，但我们是用内存来模拟寄存器，所以想要多大，��可以有多大。然后提供一些指令，包括四则�q�算�Q�寻址�Q�判断，循环�{�等。接下来针对不同的脚本用不同的解析方法，比如说对NPC��q��NPC固定的脚本，对ITEM��q��ITEM固定的脚本，解析完以后就把结果生成底层该物�g的结构用于��用�?br>　　而如果要用虚拟机来实现脚本语�a�的话呢，则会��工�E�变得无比之巨大�Q�强烈不推荐使用�Q�不�q�如果你惛_��一个通用的网�l�游戏底层的话，则可以考虑设计一个虚拟机。虚拟机大体的解释过�E�就是进行两�ơ编译，�W�一�ơ对关键字进行编译，�W�二�ơ生成汇�~�语�a��Q�然后虚拟机在根据编译生成的汇编语言�q�行逐行解释�Q�如果大家对�q�个感兴��的话，可以�?a class=cLink target=_blank>www.mudos.org�?a onclick="javascript:tagshow(event, '%CF%C2%D4%D8');" href="javascript:;" target=_self>下蝲一份MudOS的原码来研究研究�?/font>

��王 2009-01-02 03:54 发表评论

��王 — Thu, 01 Jan 2009 19:49:00 GMT

随着多核处理器的普及,如何充分利用多核�q�行工作��成为高性能�E�序设计的一个重炏V��本�p�d��文章��围�l�高性能�|�游服务器的实现,探讨�q�方面的技术�?br>
�|�游服务器的特点�?

��h��大量客户端连�?数百��x��千个),每个客户端都以一定的速率不断发送和接收数据;
服务器端的数据流量通常在几个至几十个Mbps之间;
数据需要实时处�?
数据包具有时序关�p?往往需要按照严格的先后��序予以处理�?br>
�|�游服务器实际上代表了一�c�d��型的新兴��数据处理服务器。这里只是�ؓ了讨论方便而限定于�|�游服务�?但是所讨论的原理和技术应该是普适的�?br>
同步多线�E�技术肯定是无法满��要求的。由于每个客��L��都在持箋和服务器交换数据,�pȝ��无法有效管理太多的�U�程;即��使用�U�程池技�?所能服务的客户�q�接也是很有限的。至于数据处理的实时性和数据的时序都无法��֏��?br>
异步技术有好几�U�方�?�q�里只讨论IOCP和轮询模式。IOCP是微软推动的技术。对非常大量的连�?数千��x��?很有效。但是由于��用了多线�E?�q�些�U�程需要把所需��d��的数据通过�׃�n的FIFO与主�U�程解�?否则无法保持时序)。这��造成频繁的线�E�切�?无法满��大数据量的实时处理要求。另�?�׃��|�卡只有一�?��׃��个网�l�地址而言),多线�E��ƈ不能增加��d��的速率。在另外一些时序要求不那么严格的场�?�q�些�U�程可以各自独立完成所有的处理��d��,只需要在�U�程内部保持数据的时序。这��是向同步多�U�程技术退化了�?br>
轮询是常用的模式。程序员把需要处理的Socket�q�接注册��C��个数据结构中,然后提交�l�系�l�检查它们的��d��状态。系�l�返回可供操作的Socket�q�接列表供程序员逐个处理。如果有数据可读��p��入�ƈ处理,如果可写则把相应的数据写出去。�ؓ了提高效率和�E�序�l�构的清晰�v�?Socket服务器通常单独使用一个线�E?�q�且通过FIFO数据�l�构和主�U�程解耦�?br>
在单核处理器�?上面�q�种轮询的模式是没有问题的。但是在多核�q�_��?用于解耦的FIFO��会变成�q�发瓉��。这是因��Z��l�的实现技术必��d��FIFO加锁。虽然网�l�线�E�和�ȝ��E�分别跑在不同的�怸�,理论上可以物理同时地�q�行(如果分别操作不同的数据项),但是同步锁却��q��其中的一个线�E�必��ȝ��待另外一个线�E�退��Z��界段,即��另外一个核�I�闲着�?br>
�q�时候就需要一�U�支持�ƈ发的数据�l�构,下面�U�C��为ConcurrentFIFO�?br>
public interface ConcurrentFIFO {
    public Object remove();
    public void put(Object o);
}

put�Ҏ��把一个数据对象推�q�FIFO,而remove�Ҏ��从FIFO删除�q�返回一个数据对象。通过�_�ֿ�设计,ConcurrentFIFO的实现是�U�程安全�?两个�U�程可以安全而同时地讉K��FIFO。这样在多核�q�_��上就能达到极高的性能�?br>
通用的ConcurrentFIFO是非帔R��于实现的。基本的技术是使用原子的CAS操作来实现。CAS即CompareAndSet。现代处理器基本上都能支持这一�c�L��令。但是这�U�数据结构的实现的一个很大的障碍��是垃圾回收。在多线�E��ƈ发运行的情况�?被原子替换下来的数据无法得知其是否是其它�U�程所需要的,也就无法军_��是否回收�q�块内存。除非有垃圾回收�?否则ConcurrentFIFO是很隑֮�现的�?鼓吹手工��理内存效率最高的朋友们请瞪大眼睛看清�?

其实,即��是对于有垃圾回收和内建线�E�支持的Java语言,要想构造一个支持�ƈ发的数据�l�构,也是极端困难的。java.util.concurrent包是�l�过�q�发领域的专�?Doug Lea,同时也是早期lig++的主要作�?以及DLmalloc的作者。我后面讨论内存��理的时候还要提��C��)�_�ֿ��~�写,�q�且由java�C�֌�的许多专家仔�l�评审测试之后才发布的�?/p>
现在来讨��Z��ơ提到的�q�发FIFO,其实现需要一些特�D�的技巧。我上次说要实现单线�E�读单线�E�写的FIFO,但是�q�里我们先来讨论一般的�q�发FIFO�?br>
我们知道,传统的生产者——消费者问�?通常是��用一个共享的�~�冲区来交换数据�?生��者和消费者各自有对应的指�?在生产或者消费的时候相应地�U�d��。如果达��C��~�冲区的边界则回�l�。如果生产者指针追上消费者指�?则表明缓冲区满了;如果消费者指针追上生产者指�?则表明缓冲区�I�Z��。问题在�?��Z��防止在缓冲区满的时候插入数�?或者在�~�冲区空的时候删除数�?生��者或者消费者的每一�ơ插入或者删除数据操�?都必��d��时访问这两个指针,�q�就带来了不必要的同步�?br>
在单核处理器�?�׃�n�~�冲区方式非帔R��?�q�且��h��固定的空间开销(有时候你需要保守地估计一个比较大的数�?。但是在多核处理器上(或者SMP�pȝ��?,如果要实现�ƈ发的FIFO,��必��L��弃这�U�方式。��用单链表而不是共享缓冲区��可以避开�q�个问题,�q�是�W�一个技巧�?br>
�W�二个技巧关�p�d��链表的��用方向。一般��用链�?其插入或者删除节点的位置是�Q意的。但是把链表作�ؓFIFO使用,则只能也只需要在两端操作。需要注意的是这时候必��M��N��TAIL插入新的节点,而从头部HEAD删除节点。否则从��N��删除节点之后,无从得知新的��N��在哪�?除非从头部遍历。这样做的好处是,插入或者删除都只涉及到一个节炏V��插入的时�?只要让新创徏的节点包含所需要插入的数据,�q�且其后�l?下一个节�?为NULL;再让当前��N��的节点的后��从NULL变成�q�个新节�?�q�个新节点也��变成了新的��N��节点(�q�里的操作顺序很关键)。删除的时�?则检查当前头部节点的后��NEXT是否NULL。若�?表明FIFO是空�?否则,取NEXT所包含的数据来使用(是的,是NEXT而不是当前头部节�Ҏ��包含的数�?参看下一个技巧和不变�?,�q�把该数据从NEXT中删�?而NEXT也成为新的头部节炏V�?没有配图,各位误��己想象一�?

最后一个技�?��Z��隔离对头部和��N��的访�?我们需要一个空节点N(不包含数据的有效节点),其下一个节点�ؓNULL;�q�且引入HEAD和TAIL。在开始的时�?HEAD和TAIL都等于N。插入和删除数据的过�E�上面已�l�讲�q�了,�q�里讲一下不变式�?br>
�W�一个不变式:头部节点��L��I�的(不包含数�?。在FIFO初始化的时候这是成立的。之后的插入操作不改变头部节�?因此对不变式没有影响。而对于删除操�?则每一个新头部节点的数据都已经在它成�ؓ新的头部节点的时候被删除(取用)了�?br>
�W�二个不变式:插入和删除操作没有数据冲�H?也就是说,插入�U�程和删除线�E�不会同时读写同一��Ҏ��?不是节点)。我们只需要考虑FIFO为空,即相当于刚刚完成初始化之后的情况。对于空节点N,插入操作改变其后�l?删除操作则检查其后��。只要插入线�E�保证先让新节点包含数据再把新节�Ҏ��入链�?也就是不能先插入�I��?再往节点中填入数�?,那么删除�U�程��׃��会拿到空的节炏V��我们看�?唯一可能发生争用的地方就是N的后�l�指�?插入�U�程只要在更新N的后�l�指针之前准备好其它相关数据和设�|�即可�?br>
�q�意味着,如果能够做到:1)一个线�E�对数据的更新能够被另外一个线�E�即�ȝ��?2)�Ҏ��据的��L��者写(更新和读取N的后�l�指�?都是原子�?3)指��o没有被�ؕ序执行。那么在单线�E�读单线�E�写的情况下,甚至不需要��用锁��可以安全地完成�q�发FIFO;如果有多个生产者线�E?则增加一个生产者锁;如果有多个消费者线�E?则可以增加一个消费者锁。也��是�?可以有四�U�组合�?br>
但是实际情况�q�非如此。对�?)是容易满��的,因�ؓ��C��通用处理器上32位数据的��L��者写通常都是原子的。对�?),则取决于�pȝ��的内存模�?在强内存模型如C/C++中是满��?在弱内存模型如Java中则不然。但是主要的问题�q�在�?)。由于指令的乱序执行,�W�二个不变式所需要的保证很可能被破坏,即��代码��实是那样写的。因此锁是必不可��的,因�ؓ加锁的同时还会插入内存屏障�?br>
�q�样看来,上次说的SRSW�q�发FIFO��没有特别的意义了。干脆就用两个锁分别对应生��者和消费�?而�ƈ不限制生产者或者消费者的数量:T_LOCK和H_LOCK。在插入新徏节点到链表尾部的时候��用T_LOCK,而在对头部操作的时候��用H_LOCK�?br>

具体的代码这里先不给了。这里的��法不是我发明的,而是来自Maged M. Michael �?nbsp;Michael L. Scott的Simple, Fast, and Practical Non-Blocking and Blocking Concurrent Queue Algorithms。请参考其双锁��法的伪码�?br>

现在来讨论游戏消息的传送。在一个网游的�q�营成本�?带宽费用应该是很大的一块。因此如何高效编码以及收发消息就成�ؓ节省�q�营成本的关键。这里面能做很多文章�?br>
首先是一个基本的判断:随着处理器的计算能力不断提高,以及多核的日益普�?在消息的�~�码以及收发环节,CPU资源��不会成为瓶颈。相对的,应该千方百计考虑如何在保证游戏正常运行的前提�?降低不必要的通信开销。也��是�?可以�Ҏ��戏中的消息进行一些比较复杂的�~�码�?br>
那么游戏中都有哪些消�?我们知道聊天和语��x��息优先��比较�?而且可以通过专门的服务器来处理。真正比较关键、能够媄响玩家的游戏体验�?是那些状态变更、动作、玩家之间或者玩家和服务�?NPC之间的实时交互的消息。尤其是,�q�些消息的传送有严格的时序要求。如果一个玩家先看到自己的角色被砍死,然后才看到对方发出来的攻��d��?甚至�Ҏ��没有看到�Ҏ��有什么动�?�?她肯定会愤愤不��^。因�?消息�pȝ��必须保证每一条消息的及时传�?�q�且不能打�ؕ它们之间的顺序�?br>
�q�意味着,每一条消息必��L��明确的边界。也��是�?收到一条消息之�?接收方必��能够明��这条消息有多少个字节。这是一条显而易见的要求。但是大概是��Z��惯�?在实践中它常常变为消息编码中的长度字�D�c�?br>
�q�无疑是一�U�浪贏V��很多消息的长度是固定的,仅仅靠检查其消息�c�d��可以了解其边界。变长消息的处理后面会讨论。我�q�里�q�不是说要把具体的游戏逻辑与网�l�代码�؜在一赗��通过使用元数据就可以有效的把�|�络代码跟具体的游戏逻辑有效隔离开来。关于元数据的��用后面也会详加探讨。今天时间不多了,下面讨论消息�c�d��的编码作为结束�?br>
通常一个字节会被用来编码消息的�c�d��,以方便接收方的解码。但是我们知�?游戏中�ƈ不是每种�c�d��的消息的传送频率都是一��L��。事实上,我们知道哪些消息会被大量发�?哪些消息的频率会低很�?而另外一些消�?一天也不会有几条。明乎此,��可以采用非对称的编码方式来�~�码消息的类型。这��是Huffman�~�码。对于占据了�l�大部分通信量的状态变更消息而言,即��每条消息节省下半个字�?也是非常划算的。以我的�l�验,一台普通PC可以作�ؓ服务器支�?000人同时在�U�的实时动作�c�L��?消息通量是每�U?0000�?如果一个服务集��有5台处理器,那么��q��当于节省�?00kbps的带宽。这�q�仅仅是从消息类型编码方面榨取的。当�?Huffman�~�码的解码是比较�ȝ��?效率也会低一些。但是正如前面所指出�?�q�部分的�q�行开销�q�不会造成性能瓉��?br>

��王 2009-01-02 03:49 发表评论

��王 — Thu, 01 Jan 2009 18:23:00 GMT
随着�|�游从业者的规模和需求不断扩大，��来��多的朋友进入了�|�游开发这个领域，使得市场中网游开发技术相关的需求量�q�猛增长。目前，�|�游行业比较紧缺的是��h��较深技术功底的“专家�?#8221;开发者，�q�主要包括两个方面：服务器端设计人员以及客户端设计�h员。对于网�l�游戏而言�Q�由于其主要的游戏逻辑计算是在服务器端完成的，数据同步与广播信息的传递也是通过服务器完成的�Q�所以，是否拥有一个有�l�验的服务器端设计�h员已�l�成��Z��Ƅ��品能否成功的关键之一。鉴于此�Q�本文将试图��q��游服务器设计的一�p�d��问题展开讨论和�ȝ��Q�笔者将�l�合自己的开发经验和体会�Q�将其中各方面内定w��一呈现。希望能够对以下三类人员有所帮助�Q?br>　　有一定网�l�编�E�基��、准备进入网游行业作服务器端设计的�h员；
　　正在从事�|�游服务器设计的人员�Q?br>　　�|�游��目的技术负责�h�?br>　　
　　�׃��|�游服务器的设计牉|��到太多内容，比如�Q�网�l�通信斚w��、�h工智能、数据库设计�{�等�Q�所以本文将重点从网�l�通信斚w��的内容展开��。谈到网�l�通信�Q�就不能不涉及如下五个问题：
[attach]1264[/attach]

[attach]1265[/attach]

[attach]1266[/attach]

[attach]1267[/attach]
1�?常见的网游服务通信器架构概�q?br>2�?�|�游服务器设计的基本原则
3�?�|�游服务器通信架构设计所需的基本技�?br>4�?�|�游服务器通信架构的测�?br>5�?�|�游服务器通信架构设计的常见问�?br>
下面我们��׃��W�一个问题说��P��

常见的网游服务器通信架构概述
　　目前�Q�国内的�|�游市场中大体存在两�U�类型的�|�游游戏�Q�MMORPG�Q�如�Q�魔兽世界）和休闲网游（如：QQ休闲游戏和联众游戏，而如泡��堂一�cȝ��游戏与QQ休闲游戏有很多相同点�Q�因此也归�ؓ此类�Q�。由于二者在游戏风格上的截然不同�Q�导致了他们在通信架构设计思�\上的较大差别。下面笔者将分别描述�q�两�U�网游的通信架构�?br>
1�Q�MMORPG�cȝ��游的通信架构
　　�|�游的通信架构�Q�通常是根据几个方面来��定的：游戏的功能组成、游戏的预计上线人数以及游戏的可扩展性�?br>　　目前比较通用的MMORPG游戏��程是这��L��Q?br>
a. 玩家到游戏官方网站注册用户名和密码�?br>b. 注册完成后，玩家选择在某一个区�Ȁ�z�L��戏�̎受��?br>c. 玩家在游戏客��L��中登录进入已�l�被�Ȁ�zȝ��游戏分区�Q�徏立游戏角色进行游戏�?br>
　　通常�Q�在�q�样的模式下�Q�玩家的角色数据是不能跨��Z��用的�Q�即�Q�在A区徏立的游戏角色在B区是无法使用的，各区之间的数据保持各自独立性。我们将�q�样独立的A区或B区称��Z��个独立的服务器组�Q�一个独立的服务器组��是一个相对完整的游戏世界。而网游服务器的通信架构设计�Q�则包括了基于服务器�l�之上的整个游戏世界的通信架构�Q�以及在一个服务器�l�之内的服务器通信架构�?br>
　　我们先来看看单独的服务器�l�内部的通信是如何设计的�?br>　　一个服务器�l�内的各服务器组成，要依据游戏功能进行划分。不同的游戏内容�{�划会对服务器的�l�成造成不同的媄响。一般地�Q�我们可以将一个组内的服务器简单地分成两类�Q�场景相关的�Q�如�Q�行走、战斗等�Q�以及场景不相关的（如：公会聊天、不受区域限制的贸易�{�）。�ؓ了保证游戏的��畅性，可以��这两类不同的功能分别交�׃��同的服务器去各自完成。另外，对于那些在服务器�q�行中进行的比较耗时的计��，一般也会将其单独提炼出来，交由单独的线�E�或单独的进�E�去完成�?br>
　　各个�|�游��目会根据游戏特点的不同�Q�而灵�z�选择自己的服务器�l�成�Ҏ��。经常可以见到的一�U�方案是�Q�场景服务器、非场景服务器、服务器��理器、AI服务器以及数据库代理服务器�?br>　　以上各服务器的主要功能是�Q?br>
　　场景服务器：它负责完成主要的游戏逻辑�Q�这些逻辑包括�Q�角色在游戏场景中的�q�入与退出、角色的行走与跑动、角色战斗（包括打怪）、�Q务的认领�{�。场景服务器设计的好坏是整个游戏世界服务器性能差异的主要体玎ͼ�它的设计隑ֺ�不仅仅在于通信模型斚w��Q�更主要的是整个服务器的体系架构和同步机制的设计�?br>
　　非场景服务器�Q�它主要负责完成与游戏场景不相关的游戏逻辑�Q�这些逻辑不依靠游戏的地图�pȝ��也能正常�q�行�Q�比如公会聊天或世界聊天�Q�之所以把它从场景服务器中独立出来�Q�是��Z��节省场景服务器的CPU和带宽资源，让场景服务器能够��可能快地处理那些对游戏��畅性媄响较大的游戏逻辑�?br>
　　服务器管理器�Q��ؓ了实��C��多的场景服务器之间以及场景服务器与非场景服务器之间的数据同步�Q�我们必��d��立一个统一的管理者，�q�个��理者就是服务器�l�中的服务器��理器。它的�Q务主要是在各服务器之间作数据同步�Q�比如玩家上下线信息的同步。其最主要的功能还是完成场景切换时的数据同步。当玩家需要从一个场景A切换到另一个场景B�Ӟ��服务器管理器负责��玩家的数据从场景A转移到场景B�Q��ƈ通过协议通知�q�两个场景数据同步的开始与�l�束。所以，��Z��实现�q�些内容�J�杂的数据同步�Q务，服务器管理器通常会与所有的场景服务器和非场景服务器保持socket�q�接�?br>
　　AI�Q��h工智能）服务器：�׃��怪物的�h工智能计��非常消耗系�l�资源，所以我们把它独立成单独的服务器。AI服务器的主要作用是负责计��怪物的AI�Q��ƈ��计��结果返回给场景服务器，也就是说�Q�AI服务器是单独为场景服务器服务的，它完成从场景服务器交�q�来的计��Q务，�q�将计算�l�果�q�回�l�场景服务器。所以，从网�l�通信斚w��来说�Q�AI服务器只与众多场景服务器保持socket�q�接�?br>
　　数据库代理服务器�Q�在�|�游的数据库��d��斚w��Q�通常有两�U�作法，一�U�是在应用服务器中直接加�q�数据库讉K��的代码进行数据库讉K��Q�还有一�U�方式是��数据库��d��独立出来�Q�单独作成数据库代理�Q�由它统一�q�行数据库访问�ƈ�q�回讉K��l�果�?br>
　　其中�Q�非场景服务器在不同的游戏项目中可能会被设计成不同的功能�Q�比如以�l�队、公会或全频道聊天�ؓ特色的游戏，很可能�ؓ了满��玩家的聊天需求而设立单独的聊天服务器；而如果是以物品��N易（如拍卖等�Q��ؓ特色的游戏，很可能�ؓ了满��x��卖的需求而单独设立拍卖服务器。到底是不是有必要将某一��Ҏ��戏功能独立处理成一个服务器�Q�要视该功能�Ҏ��戏的��d��景逻辑�Q�指行走、战斗等玩家日常游戏行�ؓ�Q�的影响�E�度而定。如果该功能对主场景逻辑的媄响比较大�Q�可能对��d��景逻辑的运行造成比较严重的性能和效率损失，那么应考虑��其从主场景逻辑中剥��，但能否剥��还有另一个前提：此功能是否与游戏场景�Q�即地图坐标�pȝ��Q�相兟뀂如果此功能与场景相兛_��实影响��C��d��景逻辑的执行效率，则可能需要在场景服务器上讄��专门的线�E�来处理而不是将它独立成一个单独的服务器�?br>
　　以上是一个服务器�l�内的各服务器组成情况介�l�，那么�Q�各服务器之间是如何通信的呢�Q�它的基本通信构架有哪些呢�Q?br>　　MMORPG的单�l�服务器架构通常可以分�ؓ两种�Q�第一�U�是带网关的服务器架构；�W�二�U�是不带�|�关的服务器架构。两�U�方案各有利弊�?br>
　　��带�|�关的服务器架构而言�Q�由于它对外只向玩家提供唯一的一个通信端口�Q�所以在玩家一侧会有比较流畅的游戏体验�Q�这通常也是那些��大规模无缝地图�|�游所采用的方案，但这�U�方案的�~�点是服务器�l�内的通信架构设计相对复杂、调试不方便、网关的通信压力�q�大、对�|�关的通信模型设计要求较高�{�。第二种�Ҏ��会同时向玩家开攑֤�个游戏服务器端口�Q�除了游戏场景服务器的通信端口外，同时�q�可能提供诸如聊天服务器�{�的通信端口。这�U�方案的主要�~�点是在�q�行场景服务器的切换�Ӟ��玩家客户端的表现中通常会有一个诸如场景调入的界面出现�Q�媄响了游戏的流畅感。基于这�U�方案的游戏在客��L��的界面处理方面，比较典型的表现是�Q�当要进行场景切换时�Q�只能通过相应�?#8220;传送功�?#8221;传送到另外的场景去�Q�或者需要进入新的场景时�Q�客��L��会有比较长时间的�{�待�q�入新场景的�{�待界面(Loading界面)�?br>
　　从技术角度而言�Q�笔者更們֐�于将独立的服务器�l�设计成带网关的模型�Q�虽然这加大了服务器的设计难度，但却增强了游戏的��畅感和安全性，�q�种��p��q�是值得的�?br>　　�W�者在下面附上了带�|�关的MMORPG通信架构图，希望能给业内的朋友们一�Ҏ��益的启��_�?

��王 2009-01-02 02:23 发表评论

一区二区在线免费观看,国产精品久久久久久超碰,亚洲欧美日韩系列

非boost版本的asio无法识别asio::placeholders::error和boost::system::error_code

libevent 无法解析的外部符�?__imp__WSASend

UDT协议-��Z��UDP的可靠数据传输协�?

(TCP-over-UDP library)��Z��UDP协议之上实现通用、可靠、高效的TCP协议

拼包函数及网�l�封包的异常处理

常用的setsockopt

使用VC9+PlatformSDK�~�写WinSock�E�序�Ӟ��#include WinSock2.h文�g��D���c�d��重定义问题（麻��G隔壁的，微��Y又想搞什么花��P��

Socket�E�序开发，发送端写入数据成功�Q�接收端收不到数据的现象分析

asio异步方式

asio同步方式

boost::asio 服务器端

�|�络游戏服务器设�?/font>收藏

�|�络游戏服务器设�?/h1> 上一��?/font> / 下一��?/font> 2008-02-22 17:34:18 / 个�h分类�Q?a >回收�?/font>

libevent 无法解析的外部符�?impWSASend

使用VC9+PlatformSDK�~�写WinSock�E�序�Ӟ��#include WinSock2.h文�g��D��c�d��重定义问题（麻��G隔壁的，微��Y又想搞什么花��P��

�|�络游戏服务器设�?/h1>
上一��?/font> / 下一��?/font> 2008-02-22 17:34:18 / 个�h分类�Q?a >回收�?/font>