国产精品vvv,欧美无乱码久久久免费午夜一区,国产乱码精品一区二区三

unix�׃�n内存要点

Range — Sun, 22 Jul 2012 16:08:00 GMT

�׃�n内存优点�Q?.在进�E�之间不通过内核传递数据，即不通过�pȝ��调用拯��数据�Q�达到快速，高效的数据传输�?br /> 2.随内核持�l?br />*nix的共享内存有两套API�Q�Posix和System V

两者的主要差别是共享内存的大小
1.Posix�׃�n内存大小可通过函数ftruncate随时修改
2.System V�׃�n内存大小在创建时��已�l�确定，而且最大值根据系�l�有所不同

Posix�׃�n内存
#include �Q�mmap�Q�munmap�Q�msync�Q�shm_open�Q�shm_unlink�Q?br />
最主要的函�? -- mmap
void* mmap(void* addr,size_t len,int prot,int flags,int fd,off_t offset)
函数��一个句柄映��到内存中，�q�个句柄可以是open的文件句柄，也可以是shm_open的共享内存区对象。当fd=-1时�ؓ匿名�׃�n内存�?br /> *nix一切皆文�g的观点，shm_open也是�?dev/shm目录下创��Z��个文件对象，�q�回对象的描�q�符�?br /> mmap��句柄作为共享内存的底层支撑对象�Q�映��到内存中，�q�样可以不通过read、write在进�E�之间共享内存。由此推��一下，�?nix的进�E�间传递数据更加原始的�Ҏ��是进�E�间��d��一个文件。但是频�J�的open、read、write、lseek�pȝ��调用会消耗过多的计算资源。所以想��C��这个文件句柄映��到内存中，�q�样��提高了�q�程间传递数据的效率�?br />
需要注意的函数 -- msync
当修改了内存映射区的内存后，内核会在某个时刻��文件的内容更新。�ؓ了确信文件被更新�Q�调用函数msync。文件的更新可以是同步（MS_SYNC�Q�也可以是异步（MS_ASYNC�Q�。（估计�q�里也是调用了函数write更新文�g�Q?br />
System V�׃�n内存
#include (shmget,shmat,shmdt,shmctl)
�׃��System V的共享内存有大小的限�Ӟ��所以可考虑�Q��用共享内存数�l�来解决�q�个问。虽然数�l�的大小即一个进�E�可以获取共享内存的数量也是有限�Ӟ��但是可以�~�解System V单个�׃�n内存�q�小的问题�?img src ="http://www.shnenglu.com/range/aggbug/184665.html" width = "1" height = "1" />

Range 2012-07-23 00:08 发表评论

Range — Sun, 01 Jul 2012 09:17:00 GMT

receive works as follows:

1. When we enter a receive statement, we start a timer (but only if an after section is present in the expression).

2. Take the first message in the mailbox and try to match it against Pattern1, Pattern2, and so on. If the match succeeds, the message is removed from the mailbox, and the expressions following the pattern are evaluated.

3. If none of the patterns in the receive statement matches the first message in the mailbox, then the first message is removed from the mailbox and put into a “save queue.” The second message in the mailbox is then tried. This procedure is repeated until a matching message is found or until all the messages in the mailbox have been examined.

4. If none of the messages in the mailbox matches, then the process is suspended and will be rescheduled for execution the next time a new message is put in the mailbox. Note that when a new message arrives, the messages in the save queue are not rematched; only the new message is matched.

5. As soon as a message has been matched, then all messages that have been put into the save queue are reentered into the mailbox in the order in which they arrived at the process. If a timer was set, it is cleared.

6. If the timer elapses when we are waiting for a message, then evaluate the expressions ExpressionsTimeout and put any saved messages back into the mailbox in the order in which they arrived at the process.

Range 2012-07-01 17:17 发表评论

strcasestr函数

Range — Sun, 09 Oct 2011 11:12:00 GMT

#define _GNU_SOURCE

#include

char *strcasestr(const char *haystack, const char *needle);

用于在c串haystack中查找c串needle�Q�忽略大��写。如果找到则�q�回needle串在haystack串中�W�一�ơ出现的位置的char指针

在实际的应用中如果只加上头文�Ӟ��当编译时会出�? warning: assignment makes pointer from integer without a cast

�q�是因�ؓ函数的声明在调用之后。未�l�声明的函数默认�q�回int型�?/span>

因此要在#include所�?/span>头文件之前加

#define _GNU_SOURCE �Q�以此解��x��问题�?/span>

Range 2011-10-09 19:12 发表评论

Range — Fri, 26 Aug 2011 12:04:00 GMT

Linux IO�pȝ��的架构图

一�Q?/span>讑֤�-------- 影响��盘性能的因�?/span>

��盘的�{速媄响硬盘的整体性能。一般情况下转速越大，性能会越好�?/span>

��盘的性能因素主要包括两个�Q?.�q�_��讉K��旉��2传输速率�?/span>

�q�_��讉K��旉��包括两方面因素：

�q�_��寻道旉��(Average Seek Time)是指��盘的磁头移动到盘面指定��道所需的时�?/span>。一般在3ms�?5ms之间�?/span>

�q�_��旋�{�{�待旉��(Latency)是指��头已处于要讉K��的磁道，�{�待所要访问的扇区旋�{至磁头下方的旉��?/span>一般在2ms�?ms之间�?/span>

传输速率(Data Transfer Rate) ��盘的数据传输率是指��盘��d��数据的速度�Q�单位�ؓ兆字节每�U�（MB/s�Q�。磁盘每�U�能传输80M~320M字节�?/span>

传输速率包括内部传输速率和外部传输速率�?/span>

内部传输�?Internal Transfer Rate) 也称为持�l�传输率(Sustained Transfer Rate)�Q�它反映了硬�?/span>�~�冲�?/span>未用时的性能。内部传输率主要依赖于硬盘的旋�{速度�?/span>

外部传输率（External Transfer Rate�Q�也�U�Cؓ�H�发数据传输�?/span>�Q?span>Burst Data Transfer Rate�Q�或接口传输率，它标�U�的�?/span>�pȝ��ȝ��与硬盘缓冲区之间的数据传输率�Q�外部数据传输率�?/span>��盘接口�c�d��?/span>��盘�~�存的大��有兟뀂STAT2 的传输速率�?00MB/s�U�别�?/span>

因此在硬件��上，提高��盘性能的关键主要是降低�q�_��讉K��旉��?/span>

二．讑֤�驱动

内存到硬盘的传输方式�Q�poll�Q�中断，DMA

DMA�Q�当 CPU 初始化这个传输动作，传输动作本��n是由 DMA 控制�?nbsp;来实行和完成�?/span>

DMA控制器获得�ȝ��控制权后�Q�CPU卛_��挂�v或只执行内部操作�Q�由DMA控制器输��写命令，直接控制RAM与I/O接口�q�行DMA传输。DMA每次传送的是磁盘上盔R��的扇区。Scatter-gather DMA允许传送不盔R��的扇区�?/span>

CPU性能与硬盘与内存的数据传输速率关系不大�?/span>

讑֤�驱动内有一个结构管理着IO的请求队�?/span>

structrequest_queue�Q�include/linux/Blkdev.h�Q?/span>

�q�里不仅仅有��d��h��的数据块�Q�还有用于IO调度的回调函数结构。每�ơ需要传输的时候，��׃��队列中选出一个数据块交给DMA�q�行传输�?/span>

所�?a name="_GoBack">IO调度的回调函数这是降低��^均访问的旉��的关键�?/span>

三．OS

IO调度�?/span>

Linux kernel提供了四个调度器供用户选择。他们是noop,cfq,deadline,as。可以在�pȝ��启动时设�|�内核参数elevator=来指定默认的调度器。也可以在运行时为某个块讑֤�讄��IO调度�E�序�?/span>

下面来简要介�l�这四个调度器的甉|��调度��法�?/span>

Noop�Q�最��单的调度��法。新的请求��L��被添加到队头或者队��，然后��L��从队头中选出��要被处理的��h��?/span>

CFQ�Q�（Complete FarinessQueueing�Q�它的目标是在所有请求的�q�程中��^均分配IO的带宽。因此，它会�Ҏ��q�程创徏自己的请求队列，然后��IO��h��攑օ�相应的队列中。在使用轮�{法从每个非空的队列中取出IO��h��?/span>

Deadline�Q��用了四个队列�Q�两个以��盘块序��h��序的��d��队列�Q�两个以最后期限时间排序的��d��队列。算法首先确定下一个读写的方向�Q�读的优先��高于写。然后检查被选方向的最后期限队列：如果最后期限时间的队列中有��时的请求，则将刚才的请求移动至队尾�Q�然后在��盘��h��序队列中从超时请求开始处理。当处理完一个方向的��h��后，在处理另一个方向的��h��。（读请求的��时旉��?00ms�Q�写��h��的超时时间是5s�Q?/span>

Anticipatory�Q�它是最复杂的IO调度��法。和deadline��法一��h��四个队列。还附带了一些启发式�{�略。它会从当前的磁头位�|�后的磁盘号中选择��h��。在调度了一个由P�q�程的IO��h��后，会检查下一个请求，如果�q�是P�q�程的请求，则立卌��度，如果不是�Q�同旉��P�q�程很快会发��求，则还廉��大约7ms的时间等待P�q�程的IO��h��?/span>

Write/Read函数

以ext3的write��Z��Q?/span>

�pȝ��调用write()的作用就是修攚w��高速缓存内的一些页的内容，如果��高速缓存内没有所要的��则分配�q�追加这些页�?/span>

当脏��达��C��定数量或者超时后�Q�将脏页刷回��盘。也可以执行相关�pȝ��调用�?/span>

��Z��么要辑ֈ�一定数量，是因为�g�q�写能在一定层度上提高�pȝ��的性能�Q�这也��得块讑֤�的��^均读��h��会多于写��h��?/span>

在程序中调用write函数�Q�将�q�入�pȝ��调用f_op->write。这个函数将调用ext3的do_sync_write。这个函数将参数��装后调用generic_file_aio_write。由参数名可以看出同步写变成了异步写。如果没有标记O_DIRECT�Q�将调用函数generic_file_buffered_write��写的内容写�q�kernel的高速页�~�存中。Buffer是以page为单位即4k。之后当调用cond_resched()�q�行�q�程的调度，DMA会将buffer中的内容写进��盘�?/span>

所以当每次�?k为单位写入硬盘时效率会达到最高。下面是UNIX环境高��~�程的实验结果：

下图是linux 的块讑֤�的数据操作层�ơ：

Sector扇区�Q�是讑֤�驱动和IO调度�E�序处理数据�_�度�?/span>

Block块：是VFS和文件系�l�处理数据的�_�度。其大小不唯一�Q�可以是512,1024,2048,4096字节。内核操作的块大��是4096字节�?/span>

Segment�D�：是DMA传送的单位。每一个段包含了相�ȝ��扇区�Q�它能��DMA传送不盔R��的扇区�?/span>

四．用户�E�序

�Ҏ��以上的分析，我们�?span>write buffer一般设�|��ؓ4K的倍数�?/span>

在程序中有意识的延迟写。这个是os的策略，当然也可以应用到�E�序的设计中。当然也会有�~�点�Q?.如果��g错误或掉电，则会丢失内容�Q�做额外的备份）2.需要额外的内存�I�间。（牺牲内存来提高IO的效率）

我们�q�需�Ҏ��pȝ��的IO调度器的调度�{�略�Q�设计出不同的IO�{�略。尽量降低磁盘的�q�_��讉K��旉��Q�降低请求队列，提高数据传输的速率�?/span>

五．监控��盘的工具和指标

Iostat–x –k 1

-x昄��更多的消�?nbsp;-k数据以KB为单�?1每秒昄��一��?/span>

输出昄��的信�?/span>

Iowait�Q�cpu�{�待未完成的IO��h��而空闲的旉��的比例�?/span>

Idle�Q�cpu�I�闲且无IO��h��的比例�?/span>

rrqm/s�Q�每�U�这个设备相关的��d��h��有多��被Merge了�?/span>

wrqm/s�Q�每�U�这个设备相关的写入��h��有多��被Merge了�?/span>

rsec/s�Q�每�U�读取的扇区敎ͼ�

wsec/�Q�每�U�写入的扇区数�?/span>

r/s�Q�每�U�完成的�?I/O 讑֤��ơ数。即 delta(rio)/s

w/s�Q�每�U�完成的�?I/O 讑֤��ơ数。即 delta(wio)/s

await�Q�每一个IO��h��的处理的�q�_��旉��Q�单位是毫秒�Q�。包括加入请求队列和服务的时间�?/span>

svctm: �q�_��每次讑֤�I/O操作的服务时间�?/span>

avgrq-sz: �q�_��每次讑֤�I/O操作的数据大��?(扇区)。即 delta(rsect+wsect)/delta(rio+wio)
avgqu-sz: �q�_��I/O队列长度。即 delta(aveq)/s/1000 (因�ؓaveq的单位�ؓ毫秒)�?/span>

%util�Q�在�l�计旉��内所有处理IO旉��Q�除以��d��l�计旉��。例如，如果�l�计间隔1�U�，该设备有0.8�U�在处理IO�Q��?.2�U�闲�|�，那么该设备的%util = 0.8/1 = 80%�Q�所以该参数暗示了设备的�J�忙�E�度。一般地�Q�如果该参数�?00%表示讑֤�已经接近满负药��行了�Q�当然如果是多磁盘，即��%util�?00%�Q�因为磁盘的�q�发能力�Q�所以磁盘��用未必就��C��瓉��Q��?/span>

下面我们做一个实验来分析一�?/span>

我们使用命��o

time dd if=/dev/zero of=/home/zhouyuan/mytest bs=1M count=3000

向mytest写入数据�Q�写�?G�?/span>

截取部分的状态监控：

如图2�Q�当两条数据 iowait 辑ֈ��?/span> 99% 以上�Q�写入的数据�?�Q�这是因为DMA��内存的中的数据传输�l�设备。结合图1的前两条数据�Q�利用率辑ֈ��?9%+却没有写入的��盘块�?/span>

如图3�Q�iowait下降�Q�说明cpu开始执行相关程序，而此时块讑֤�开始写入的数据。这两个操作是异步进行的�?/span>

Vmstat–k –n 1

Swap

　　si: 从磁盘交换到内存的交换页数量�Q�单位：KB/�U?/span>

　　so: 从内存交换到��盘的交换页数量�Q�单位：KB/�U?/span>

　　bi: �?/span>块设备接受的块数�Q�单位：�?�U?/span>

　　bo: 发送到块设备的块数�Q�单位：�?�U?/span>

从图中我们可以看出系�l�的延迟写�?/span>

Range 2011-08-26 20:04 发表评论

#pragma pack学习

Range — Fri, 15 Jul 2011 12:36:00 GMT

最�q�调试网�l�的服务端程序，自己写了一个小客户端程序来��试�Q�发现服务程序解包错误。经调试发现客户端的协议头大��和服务器端的协议头大小不一致。原因是服务器端加了#pragma pack(1),而客��L��没加�?/span>

之前没接触过�q�个�~�译宏，现在来认真学习之�?/span>

首先google�?/span>~~

原来#pragma pack有几�U��Ş式，我所接触到的�?/span>#pragma pack(n)�Q�即变量�?/span>n字节寚w��?/span>

变量寚w��在每个系�l�中是不一��L��Q�默认的寚w��方式能有效的提高cpu取指取数的速度�Q�但是可能会��费一定的�I�间。在�|�络�E�序中采�?/span>#pragma pack(1),卛_��量紧�~�，不但可以减少�|�络��量�Q�还可以兼容各种�pȝ��Q�不会因为系�l�对齐方式不同而导致解包错误�?/span>

了解了概念和优点�Q�现在我们就来测试之~

�q�_��Q?/span>CPU—Pentium E5700 内存—2G

1.操作�pȝ��Q?/span>ubuntu 11.04 32bit �~�译器：G++ 4.5.2

2.操作�pȝ��Q?/span>windows xp �~�译器：VS2010

先看�W�一个测试�?/span>

�l�构体在正常情况和紧�~�情况在以上不同环境下占用的内存大小�?/span>

1 struct pack {
2   int i;
3   short s;
4   double d;
5   char c;
6   short f;
7 }

��试�l�果为：

1�Q?br />

2�Q?br />

��试�l�果分析�Q?/span>

可以看出紧羃后结构体的大��ؓ15�Q�是�l�构体内�|�类型大��的和。但是在默认情况下，�l�构体的大小都是寚w��字节数的倍数�?/span>ubuntu�?/span>pack只需�?/span>20个字节，�?/span>windows�?/span>24个字节。这是因�?/span>ubuntu是以4字节寚w��Q��?/span>windows则是以最大的内置�c�d��的字节数寚w��Q�在�l�构体内最大的内置�c�d��?/span>double�Q�其大小�?/span>8个字节。他们在内存中的寚w��方式如下图：

1�Q?/span>

2�Q?/span>

�q�需注意的是�Q?/span>在对齐类型的内部都是�?/span>2字节寚w��的�?/span>

�l�论�Q?/span>在默认情况下�Q?/span>linux操作�pȝ��是以4字节寚w��Q?/span>windows操作�pȝ��则是以最大的内置�c�d��寚w��?/span>

�W�二个测�?/span>

一个结构体内包含另外一个结构体�Q�其大小的情��c�?/span>

内部的结构体�?/span>

1 struct pack {
2 short s;
3 double d;
4 }

外部的结构体�?/span>

1 struct complex _pack{

2   char c;
3   struct pack s;
4   double d;
5 };

我们有四�U�情况：

1. pack紧羃�Q?/span>complex _pack紧羃

2. pack紧羃�Q?/span>complex _pack默认

3. pack默认�Q?/span>complex _pack紧羃

4. pack默认�Q?/span>complex _pack默认

以下的排列均按此��序�?/span>

��试的结�?/span>

1�Q?/span>

2�Q?/span>

��试�l�果分析�Q?/span>

在两个操作系�l�下�Q�除了第一�U�情�?/span>----内结构体和外�l�构体都紧羃----相同之外�Q�其他三�U�情况都不相同。我们可以根据偏�Uȝ��出结构体在内存中的情��c��第一�U�情�늜�略�?/span>

1�Q?/span>

2�Q?/span>

�l�论�Q?/span>#pragma pack只媄响当前结构体的变量的寚w��情况�Q��ƈ不会影响�l�构体内部的�l�构体变量的排列情况。或者说#pragma pack的作用域只是一�?/span>。我们由�W�三�U�情况，内部�l�构体正常，外部�l�构体紧�~�，可以得出�l�构体的寚w��是按偏移计算的�?/span>

�q�里�q�有一个问题没解决�Q��ؓ什么第二种情况内部�l�构体的偏移都是1?不是4或�?�Q?/p>

Range 2011-07-15 20:36 发表评论

NAT学习

Range — Fri, 15 Jul 2011 12:35:00 GMT

The IP Network Address Translator�Q?/span>IP�|�络地址转换是�h们说�?/span>NAT�Q�或者说NA(P)T�?/span>NAT是�ؓ了解�?/span>IPv4地址不��而提出来得一�U�替代方案，可以对外界屏蔽内部的�|�络拓扑。随着�|�络的发展，NAT�ȝ��了构建在覆盖�|�络�?/span>P2P�E�序的发展。因��盖网�l�是构徏在应用层�Q�屏蔽了传输层以下的�|�络拓扑�Q�网�l�中的每一个节�Ҏ��某些节点有此�|�络的�\��p��Q�由�q�些路由表构建出�q�个覆盖�|�络�Q�但�?/span>NAT�ȝ��的覆盖网�l�中节点的连接�?br />


  上图昄��?/span>NAT的原理�?/span>NAT��内�|�的IP替换为公�|?/span>IP�Q�将端口映射为公�|�的端口。公�|?/span>IP替换内网IP是固定的�Q?/span>NAT的不��之处在于端口的替换。因�?/span>NAT�q�没有�Ş成标准，替换�{�略有几�U�，�q�也�?/span>NAT行�ؓ的关键�?/span>

在�?/span>Behavior and Classification of NAT Devices and Implications for NAT Traversal》一文中��把端口映射的行为分成四�U�，其中包括保留端口�Q�不保留端口�Q�端口重载，端口复用。这四种分类最�l�区分了NAT的四�U�类型即Full cone NAT�Q?/span>Symmetric NAT�Q?/span>Port-Restrictes cone NAT �Q?/span>Address-Restriced cone NAT�?/span>

��Z��使覆盖网�l�中的节点相互通信�Q�我们需要进�?/span>NAT�I�越。在�?/span>A NAT Traversal Mechanism for Peer-To-Peer Networks》一文种介绍了根据两端不同的NAT�c�d��对应的四�U?/span>NAT�I�越�Ҏ��。如下图

�q�些解决�Ҏ��都需�?/span>STUN�Q?/span>Simple Traversal of User Datagram Protocol through Network Address Translators (NATs)�Q?/span>NAT�?/span>UDP��单穿��）协议帮助。STUN协议要求一台具有公�|?/span>IP的主机帮助一��C��?/span>NAT�c�d��的判断�?br />

上图�?/span>STUN协议的流�E�，其主要的思想是通过STUN的回��来判断��L��?/span>NAT�c�d��?/span>

除了直接�q�接�Q�反向连接、打�z�和依赖都需要第三台��L��的帮助�?/span>

在�?/span>Characterization and Measurement of TCP Traversal through NATs and Firewalls》一文中介绍�?/span>TCP�I�越的方法。在STUNT#2�Ҏ��中，�W�三��C��机和两台需要连接的��L��都有长连接，当一斚w��要发��h��q�接�Ӟ��向第三台��L��发请求，�W�三��C��机向被请求的��L��发送邀��P��此时需要连接的��L��都向�Ҏ��发�?/span>SYN包，此时双方的防火墙都有了洞�Q�只要有一方的SYN包到辑֯�方主机，�q�接��׃��被徏立�?/span>Relay�Ҏ��需要耗费的代价太大，�?/span>P2P应用中一般会消极的处理双斚w��是对�U?/span>NAT的情��c�?/span>

Range 2011-07-15 20:35 发表评论

Initialization

Range — Fri, 15 Jul 2011 12:31:00 GMT

Hello World�Q?/span>

Range 2011-07-15 20:31 发表评论