伊人久久成人,国产精品99免视看9,欧美护士18xxxxhd

[转蝲]Linux�?r��n)态库和动态库

Mon, 17 Oct 2011 07:51:00 GMT

库从本质上来说是一�U�可执行代码的二�q�制格式�Q�可以被载入内存中执行。库分静(r��n)态库和动态库两种�?nbsp;

�?r��n)态库和动态库的区�?/h1>
1. �?r��n)态函数库

�q�类库的名字一般是libxxx.a�Q�利用静(r��n)态函数库�~�译成的文�g比较大，因�ؓ(f��)整个函数库的所有数据都�?x��)被整合�q�目标代码中�Q�他的优点就显而易见了(ji��n)�Q�即�~�译后的执行�E�序不需要外部的函数库支持，因�ؓ(f��)所有��用的函数都已�l�被�~�译�q�去�?ji��n)。当然这也会(x��)成�ؓ(f��)他的�~�点�Q�因为如果静(r��n)态函数库改变�?ji��n)，那么你的�E�序必须重新�~�译�?/p>
2. 动态函数库

�q�类库的名字一般是libxxx.so;相对于静(r��n)态函数库�Q�动态函数库在编译的时�?�q�没有被�~�译�q�目标代码中�Q�你的程序执行到相关函数时才调用该函数库里的相应函数�Q�因此动态函数库所产生的可执行文�g比较?y��u)��。由于函数库没有被整合进你的�E�序�Q�而是�E�序�q�行时动态的甌��q�调用，所以程序的�q�行环境中必��L��供相应的库。动态函数库的改变�ƈ不媄(ji��ng)响你的程序，所以动态函数库的升�U�比较方�ѝ�?nbsp;
linux�pȝ��有几个重要的目录存放相应的函数库�Q�如/lib /usr/lib�?/p>

�?r��n)态库的��?/h1>
�?r��n)态库的操作工��P��(x��)gcc和ar 命��o(h��)�?nbsp;

�~�写�?qi��ng)��用�?r��n)态库

(1)设计库源�?pr1.c �?pr2.c

[root@billstone make_lib]# cat pr1.c

void print1()

{

                printf("This is the first lib src!\n");

}

[root@billstone make_lib]# cat pr2.c

void print2()

{

                printf("This is the second src lib!\n");

}

       (2) �~�译.c 文�g

[bill@billstone make_lib]$ cc -O -c pr1.c pr2.c

[bill@billstone make_lib]$ ls -l pr.o

-rw-rw-r--        1 bill          bill                    804    4 �?nbsp; 15 11:11 pr1.o

-rw-rw-r--        1 bill          bill                    804    4 �?nbsp; 15 11:11 pr2.o

(3) 链接�?r��n)态库

    ��Z��(ji��n)在编译程序中正确扑ֈ�库文�?�?r��n)态库必须按照 lib[name].a 的规则命�?如下例中[name]=pr.

[bill@billstone make_lib]$ ar -rsv libpr.a pr1.o pr2.o

a - pr1.o

a - pr2.o

[bill@billstone make_lib]$ ls -l .a

-rw-rw-r--        1 bill          bill                  1822    4 �?nbsp; 15 11:12 libpr.a

[bill@billstone make_lib]$ ar -t libpr.a

pr1.o

pr2.o

(4) 调用库函��C��?main.c

[bill@billstone make_lib]$ cat main.c

int main()

{

                print1();

                print2();

                return 0;

}

(5) �~�译链接选项

    -L �?l 参数攑֜�后面.其中,-L 加蝲库文件�\�?-l 指明库文件名�?

[bill@billstone make_lib]$ gcc -o main main.c -L./ -lpr

[bill@billstone make_lib]$ ls -l main*

-rwxrwxr-x        1 bill          bill                11805    4 �?nbsp; 15 11:17 main

-rw-rw-r--        1 bill          bill                      50    4 �?nbsp; 15 11:15 main.c

(6)执行目标�E�序

[bill@billstone make_lib]$ ./main

This is the first lib src!

This is the second src lib!

[bill@billstone make_lib]$

动态库的��?/h1>
�~�写动态库

(1)设计库代�?/strong>

[bill@billstone make_lib]$ cat pr1.c

int p = 2;

void print(){

                printf("This is the first dll src!\n");

}

[bill@billstone make_lib]$

(2)生成动态库

[bill@billstone make_lib]$ gcc -O -fpic -shared -o dl.so pr1.c

[bill@billstone make_lib]$ ls -l .so

-rwxrwxr-x        1 bill          bill                  6592    4 �?nbsp; 15 15:19 dl.so

[bill@billstone make_lib]$

动态库的隐式调�?/strong>

在编译调用库函数代码时指明动态库的位�|�及(qi��ng)名字, 看下面实�?nbsp;

[bill@billstone make_lib]$ cat main.c

int main()

{

                print();

                return 0;

}

[bill@billstone make_lib]$ gcc -o tdl main.c ./dl.so

[bill@billstone make_lib]$ ./tdl

This is the first dll src!

[bill@billstone make_lib]$

当动态库的位�|�活名字发生改变�? �E�序��无法正常运�? 而动态库取代�?r��n)态库的好处之一则是通过更新动态库而随时升�U�库的内�?

动态库的显式调�?/strong>

昑ּ�调用动态库需要四个函数的支持,  函数 dlopen 打开动态库, 函数 dlsym 获取动态库中对象基址, �?/strong>�?dlerror 获取昑ּ�动态库操作中的错误信息, 函数 doclose 关闭动态库.

[bill@billstone make_lib]$ cat main.c

#include

int main()

{

                void pHandle;

                void (pFunc)();                                                    // 指向函数的指�?nbsp;

                int p;

                pHandle = dlopen("./d1.so", RTLD_NOW);                  // 打开动态库

                if(!pHandle){

                                printf("Can't find d1.so \n");

                                exit(1);

                }

                pFunc = (void ()())dlsym(pHandle, "print");                // 获取库函�?print 的地址

                if(pFunc)

                                pFunc();

                else

                                printf("Can't find function print\n");

                p = (int )dlsym(pHandle, "p");                                      // 获取库变�?p 的地址

                if(p)

                                printf("p = %d\n", *p);

                else

                                printf("Can't find int p\n");

                dlclose(pHandle);                                                                // 关闭动态库

                return 0;

}

[bill@billstone make_lib]$ gcc -o tds main.c –ld1 –L.

此时�q�不能立�?/tds�Q�因为在动态函数库使用�Ӟ��?x��)查�?usr/lib�?lib目录下的动态函数库�Q�而此时我们生成的库不在里辏V�?�q�个时候有好几�U�方法可以让他成功运行：(x��) 最直接最��单的�Ҏ(gu��)��是把libstr_out.so拉到/usr/lib�?lib中去�?�q�有一�U�方�?export LD_LIBRARY_PATH=$(pwd) 另外�q�可以在/etc/ld.so.conf文�g里加入我们生成的库的目录�Q�然�?sbin/ldconfig�?/etc/ld.so.conf是非帔R��要的一个目录，里面存放的是链接器和加蝲器搜索共享库时要��(g��)查的目录�Q�默认是�?usr/lib /lib中读取的�Q�所以想要顺利运行，我们也可以把我们库的目录加入到这个文件中�q�执�?sbin/ldconfig 。另外还有个文�g需要了(ji��n)�?etc/ld.so.cache,里面保存�?ji��n)常用的动态函数库�Q�且�?x��)先把他们加载到内存中，因��?f��)内存的访问速度�q�远大于��盘的访问速度�Q�这样可以提高��Y件加载动态函数库的速度�?ji��n)�?/p>
库依赖的查看

使用ldd命��o(h��)来查看执行文件依赖于哪些库�?/p>
该命令用于判断某个可执行�?binary 档案含有什么动态函式库�?br /> [root@test root]# ldd [-vdr] [filename]
参数说明�Q?br /> --version　　打印l(f��)dd的版本号
-v --verbose　　打印所有信息，例如包括�W�号的版本信�?br /> -d --data-relocs　　执行�W�号重部�|Ԍ��q�报告缺��的目标对象�Q�只对ELF格式适用�Q?br /> -r --function-relocs　　对目标对象和函数执行重新部��v�Q��ƈ报告�~�少的目标对象和函数�Q�只对ELF格式适用�Q?br /> --help 用法信息�?/p>
如果命��o(h��)行中�l�定的库名字包含'/'�Q�这个程序的libc5版本��用它作�ؓ(f��)库名字；否则它将在标准位�|�搜索库。运行一个当前目录下的共享库�Q�加前缀"./"�?/p> @import url(http://www.shnenglu.com/CuteSoft_Client/CuteEditor/Load.ashx?type=style&file=SyntaxHighlighter.css);@import url(/css/cuteeditor.css);

大宝天天�?/a> 2011-10-17 15:51 发表评论

Wed, 03 Aug 2011 09:43:00 GMT

WINDOWS完成端口�~�程
1、基本概�?br /> 2、WINDOWS完成端口的特�?br /> 3�?strong>完成端口�Q�Completion Ports �Q�相��x��据结构和创徏
4�?strong>完成端口�U�程的工作原�?br /> 5、Windows完成端口的实例代�?br /> Linux�?strong>EPoll模型
1、�ؓ(f��)什么select落后
2、内�怸�提高I(y��)/O性能的新�Ҏ(gu��)��epoll
3�?strong>epoll的优�?br /> 4�?strong>epoll的工作模�?nbsp;
5�?strong>epoll的��用方�?br /> 6、Linux�?strong>EPOll�~�程实例
�ȝ��

WINDOWS完成端口�~�程
        摘要�Q�开发网�l�程序从来都不是一件容易的事情�Q�尽��只需要遵守很��的一些规�?创徏socket,发�v�q�接�Q�接受连接，发送和接受数据。真正的困难在于�Q�让你的�E�序可以适应从单单一个连接到几千个连接乃至于上万个连接。利用Windows�q�_��完成端口�q�行重叠I(y��ng)/O的技术和Linux�?.6版本的内�怸�引入�?strong>EPOll技术，可以很方便在在在Windows和Linux�q�_��上开发出支持大量�q�接的网�l�服务程序。本文介�l�在Windows和Linux�q�_��上��用的完成端口�?strong>EPoll模型开发的基本原理�Q�同时给出实际的例子。本文主要关注C/S�l�构的服务器端程序，因�ؓ(f��)一般来��_(d��)��开发一个大定w��Q�具可扩展性的winsock�E�序一般就是指服务�E�序�?br />
1、基本概�?br />     讑֤�---windows操作�pȝ��上允�?d��ng)R��信的�Q何东西，比如文�g、目录、串行口、�ƈ行口、邮件槽、命名管道、无名管道、套接字、控制台、逻辑��盘、物理磁盘等。绝大多��C��讑֤�打交道的函数都是CreateFile/ReadFile/WriteFile�{�。所以我们不能看�?*File函数��只惛_��文�g讑֤�。与讑֤�通信有两�U�方式，同步方式和异步方式。同步方式下�Q�当调用ReadFile函数�Ӟ��函数�?x��)等待系�l�执行完所要求的工作，然后才返回；异步方式下，ReadFile�q�类函数�?x��)直接返回，�pȝ��自己��d��成对讑֤�的操作，然后以某�U�方式通知完成操作�?br /> 重叠I(y��ng)/O----��֐�思义�Q�当你调用了(ji��n)某个函数�Q�比如ReadFile�Q�就立刻�q�回做自��q��其他动作的时候，同时�pȝ��也在对I/0讑֤��q�行你要求的操作�Q�在�q�段旉��内你的程序和�pȝ��的内部动作是重叠的，因此有更好的性能。所以，重叠I(y��ng)/O是用于异步方式下使用I/O讑֤�的�?重叠I(y��ng)/O需要��用的一个非帔R��要的数据�l�构OVERLAPPED�?br />
2、WINDOWS完成端口的特�?br />    Win32重叠I(y��ng)/O(Overlapped I/O)机制允许发�v一个操作，然后在操作完成之后接受到信息。对于那�U�需要很长时间才能完成的操作来说�Q�重叠I(y��ng)O机制��其有用�Q�因为发起重叠操作的�U�程在重叠请求发出后��可以自��q��做别的事情了(ji��n)。在WinNT和W(xu��)in2000上，提供的真正的可扩展的I/O模型��是使用完成端口�Q�Completion Port�Q�的重叠I(y��ng)/O.完成端口---是一�U�WINDOWS内核对象�?strong>完成端口用于异步方式的重叠I(y��ng)/0情况下，当然重叠I(y��ng)/O不一定非使用完成端口不可�Q�还有设备内核对象、事件对象、告警I/0�{�。但�?strong>完成端口内部提供�?ji��n)线�E�池的管理，可以避免反复创徏�U�程的开销�Q�同时可以根据CPU的个数灵�zȝ��军_��U�程个数�Q�而且可以让减��线�E�调度的�ơ数从而提高性能其实�c�M��于WSAAsyncSelect和select函数的机制更�Ҏ(gu��)��兼容Unix�Q�但是难以实现我们想要的“扩展�?#8221;。而且windows�?strong>完成端口机制在操作系�l�内部已�l�作�?ji��n)优化，提供了(ji��n)更高的效率。所以，我们选择完成端口开始我们的服务器程序的开发�?br /> 1、发��h��作不一定完成，�pȝ��?x��)在完成的时候通知你，通过用户�?strong>完成端口上的�{�待�Q�处理操作的�l�果。所以要有检�?strong>完成端口�Q�取操作�l�果的线�E�。在完成端口上守候的�U�程�pȝ��有优化，除非在执行的�U�程��d��Q�不�?x��)有新的�U�程被激�z�，以此来减��线�E�切换造成的性能代�h(hu��n)。所以如果程序中没有太多的阻塞操作，没有必要启动太多的线�E�，CPU数量的两倍，一般这��h��启动�U�程�?br /> 2、操作与相关数据的绑定方式：(x��)在提交数据的时候用户对数据打相应的标记�Q�记录操作的�c�d��Q�在用户处理操作�l�果的时候，通过��(g��)查自己打的标记和�pȝ��的操作结果进行相应的处理�?nbsp;
3、操作返回的方式:一般操作完成后要通知�E�序�q�行后箋处理。但写操作可以不通知用户�Q�此时如果用户写操作不能马上完成�Q�写操作的相��x��据会(x��)被暂存到到非交换�~�冲��Z��Q�在操作完成的时候，�pȝ��?x��)自动释攄��冲区。此时发起完写操作，使用的内存就可以释放�?ji��n)。此时如果占用非交换�~�冲太多�?x��)�ɾpȝ��停止响应�?br />
3�?strong>完成端口�Q�Completion Ports �Q�相��x��据结构和创徏
    其实可以�?strong>完成端口看成�pȝ��l�护的一个队列，操作�pȝ��把重叠I(y��ng)O操作完成的事仉��知攑ֈ�该队列里�Q�由于是暴露 “操作完成”的事仉��知�Q�所以命名�ؓ(f��)“完成端口”�Q�COmpletion Ports�Q�。一个socket被创建后�Q�可以在��M��时刻和一�?strong>完成端口联系��h��?br /> 完成端口相关最重要的是OVERLAPPED数据�l�构
typedef struct _OVERLAPPED {
    ULONG_PTR Internal;//被系�l�内部赋��|��用来表示�pȝ��状�?nbsp;
    ULONG_PTR InternalHigh;// 被系�l�内部赋��|��传输的字节数
    union {
        struct {
            DWORD Offset;//和OffsetHigh合成一�?4位的整数�Q�用来表�C�Z��文�g头部的多��字节开�?nbsp;
            DWORD OffsetHigh;//操作�Q�如果不是对文�gI/O来操作，则必��设定�ؓ(f��)0
        };
        PVOID Pointer;
    };
    HANDLE hEvent;//如果不��用，��务必设�?,否则误��一个有效的Event句柄
} OVERLAPPED, *LPOVERLAPPED;

下面是异步方式��用ReadFile的一个例�?nbsp;
OVERLAPPED Overlapped;
Overlapped.Offset=345;
Overlapped.OffsetHigh=0;
Overlapped.hEvent=0;
//假定其他参数都已�l�被初始�?nbsp;
ReadFile(hFile,buffer,sizeof(buffer),&dwNumBytesRead,&Overlapped);
�q�样��完成了(ji��n)异步方式��L��件的操作�Q�然后ReadFile函数�q�回�Q�由操作�pȝ��做自��q��事情�Q�下面介�l�几个与OVERLAPPED�l�构相关的函�?nbsp;
�{�待重叠I(y��ng)/0操作完成的函�?nbsp;
BOOL GetOverlappedResult (
HANDLE hFile,
LPOVERLAPPED lpOverlapped,//接受�q�回的重叠I(y��ng)/0�l�构
LPDWORD lpcbTransfer,//成功传输�?ji��n)多��字节�?br /> BOOL fWait //TRUE只有当操作完成才�q�回�Q�FALSE直接�q�回�Q�如果操作没有完成，通过�?/用GetLastError ( )函数�?x��)返回ERROR_IO_INCOMPLETE
);
宏HasOverlappedIoCompleted可以帮助我们��试重叠I(y��ng)/0操作是否完成�Q�该宏对OVERLAPPED�l�构的Internal成员�q�行�?ji��n)测试，查看是否�{�于STATUS_PENDING倹{�?/p>
        一般来��_(d��)��一个应用程序可以创建多个工作线�E�来处理完成端口上的通知事�g。工作线�E�的数量依赖于程序的具体需要。但是在理想的情况下�Q�应该对应一个CPU创徏一个线�E�。因为在完成端口理想模型中，每个�U�程都可以从�pȝ��获得一�?#8220;原子”性的旉��片，轮番�q�行�q�检�?strong>完成端口�Q�线�E�的切换是额外的开销。在实际开发的时候，�q�要考虑�q�些�U�程是否牉|��到其他堵塞操作的情况。如果某�U�程�q�行堵塞操作�Q�系�l�则��其挂�v�Q�让别的�U�程获得�q�行旉��。因此，如果有这��L(f��ng)��情况�Q�可以多创徏几个�U�程来尽量利用时间�?br /> 应用完成端口�Q?br />     创徏完成端口�Q?strong>完成端口是一个内核对象，使用时他��L��要和臛_��一个有效的讑֤�句柄�q�行兌��Q?strong>完成端口是一个复杂的内核对象�Q�创建它的函数是�Q?br /> HANDLE CreateIoCompletionPort(
    IN HANDLE FileHandle,
    IN HANDLE ExistingCompletionPort,
    IN ULONG_PTR CompletionKey,
    IN DWORD NumberOfConcurrentThreads
    );

通常创徏工作分两步：(x��)
�W�一步，创徏一个新�?strong>完成端口内核对象�Q�可以��用下面的函数�Q?br />        HANDLE CreateNewCompletionPort(DWORD dwNumberOfThreads)
{
          return CreateIoCompletionPort(INVALID_HANDLE_VALUE,NULL,NULL,dwNumberOfThreads);
};

�W�二步，��刚创徏�?strong>完成端口和一个有效的讑֤�句柄兌��h��Q�可以��用下面的函数�Q?br />        bool AssicoateDeviceWithCompletionPort(HANDLE hCompPort,HANDLE hDevice,DWORD dwCompKey)
{
          HANDLE h=CreateIoCompletionPort(hDevice,hCompPort,dwCompKey,0);
          return h==hCompPort;
};
说明
1�Q?CreateIoCompletionPort函数也可以一�ơ性的既创�?strong>完成端口对象�Q�又兌��C��个有效的讑֤�句柄
2�Q?CompletionKey是一个可以自己定义的参数�Q�我们可以把一个结构的地址赋给它，然后在合适的时候取出来使用�Q�最好要保证�l�构里面的内存不是分配在栈上�Q�除非你有十分的把握内存�?x��)保留到你要使用的那一刅R�?br /> 3�Q?NumberOfConcurrentThreads通常用来指定要允许同时运行的的线�E�的最大个数。通常我们指定�?�Q�这��L(f��ng)��l�会(x��)�Ҏ(gu��)��CPU的个数来自动��定。创建和兌��的动作完成后�Q�系�l�会(x��)��?strong>完成端口兌��的设备句柄、完成键作�ؓ(f��)一条纪录加入到�q�个完成端口的设备列表中。如果你有多�?strong>完成端口�Q�就�?x��)有多个对应的设备列表。如果设备句柄被关闭�Q�则表中自动删除该纪录�?br />
4�?strong>完成端口�U�程的工作原�?/strong>
完成端口可以帮助我们��理�U�程池，但是�U�程池中的线�E�需要我们��用_beginthreadex来创建，凭什么通知完成端口��理我们的新�U�程呢？�{�案在函数GetQueuedCompletionStatus。该函数原型�Q?nbsp;
BOOL GetQueuedCompletionStatus(
    IN HANDLE CompletionPort,
    OUT LPDWORD lpNumberOfBytesTransferred,
    OUT PULONG_PTR lpCompletionKey,
    OUT LPOVERLAPPED *lpOverlapped,
    IN DWORD dwMilliseconds
);
�q�个函数试图从指定的完成端口的I/0完成队列中抽取纪录。只有当重叠I(y��ng)/O动作完成的时候，完成队列中才有纪录。凡是调用这个函数的�U�程��被攑օ��?strong>完成端口的等待线�E�队列中�Q�因�?strong>完成端口��可以在自己的线�E�池中帮助我们维护这个线�E��?strong>完成端口的I/0完成队列中存放了(ji��n)当重叠I(y��ng)/0完成的结�?--- 一条纪录，该纪录拥有四个字�D�，前三��就对应GetQueuedCompletionStatus函数�?�?�?参数�Q�最后一个字�D�|��错误信息dwError。我们也可以通过调用PostQueudCompletionStatus模拟完成�?ji��n)一个重叠I(y��ng)/0操作�?nbsp;
当I/0完成队列中出��C��(ji��n)�U�录�Q?strong>完成端口��会(x��)��(g��)查等待线�E�队列，该队列中的线�E�都是通过调用GetQueuedCompletionStatus函数使自己加入队列的。等待线�E�队列很��单，只是保存�?ji��n)这些线�E�的ID�?strong>完成端口�?x��)按照后�q�先出的原则��一个线�E�队列的ID攑օ�到释攄��E�列表中�Q�同时该�U�程��从�{�待GetQueuedCompletionStatus函数�q�回的睡眠状态中变�ؓ(f��)可调度状态等待CPU的调度。所以我们的�U�程要想成�ؓ(f��)完成端口��理的线�E�，��必��要调用GetQueuedCompletionStatus函数。出于性能的优化，实际�?strong>完成端口�q�维护了(ji��n)一个暂停线�E�列表，具体�l�节可以参考《Windows高��~�程指南》，我们现在知道的知识，已经��_��?ji��n)�?nbsp;完成端口�U�程间数据传递线�E�间传递数据最常用的办法是在_beginthreadex函数中将参数传递给�U�程函数�Q�或者��用全局变量。但�?strong>完成端口�q�有自己的传递数据的�Ҏ(gu��)��Q�答案就在于CompletionKey和OVERLAPPED参数�?br /> CompletionKey被保存在完成端口的设备表中，是和讑֤�句柄一一对应的，我们可以��与讑֤�句柄相关的数据保存到CompletionKey中，或者将CompletionKey表示为结构指针，�q�样��可以传递更加丰富的内容。这些内容只能在一开始关�?strong>完成端口和设备句柄的时候做�Q�因此不能在以后动态改变�?br /> OVERLAPPED参数是在每次调用ReadFile�q�样的支持重叠I(y��ng)/0的函数时传递给完成端口的。我们可以看刎ͼ�如果我们不是�Ҏ(gu��)��件设备做操作�Q�该�l�构的成员变量就�Ҏ(gu��)��们几乎毫无作用。我们需要附加信息，可以创徏自己的结构，然后��OVERLAPPED�l�构变量作�ؓ(f��)我们�l�构变量的第一个成员，然后传递第一个成员变量的地址�l�ReadFile函数。因为类型匹配，当然可以通过�~�译。当GetQueuedCompletionStatus函数�q�回�Ӟ��我们可以获取到第一个成员变量的地址�Q�然后一个简单的强制转换�Q�我们就可以把它当作完整的自定义�l�构的指针��用，�q�样��可以传递很多附加的数据�?ji��n)。太好了(ji��n)�Q�只有一点要注意�Q�如果跨�U�程传递，��h��意将数据分配到堆上，�q�且接收端应该将数据用完后释放。我们通常需要将ReadFile�q�样的异步函数的所需要的�~�冲区放到我们自定义的结构中�Q�这样当GetQueuedCompletionStatus被返回时�Q�我们的自定义结构的�~�冲区变量中��存放了(ji��n)I/0操作的数据。CompletionKey和OVERLAPPED参数�Q�都可以通过GetQueuedCompletionStatus函数获得�?br /> �U�程的安全退�?br />        很多�U�程��Z��(ji��n)不止一�ơ的执行异步数据处理�Q�需要��用如下语�?br /> while (true)
{
       ......
       GetQueuedCompletionStatus(...);
        ......
}
那么如何退出呢�Q�答案就在于上面曾提到的PostQueudCompletionStatus函数�Q�我们可以用它发送一个自定义的包含了(ji��n)OVERLAPPED成员变量的结构地址�Q�里面包含一个状态变量，当状态变量�ؓ(f��)退出标志时�Q�线�E�就执行清除动作然后退出�?br />
5、Windows完成端口的实例代码：(x��)
DWORD WINAPI WorkerThread(LPVOID lpParam)
{
ULONG_PTR *PerHandleKey;
OVERLAPPED *Overlap;
OVERLAPPEDPLUS *OverlapPlus,
*newolp;
DWORD dwBytesXfered;
while (1)
{
ret = GetQueuedCompletionStatus(
hIocp,
&dwBytesXfered,
(PULONG_PTR)&PerHandleKey,
&Overlap,
INFINITE);
if (ret == 0)
{
// Operation failed
continue;
}
OverlapPlus = CONTAINING_RECORD(Overlap, OVERLAPPEDPLUS, ol);
switch (OverlapPlus->OpCode)
{
case OP_ACCEPT:
// Client socket is contained in OverlapPlus.sclient
// Add client to completion port
CreateIoCompletionPort(
(HANDLE)OverlapPlus->sclient,
hIocp,
(ULONG_PTR)0,
0);
// Need a new OVERLAPPEDPLUS structure
// for the newly accepted socket. Perhaps
// keep a look aside list of free structures.
newolp = AllocateOverlappedPlus();
if (!newolp)
{
// Error
}
newolp->s = OverlapPlus->sclient;
newolp->OpCode = OP_READ;
// This function divpares the data to be sent
PrepareSendBuffer(&newolp->wbuf);
ret = WSASend(
newolp->s,
&newolp->wbuf,
1,
&newolp->dwBytes,
0,
&newolp.ol,
NULL);
if (ret == SOCKET_ERROR)
{
if (WSAGetLastError() != WSA_IO_PENDING)
{
// Error
}
}
// Put structure in look aside list for later use
FreeOverlappedPlus(OverlapPlus);
// Signal accept thread to issue another AcceptEx
SetEvent(hAcceptThread);
break;
case OP_READ:
// Process the data read
// Repost the read if necessary, reusing the same
// receive buffer as before
memset(&OverlapPlus->ol, 0, sizeof(OVERLAPPED));
ret = WSARecv(
OverlapPlus->s,
&OverlapPlus->wbuf,
1,
&OverlapPlus->dwBytes,
&OverlapPlus->dwFlags,
&OverlapPlus->ol,
NULL);
if (ret == SOCKET_ERROR)
{
if (WSAGetLastError() != WSA_IO_PENDING)
{
// Error
}
}
break;
case OP_WRITE:
// Process the data sent, etc.
break;
} // switch
} // while
} // WorkerThread

查看以上代码�Q�注意如果Overlapped操作立刻��p�|�Q�比如，�q�回SOCKET_ERROR或其他非WSA_IO_PENDING的错误）(j��)�Q�则没有��M��完成通知旉��?x��)被攑ֈ?strong>完成端口队列里。反之，则一定有相应的通知旉��被放�?strong>完成端口队列。更完善的关于Winsock�?strong>完成端口机制�Q�可以参考MSDN的Microsoft PlatFormSDK�Q�那里有完成端口的例子。访�?a >http://msdn.microsoft.com/library/techart/msdn_servrapp.htm可以获得更多信息�?/p>
Linux�?strong>EPoll模型
Linux 2.6内核中提高网�l�I/O性能的新�Ҏ(gu��)��-epoll I/O多�\复用技术在比较多的TCP�|�络服务器中有��用，��x��较多的用到select函数�?br />
1、�ؓ(f��)什么select落后
首先�Q�在Linux内核中，select所用到的FD_SET是有限的�Q�即内核中有个参数__FD_SETSIZE定义�?ji��n)每个FD_SET的句柄个敎ͼ�在我用的2.6.15-25-386内核中，该值是1024�Q�搜索内核源代码得到�Q?br /> include/linux/posix_types.h:#define __FD_SETSIZE         1024
也就是说�Q�如果想要同时检��?025个句柄的可读状态是不可能用select实现的。或者同时检��?025个句柄的可写状态也是不可能的。其�ơ，内核中实现select是用轮询�Ҏ(gu��)��Q�即每次��(g��)��都�?x��)遍历所有FD_SET中的句柄�Q�显�?d��ng)��select函数执行旉��与FD_SET中的句柄个数有一个比例关�p�，即select要检��的句柄数越多就�?x��)越��?gu��)��。当�?d��ng)��在前文中我�ƈ没有提�?qi��ng)poll�Ҏ(gu��)��Q�事实上用select的朋友一定也试过poll�Q�我个�h觉得select和poll大同��异�Q�个人偏好于用select而已�?/p>
2、内�怸�提高I(y��)/O性能的新�Ҏ(gu��)��epoll
epoll是什么？按照man手册的说法：(x��)是�ؓ(f��)处理大批量句柄而作�?ji��n)改�q�的poll。要使用epoll只需要这三个�pȝ��调用�Q?strong>epoll_create(2)�Q?nbsp;epoll_ctl(2)�Q?nbsp;epoll_wait(2)�?br /> 当然�Q�这不是2.6内核才有的，它是�?.5.44内核中被引进�?epoll(4) is a new API introduced in Linux kernel 2.5.44)

Linux2.6内核epoll介绍
先介�l?本书《The Linux Networking Architecture--Design and Implementation of Network Protocols in the Linux Kernel》，�?.4内核讲解Linux TCP/IP实现�Q�相当不�?作�ؓ(f��)一个现实世界中的实玎ͼ�很多时候你必须作很多权衡，�q�时候参考一个久�l�考验的系�l�更有实际意义。�D个例�?linux内核中sk_buff�l�构��Z��(ji��n)�q�求速度和安全，牺牲�?ji��n)部分内存，所以在发送TCP包的时候，无论应用层数据多�?sk_buff最��也�?72的字�?其实对于socket应用层程序来��_(d��)��另外一本书《UNIX Network Programming Volume 1》意义更大一�?2003�q�的时候，�q�本书出�?ji��n)最新的�W?版本�Q�不�q�主要还是修订第2版本。其中第6章《I/O Multiplexing》是最重要的。Stevens�l�出�?ji��n)网�l�IO的基本模型。在�q�里最重要的莫�q�于select模型和Asynchronous I/O模型.从理��Z��_(d��)��AIO��g��是最高效的，你的IO操作可以立即�q�回�Q�然后等待os告诉你I(y��ng)O操作完成。但是一直以来，如何实现��没有一个完��的�Ҏ(gu��)��。最著名的windows完成端口实现的AIO,实际上也是内部用�U�程池实现的�|�了(ji��n)�Q�最后的�l�果是IO有个�U�程池，你应用也需要一个线�E�池...... 很多文档其实已经指出�?ji��n)这带来的线�E�context-switch带来的代仗��在linux �q�_��上，关于�|�络AIO一直是改动最多的地方�Q?.4的年代就有很多AIO内核patch,最著名的应该算是SGI那个。但是一直到2.6内核发布�Q�网�l�模块的AIO一直没有进入稳定内核版�?大部分都是��用用��L(f��ng)��E�模拟方法，在��用了(ji��n)NPTL的linux上面其实和windows�?strong>完成端口基本上差不多�?�?.6内核所支持的AIO�Ҏ(gu��)��盘的AIO---支持io_submit(),io_getevents()以及(qi��ng)对Direct IO的支�?��是�l�过VFS�pȝ��buffer直接写硬盘，对于��服务器在内存��^�E�x��上有相当帮�?�?br /> 所以，剩下的select模型基本上就是我们在linux上面的唯一选择�Q�其实，如果加上no-block socket的配�|�，可以完成一�?�?AIO的实玎ͼ�只不�q�推动力在于你而不是os而已。不�q�传�l�的select/poll函数有着一些无法忍受的�~�点�Q�所以改�q�一直是2.4-2.5开发版本内核的��d��Q�包�?dev/poll�Q�realtime signal�{�等。最�l�，Davide Libenzi开发的epoll�q�入2.6内核成�ؓ(f��)正式的解��x��?br />
3�?strong>epoll的优�?/strong>
<1>支持一个进�E�打开大数目的socket描述�W?FD)
select 最不能忍受的是一个进�E�所打开的FD是有一定限制的�Q�由FD_SETSIZE讄��Q�默认值是2048。对于那些需要支持的上万�q�接数目的IM服务器来说显然太��了(ji��n)。这时候你一是可以选择修改�q�个宏然后重新编译内核，不过资料也同时指�?gu��)��样�?x��)带来�|�络效率的下降，二是可以选择多进�E�的解决�Ҏ(gu��)��(传统的Apache�Ҏ(gu��)��)�Q�不�q�虽然linux上面创徏�q�程的代��h��较小�Q�但仍旧是不可忽视的�Q�加上进�E�间数据同步�q�比不上�U�程间同步的高效�Q�所以也不是一�U�完��的�Ҏ(gu��)��。不�q?nbsp;epoll则没有这个限�Ӟ��它所支持的FD上限是最大可以打开文�g的数目，�q�个数字一般远大于2048,举个例子,�?GB内存的机器上大约�?0万左叻I��具体数目可以cat /proc/sys/fs/file-max察看,一般来说这个数目和�pȝ��内存关系很大�?br /> <2>IO效率不随FD数目增加而线性下�?br /> 传统的select/poll另一个致命弱点就是当你拥有一个很大的socket集合�Q�不�q�由于网�l��g�Ӟ��M��旉��只有部分的socket�?�z�跃"的，但是select/poll每次调用都会(x��)�U�性扫描全部的集合�Q�导致效率呈现线性下降。但�?strong>epoll不存在这个问题，它只�?x��)�?�z�跃"的socket�q�行操作---�q�是因�ؓ(f��)在内核实��C��epoll是根据每个fd上面的callback函数实现的。那么，只有"�z�跃"的socket才会(x��)��d��的去调用 callback函数�Q�其他idle状态socket则不�?x��)，在这点上�Q?strong>epoll实现�?ji��n)一�?�?AIO�Q�因��时候推动力在os内核。在一�?benchmark中，如果所有的socket基本上都是活跃的---比如一个高速LAN环境�Q?strong>epoll�q�不比select/poll有什么效率，相反�Q�如果过多��?strong>epoll_ctl,效率相比�q�有�E�微的下降。但是一旦��用idle connections模拟WAN环境,epoll的效率就�q�在select/poll之上�?ji��n)�?br /> <3>使用mmap加速内�怸�用户�I�间的消息传递�?br /> �q�点实际上涉�?qi��ng)�?strong>epoll的具体实��C��(ji��n)。无论是select,poll�q�是epoll都需要内核把FD消息通知�l�用��L(f��ng)��_(d��)��如何避免不必要的内存拯��很重要�Q�在�q�点上，epoll是通过内核于用��L(f��ng)��间mmap同一块内存实现的。而如果你��x��一样从2.5内核��关�?strong>epoll的话�Q�一定不�?x��)忘记手�?mmap�q�一步的�?br /> <4>内核微调
�q�一点其实不��?strong>epoll的优点了(ji��n)�Q�而是整个linux�q�_��的优炏V��也�怽�可以怀疑linux�q�_��Q�但是你无法回避linux�q�_��赋予你微调内核的能力。比如，内核TCP/IP协议栈��用内存池��理sk_buff�l�构�Q�那么可以在�q�行时期动态调整这个内存pool(skb_head_pool)的大��?-- 通过echo XXXX>/proc/sys/net/core/hot_list_length完成。再比如listen函数的第2个参�?TCP完成3�ơ握手的数据包队列长�?�Q�也可以�Ҏ(gu��)��你��^台内存大��动态调整。更甚至在一个数据包面数目巨大但同时每个数据包本�w�大��却很小的特�D�系�l�上��试最新的NAPI�|�卡驱动架构�?br /> 4�?strong>epoll的工作模�?br /> 令�h高兴的是�Q?.6内核�?strong>epoll比其2.5开发版本的/dev/epoll��z�了(ji��n)许多�Q�所以，大部分情况下�Q�强大的东西往往是简单的。唯一有点�ȝ��(ch��)�?strong>epoll�?�U�工作方�?LT和ET�?br /> LT(level triggered)是缺省的工作方式�Q��ƈ且同时支持block和no-block socket.在这�U�做法中�Q�内核告诉你一个文件描�q�符是否��q�A�?ji��n)，然后你可以对�q�个��q�A的fd�q�行IO操作。如果你不作��M��操作�Q�内核还是会(x��)�l�箋通知你的�Q�所以，�q�种模式�~�程出错误可能性要��一炏V��传�l�的select/poll都是�q�种模型的代表．
ET (edge-triggered)是高速工作方式，只支持no-block socket。在�q�种模式下，当描�q�符从未��q�A变�ؓ(f��)��q�A�Ӟ��内核通过epoll告诉你。然后它�?x��)假设你知道文�g描述�W�已�l�就�l�，�q�且不会(x��)再�ؓ(f��)那个文�g描述�W�发送更多的��q�A通知�Q�直��C��做了(ji��n)某些操作��D��那个文�g描述�W�不再�ؓ(f��)��q�A状态了(ji��n)(比如�Q�你在发送，接收或者接收请求，或者发送接收的数据��于一定量时导致了(ji��n)一个EWOULDBLOCK 错误�Q�。但是请注意�Q�如果一直不对这个fd作IO操作(从而导致它再次变成未就�l?�Q�内�怸��?x��)发送更多的通知(only once),不过在TCP协议中，ET模式的加速效用仍需要更多的benchmark��认�?br /> epoll只有epoll_create,epoll_ctl,epoll_wait 3个系�l�调用，具体用法请参�?a >http://www.xmailserver.org/linux-patches/nio-improve.html �Q�在http://www.kegel.com/rn/也有一个完整的例子�Q�大家一看就知道如何使用�?br /> Leader/follower模式�U�程pool实现�Q�以�?qi��ng)�?strong>epoll的配合�?br />
5�?nbsp;epoll的��用方�?/strong>
    首先通过create_epoll(int maxfds)来创��Z��?strong>epoll的句柄，其中maxfds��Z��epoll所支持的最大句柄数。这个函��C��(x��)�q�回一个新�?strong>epoll句柄�Q�之后的所有操作将通过�q�个句柄来进行操作。在用完之后�Q�记得用close()来关闭这个创建出来的epoll句柄�?之后在你的网�l�主循环里面�Q�每一帧的调用epoll_wait(int epfd, epoll_event events, int max events, int timeout)来查询所有的�|�络接口�Q�看哪一个可以读�Q�哪一个可以写�?ji��n)。基本的语法为：(x��)
nfds = epoll_wait(kdpfd, events, maxevents, -1);
其中kdpfd为用epoll_create创徏之后的句柄，events是一�?strong>epoll_event*的指针，�?strong>epoll_wait�q�个函数操作成功之后�Q?strong>epoll_events里面��储存所有的��d��事�g。max_events是当前需要监听的所有socket句柄数。最后一个timeout�?strong>epoll_wait的超�Ӟ��?的时候表�C�马上返回，�?1的时候表�C�Z��直等下去�Q�直到有事�g范围�Q��ؓ(f��)��L��正整数的时候表�C�等�q�么长的旉��Q�如果一直没有事�Ӟ��则范围。一般如果网�l�主循环是单独的�U�程的话�Q�可以用-1来等�Q�这样可以保证一些效率，如果是和主逻辑在同一个线�E�的话，则可以用0来保证主循环的效率�?/p>
epoll_wait范围之后应该是一个��@环，遍利所有的事�g�Q?nbsp;
for(n = 0; n < nfds; ++n) {
                if(events[n].data.fd == listener) { //如果是主socket的事件的话，则表�C�有新连接进入了(ji��n)�Q�进行新�q�接的处理�?nbsp;
                    client = accept(listener, (struct sockaddr *) &local,
                                    &addrlen);
                    if(client < 0){
                        perror("accept");
                        continue;
                    }
                    setnonblocking(client); // ��新�q�接�|�于非阻塞模�?nbsp;
                    ev.events = EPOLLIN | EPOLLET; // �q�且��新�q�接也加�?strong>EPOLL的监听队列�?nbsp;
注意�Q�这里的参数EPOLLIN | EPOLLET�q�没有设�|�对写socket的监听，如果有写操作的话�Q�这个时�?strong>epoll是不�?x��)返回事件的�Q�如果要对写操作也监听的话，应该是EPOLLIN | EPOLLOUT | EPOLLET
                    ev.data.fd = client;
                    if (epoll_ctl(kdpfd, EPOLL_CTL_ADD, client, &ev) < 0) {
// 讄��好event之后�Q�将�q�个新的event通过epoll_ctl加入�?strong>epoll的监听队列里面，�q�里�?strong>EPOLL_CTL_ADD来加一个新�?strong>epoll事�g�Q�通过EPOLL_CTL_DEL来减��一�?strong>epoll事�g�Q�通过EPOLL_CTL_MOD来改变一个事件的监听方式�?nbsp;
                        fprintf(stderr, "epoll set insertion error: fd=%d0,
                                client);
                        return -1;
                    }
                }
                else // 如果不是主socket的事件的话，则代表是一个用户socket的事�Ӟ��则来处理�q�个用户socket的事情，比如说read(fd,xxx)之类的，或者一些其他的处理�?nbsp;
                    do_use_fd(events[n].data.fd);
}

对，epoll的操作就�q�么��单，��d��不过4个API�Q?strong>epoll_create, epoll_ctl, epoll_wait和close�?nbsp;
如果�(zh��n)�对epoll的效率还不太�?ji��n)解�Q�请参考我之前关于�|�络游戏的网�l�编�E�等相关的文章�?/p>

以前公司的服务器都是使用HTTP�q�接�Q�但是这��L(f��ng)��话，在手机目前的�|�络情况下不但显得速度较慢�Q�而且不稳定。因此大家一致同意用SOCKET来进行连接。虽然��用SOCKET之后�Q�对于用��L(f��ng)��费用可能�?x��)增�?�׃��是用�?ji��n)CMNET而非CMWAP)�Q�但是，�U�着用户体验至上的原则，�怿�大家�q�是能够接受�?希望那些玩家月末收到帐单不后能够保持克制...)�?br /> �q�次的服务器设计中，最重要的一个突��_(d��)��是��用了(ji��n)EPOLL模型�Q�虽然对之也是一知半解，但是既然在各大PC�|�游中已�l�经�q�了(ji��n)如此严酷的考验�Q�相信他不会(x��)让我们失望，使用后的�l�果�Q�确实也是表现相当不错。在�q�里�Q�我�q�是主要大致介绍一下这个模型的�l�构�?br /> 6、Linux�?strong>EPOll�~�程实例
EPOLL模型��g��只有一�U�格式，所以大家只要参考我下面的代码，��p��够对EPOLL有所�?ji��n)解了(ji��n)，代码的解释都已经在注释中�Q?/p>
while (TRUE)
{
int nfds = epoll_wait (m_epoll_fd, m_events, MAX_EVENTS, EPOLL_TIME_OUT);//�{�待EPOLL旉��的发生，相当于监听，至于相关的端口，需要在初始�?strong>EPOLL的时候绑定�?br /> if (nfds <= 0)
continue;
m_bOnTimeChecking = FALSE;
G_CurTime = time(NULL);
for (int i=0; i
{
try
{
if (m_events[i].data.fd == m_listen_http_fd)//如果新监��到一个HTTP用户�q�接到绑定的HTTP端口�Q�徏立新的连接。由于我们新采用�?ji��n)SOCKET�q�接�Q�所以基本没用�?br /> {
OnAcceptHttpEpoll ();
}
else if (m_events[i].data.fd == m_listen_sock_fd)//如果新监��到一个SOCKET用户�q�接��C��(ji��n)�l�定的SOCKET端口�Q�徏立新的连接�?br /> {
OnAcceptSockEpoll ();
}
else if (m_events[i].events & EPOLLIN)//如果是已�l�连接的用户�Q��ƈ且收到数据，那么�q�行��d��?br /> {
OnReadEpoll (i);
}

OnWriteEpoll (i);//查看当前的活动连接是否有需要写出的数据�?br /> }
catch (int)
{
PRINTF ("CATCH捕获错误\n");
continue;
}
}
m_bOnTimeChecking = TRUE;
OnTimer ();//�q�行一些定时的操作�Q�主要就是删除一些短�U�用��L(f��ng)��?br /> }
其实EPOLL的精华，也就是上�q�的几段短短的代码，看来时代真的不同�?ji��n)，以前如何接受大量用户�q�接的问题，现在却被如此��L��的搞定，真是让�h不得不感叹，对哪�?/p>

�ȝ��
Windows完成端口与Linux epoll技术方案是�q?个��^��C��实现异步IO和设计开发一个大定w��Q�具可扩展性的winsock�E�序指服务程序的很好的选择�Q�本文对�q?中技术的实现原理和实际的使用�Ҏ(gu��)��做了(ji��n)一个详�l�的介绍�?/p> @import url(http://www.shnenglu.com/CuteSoft_Client/CuteEditor/Load.ashx?type=style&file=SyntaxHighlighter.css);@import url(/css/cuteeditor.css);

大宝天天�?/a> 2011-08-03 17:43 发表评论