本文写于2017-02-26,从老账号迁移到本账号,原文地址:https://www.cnblogs.com/huangweiyang/p/6444746.html

select、poll、epoll三组系统调用都能同时监听多个文件描述符,它们将等待由timeout参数指定的超时时间,直到一个或多个文件描述符上有事件时返回,返回值是就绪的文件描述符的数量。返回0表示没有事件发生。

下面从事件集、最大支持文件描述符数、工作模式和具体实现等四个方面进一步比较它们的异同。

事件集:

select的参数类型fd_set没有将文件描述符和事件绑定(没有用数据结构绑定fd和event),它仅仅是一个文件描述符集合,因此select需要提供3个这种类型的参数来分别传入可读、可写及异常事件。一方面这使得select不能处理更多类型的事件,另一方面由于内核对fd_set集合的在线修改,应用程序下次调用select前不得不重置这3个fd_set集合。

poll参数类型pollfd结构体将文件描述符和事件绑定起来,任何事件都被统一处理,并且内核每次修改的都是pollfd结构体的revents成员,而events成员不变,因此下次调用poll时应用程序无需重置pollfd。

由于每次select和poll调用都返回整个用户注册的事件集合(其中包括就绪的和未就绪的),所以应用程序索引就绪文件描述符的时间复杂度为O(n)。

epoll则采用与select和poll完全不同的方式来管理用户注册的事件。它在内核中维护一个事件表,并提供了一个独立的系统调用epoll_ctl来控制往其中添加、注册、修改事件。这样,每次epoll_wait调用都直接从内核事件表中取得用户注册的时间,而无需反复从用户空间读入这些事件。epoll_wait系统调用的events参数仅用来返回就绪的时间,应用程序索引文件描述符时间复杂度为O(1)。

工作模式

select和poll都只能工作在相对低效的LT模式,而epoll则可以工作在ET高效模式,并且epoll还支持EPOLLONESHOT事件。该事件能进一步减少可读、可写、异常事件被触发的次数。

实现原理

从实现原理上来说,select和poll采用的都是轮询的方式,即每次调用都要扫描整个注册文件描述符集合,并将其中就绪的文件描述符返回给用户程序,因此他们检测就绪事件的时间复杂度是O(n)。epoll则不同,当我们使用epoll_ctl注册事件时,epoll内部会把socket封装成为epitem插入到红黑树之中,还会给内核中断处理程序注册一个回调函数。当socket上有事件时,内核会把对应的epitem插入到rdlist中,epoll_wait检测rdlist不为空,就将该就绪队列的内容拷贝到用户空间。(如果是LT模式,在拷贝之后还会将epitem重新加入rdlist)。因此,epoll_wait不必轮询整个文件描述符集合,算法时间复杂读是O(1)。但是,活动链接比较多时,epoll_wait未必比select和poll高,因为此时回调函数触发过于频繁。所以epoll_wait适用于连接数量多,但活动连接较少的情况。

如下表:

事件集合用户通过3个参数分别传入感兴趣的可读、可写及异常等事件,内核通过对着写参数的在线修改来反馈其中的就绪事件。这是用用户每次调用select都要重置这三个参数poll统一处理所有事件类型,因此只需一个事件集参数,用户通过pollfd.events传入感兴趣的事件,内核通过修改pollfd.revents反馈其中就绪事件内核通过一个事件表直接管理用户感兴趣的所有事件,因此每次调用epoll_wait时,无需反复传入用户感兴趣的时间。epoll_wait系统调用的参数events仅用来反馈就绪的事件
应用程序索引就绪文件描述符的时间复杂度O(n)O(n)O(1)
最大支持的文件描述符数10246553565535
工作模式LTLTLT和ET
内核实现和国祚效率采用轮询方式来检测就绪事件,算法时间复杂度为O(n)采用轮询方式来检测就绪事件,算法时间复杂度为O(n)采用回调方式来检测就绪事件,时间复杂度O(1)
05-11 18:25