公布一个基于 Reactor 模式的 C++ 网络库

陈硕 (giantchen_AT_gmail)

Blog.csdn.net/Solstice

2010 Aug 30

本文主要介绍 muduo 网络库的使用。其设计与实现将有另文解说。

文件夹

由来 1

下载与编译 2

样例 2

基本结构 3

公开接口 4

内部实现 4

线程模型 5

结语 5

由来

半年前我写了一篇《学之者生,用之者死——ACE历史与简评》,当中提到“我心目中理想的网络库”的样子:

  • 线程安全,支持多核多线程
  • 不考虑可移植性,不跨平台,仅仅支持 Linux,不支持 Windows。
  • 在不添加复杂度的前提下能够支持 FreeBSD/Darwin,方便将来用 Mac 作为开发用机,但不为它做性能优化。也就是说 IO multiplexing 使用 poll 和 epoll。
  • 主要支持 x86-64,兼顾 IA32
  • 不支持 UDP,仅仅支持 TCP
  • 不支持 IPv6,仅仅支持 IPv4
  • 不考虑广域网应用,仅仅考虑局域网
  • 仅仅支持一种使用模式:non-blocking IO + one event loop per thread,不考虑堵塞 IO
  • API 简单易用,仅仅暴露详细类和标准库里的类,不使用 non-trivial templates,也不使用虚函数
  • 仅仅满足经常使用需求的 90%,不面面俱到,必要的时候以 app 来适应 lib
  • 仅仅做 library,不做成 framework
  • 争取所有代码在 5000 行以内(不含測试)
  • 以上条件都满足时,能够考虑搭配 Google Protocol Buffers RPC

在想清楚这些目标之后,我開始第三次尝试编写自己的 C++ 网络库。与前两次不同,这次我一開始就想好了库的名字,叫 muduo (木铎),并在 Google code 上创建了项目: http://code.google.com/p/muduo/ 。muduo 的主体内容在 5 月底已经基本完毕,如今我把它开源。

本文主要介绍 muduo 网络库的使用,其设计与实现将有另文解说。

下载与编译

下载地址: http://muduo.googlecode.com/files/muduo-0.1.0-alpha.tar.gz

SHA1 Checksum: 5d3642e311177ded89ed0d15c10921738f8c984c

Muduo 使用了 Linux 较新的系统调用,要求 Linux 的内核版本号大于 2.6.28 (我自己用的是 2.6.32 )。在 Debian Squeeze / Ubuntu 10.04 LTS 上编译測试通过,32 位和 64 位系统都能使用。

Muduo 採用 CMake 为 build system,安装方法:

$ sudo apt-get install cmake

Muduo 依赖 Boost,非常easy安装:

$ sudo apt-get install libboost1.40-dev # 或 libboost1.42-dev

编译方法非常easy:

$ tar zxf muduo-0.1.0-alpha.tar.gz

$ cd muduo/

$ ./build.sh

# 编译生成的可运行文件和静态库文件分别位于 ../build/debug/{bin,lib}

假设要编译 release 版,可运行

$ BUILD_TYPE=release ./build.sh

# 编译生成的可运行文件和静态库文件分别位于 ../build/release/{bin,lib}

编译完毕之后请试执行当中的样例。比方 bin/inspector_test ,然后通过浏览器訪问 http://10.0.0.10:12345/ 或 http://10.0.0.10:12345/proc/status,当中 10.0.0.10 替换为你的 Linux box 的 IP。

样例

Muduo 附带了几十个小样例,位于 examples 文件夹。当中包含从 Boost.Asio、JBoss Netty、Python Twisted 等处移植过来的样例。

examples

|-- simple # 简单网络协议的实现

|   |-- allinone  # 在一个程序里同一时候实现以下 5 个协议

|   |-- chargen   # RFC 864,可測试带宽

|   |-- daytime # RFC 867

|   |-- discard # RFC 863

|   |-- echo # RFC 862

|   |-- time # RFC 868

|   `-- timeclient # time 协议的客户端

|-- hub # 一个简单的 pub/sub/hub 服务,演示应用级的广播

|-- roundtrip # 測试两台机器的网络延时与时间差

|-- asio # 从 Boost.Asio 移植的样例

|   |-- chat # 聊天服务

|   `-- tutorial # 一系列 timers

|-- netty # 从 JBoss Netty 移植的样例

|   |-- discard # 可用于測试带宽,server可多线程执行

|   |-- echo # 可用于測试带宽,server可多线程执行

|   `-- uptime # TCP 长连接

`-- twisted # 从 Python Twisted 移植的样例

`-- finger # finger01 ~ 07

基本结构

Muduo 的文件夹结构例如以下。

muduo

|-- base # 与网络无关的基础代码,已提前公布

`-- net # 网络库

|-- http # 一个简单的可嵌入的 web server

|-- inspect # 基于以上 web server的“窥探器”,用于报告进程的状态

`-- poller # poll(2) 和 epoll(4) 两种 IO multiplexing 后端

Muduo 是基于 Reactor 模式的网络库,其核心是个事件循环 EventLoop,用于响应计时器和 IO 事件。Muduo 採用基于对象(object based)而非面向对象(object oriented)的设计风格,其接口多以 boost::function + boost::bind 表达

Muduo 的头文件明白分为客户可见和客户不可见两类。客户可见的为白底,客户不可见的为灰底。

公布一个基于 Reactor 模式的 C++ 网络库-LMLPHP

这里简介各个头文件及 class 的作用,具体的介绍留给以后的博客。

公开接口
  • Buffer 仿 Netty ChannelBuffer 的 buffer class,数据的读写透过 buffer 进行
  • InetAddress 封装 IPv4 地址 (end point),注意,muduo 眼下不能解析域名,仅仅认 IP
  • EventLoop 反应器 Reactor,用户能够注冊计时器回调
  • EventLoopThread 启动一个线程,在当中执行 EventLoop::loop()
  • TcpConnection 整个网络库的核心,封装一次 TCP 连接
  • TcpClient 用于编写网络client,能发起连接,而且有重试功能
  • TcpServer 用于编写网络server,接受客户的连接
  • 在这些类中,TcpConnection 的生命期依靠 shared_ptr 控制(即用户和库共同控制)。Buffer 的生命期由 TcpConnection 控制。其余类的生命期由用户控制。
  • HttpServer 和 Inspector,暴露出一个 http 界面,用于监控进程的状态,相似于 Java JMX。这么做的原因是,《程序猿修炼之道》第 6 章第 34 条提到“对于更大、更复杂的server代码,提供其操作的内部试图的一种美丽技术是使用内建的 Web server”,Jeff Dean 也说“(每一个 Google 的server进程)Export HTML-based status pages for easy diagnosis”。
内部实现
  • Channel 是 selectable IO channel,负责注冊与响应 IO 事件,它不拥有 file descriptor。它是 Acceptor、Connector、EventLoop、TimerQueue、TcpConnection 的成员,生命期由后者控制。
  • Socket 封装一个 file descriptor,并在析构时关闭 fd。它是 Acceptor、TcpConnection 的成员,生命期由后者控制。EventLoop、TimerQueue 也拥有 fd,可是不封装为 Socket。
  • SocketsOps 封装各种 sockets 系统调用。
  • EventLoop 封装事件循环,也是事件分派的中心。它用 eventfd(2) 来异步唤醒,这有别于传统的用一对 pipe(2) 的办法。它用 TimerQueue 作为计时器管理,用 Poller 作为 IO Multiplexing。
  • Poller 是 PollPoller 和 EPollPoller 的基类,採用“电平触发”的语意。它是 EventLoop 的成员,生命期由后者控制。
  • PollPoller 和 EPollPoller 封装 poll(2) 和 epoll(4) 两种 IO Multiplexing 后端。Poll 的存在价值是便于调试,由于 poll(2) 调用是上下文无关的,用 strace 非常easy知道库的行为是否正确。
  • Connector 用于发起 TCP 连接,它是 TcpClient 的成员,生命期由后者控制。
  • Acceptor 用于接受 TCP 连接,它是 TcpServer 的成员,生命期由后者控制。
  • TimerQueue 用 timerfd 实现定时,这有别于传统的设置 poll/epoll_wait 的等待时长的办法。为了简单起见,眼下用链表来管理 Timer,假设有必要可改为优先队列,这样复杂度可从 O(n) 降为O(ln n) (某些操作甚至是 O(1))。它是 EventLoop 的成员,生命期由后者控制。
  • EventLoopThreadPool 用于创建 IO 线程池,也就是说把 TcpConnection 分派到一组执行 EventLoop 的线程上。它是 TcpServer 的成员,生命期由后者控制。

类图
公布一个基于 Reactor 模式的 C++ 网络库-LMLPHP

线程模型

Muduo 的线程模型符合我主张的 one loop per thread + thread pool 模型。每一个线程最多有一个 EventLoop。每一个 TcpConnection 必须归某个 EventLoop 管理,全部的 IO 会转移到这个线程,换句话说一个 file descriptor 仅仅能由一个线程读写。TcpConnection 所在的线程由其所属的 EventLoop 决定,这样我们能够非常方便地把不同的 TCP 连接放到不同的线程去,也能够把一些 TCP 连接放到一个线程里。TcpConnection 和 EventLoop 是线程安全的,能够跨线程调用。TcpServer 直接支持多线程,它有两种模式:

1. 单线程,accept 与 TcpConnection 用同一个线程做 IO。

2. 多线程,accept 与 EventLoop 在同一个线程,另外创建一个 EventLoopThreadPool,新到的连接会按 round-robin 方式分配到线程池中。

结语

Muduo 是我对常见网络编程任务的总结,用它我能非常easy地编写多线程的 TCP server和client。Muduo 是我业余时间的作品,代码预计还有非常多 bug,功能也不完好(比如不支持 signal 处理),待日后慢慢改进吧。

后记:性能測试:

1. muduo 与 boost asio 吞吐量对照

2. muduo 与 libevent2 吞吐量对照

3. 击鼓传花:对照 muduo 与 libevent2 的事件处理效率

04-16 10:45