goroutine是非常轻量的,不会暂用太多资源,基本上有多少任务,我们可以开多少goroutine去处理。但有时候,我们还是想控制一下。
比如,我们有A、B两类工作,不想把太多资源花费在B类务上,而是花在A类任务上。对于A,我们可以来1个开一个goroutine去处理,对于B,我们可以使用一个协程池,协程池里有5个线程去处理B类任务,这样B消耗的资源就不会太多。
控制使用资源并不是协程池目的,使用协程池是为了更好并发、程序鲁棒性、容错性等。废话少说,快速入门协程池才是这篇文章的目的。
协程池指的是预先分配固定数量的goroutine处理相同的任务,和线程池是类似的,不同点是协程池中处理任务的是协程,线程池中处理任务的是线程。
最简单的协程池模型
上面这个图展示了最简单的协程池的样子。先把协程池作为一个整体看,它使用2个通道,左边的jobCh
是任务通道,任务会从这个通道中流进来,右边的retCh
是结果通道,协程池处理任务后得到的结果会写入这个通道。至于协程池中,有多少协程处理任务,这是外部不关心的。
看一下协程池内部,图中画了5个goroutine,实际goroutine的数量是依具体情况而定的。协程池内每个协程都从jobCh
读任务、处理任务,然后将结果写入到retCh
。
示例
模型看懂了,看个小例子吧。
workerPool()
会创建1个简单的协程池,协程的数量可以通入参数n
执行,并且还指定了jobCh
和retCh
两个参数。
worker()
是协程池中的协程,入参分布是它的ID、job通道和结果通道。使用for-range
从jobCh
读取任务,直到jobCh
关闭,然后一个最简单的任务:生成1个字符串,证明自己处理了某个任务,并把字符串作为结果写入retCh
。
main()
启动genJob
获取存放任务的通道jobCh
,然后创建retCh
,它的缓存空间是200,并使用workerPool
启动一个有5个协程的协程池。1s之后,关闭retCh
,然后开始从retCh
中读取协程池处理结果,并打印。
genJob
启动一个协程,并生产n个任务,写入到jobCh
。
示例运行结果如下,一共产生了10个任务,显示大部分工作都被worker 2
这个协程抢走了,如果我们设置的任务成千上万,协程池长时间处理任务,每个协程处理的工作数量就会均衡很多。
➜ go run simple_goroutine_pool.go
worker 2 processed job: 4
worker 2 processed job: 5
worker 2 processed job: 6
worker 2 processed job: 7
worker 2 processed job: 8
worker 2 processed job: 9
worker 0 processed job: 1
worker 3 processed job: 2
worker 4 processed job: 3
worker 1 processed job: 0
回顾
最简单的协程池模型就这么简单,再回头看下协程池及周边由哪些组成:
- 协程池内的一定数量的协程。
- 任务队列,即
jobCh
,存在协程池不能立即处理任务的情况,所以需要队列把任务先暂存。 - 结果队列,即
retCh
,同上,协程池处理任务的结果,也存在不能被下游立刻提取的情况,要暂时保存。
协程池最简要(核心)的逻辑是所有协程从任务读取任务,处理后把结果存放到结果队列。
Go并发系列文章
- Golang并发模型:轻松入门流水线模型
- Golang并发模型:轻松入门流水线FAN模式
- Golang并发模型:并发协程的优雅退出
- Golang并发模型:轻松入门select
- Golang并发模型:select进阶
- Golang并发模型:轻松入门协程池