【linux线程(四)】初识线程池&手撕线程池-LMLPHP

1. 前言

线程池在校招面试阶段经常被要求手撕,可见它的重要性如何.


2. 什么是池化技术?

大家可能听说过线程池,进程池,对象池,甚至是内存池等概念,那么到底什么是池?它们有什么共同特质?

池化技术:

说白了,就是线程池就是在程序启动时就创建多个线程来备用,同理对象池和内存池也就是创建多个对象/空间备用

池化技术的优点:

  • 提高性能。通过重用资源,减少了创建和销毁资源的时间,从而提高了资源的使用效率
  • 降低系统开销, 避免了频繁地向操作系统申请和释放资源的开销
  • 简化代码。通过封装资源管理逻辑,使得应用程序代码更简洁易懂

3. 线程池详解

  1. 需要大量的线程来完成任务,且完成任务的时间比较短。 WEB服务器完成网页请求这样的任务,使用线程池技术是非常合适的。因为单个任务小,而任务数量巨大,你可以想象一个热门网站的点击次数。
  2. 对性能要求苛刻的应用,比如要求服务器迅速响应客户请求。
  3. 接受突发性的大量请求,但不至于使服务器因此产生大量线程的应用。突发性大量客户请求,在没
    有线程池情况下,将产生大量线程,虽然理论上大部分操作系统线程数目最大值不是问题,短时间内产生大量线程可能使内存到达极限,出现错误.
  1. 创建固定数量的线程,循环的去任务队列中拿任务
  2. 获取到任务后,不同线程执行不同任务的代码
  3. 任务结束,此线程继续循环的去任务队列拿任务

其次,由于线程池是会在多线程下跑的
所以将它设计为单例模型最好

除此之外,根据上一节学习到的内容,可以窥探到,线程池的本质其实就是一个生产者消费者模型,所以也会涉及到加解锁的问题,所以在类中我们需要两把锁,一把是用于单例模式的互斥锁,还有一把是用于生产者消费者之间的互斥锁


4. 手撕线程池

在写线程池的代码之前,需要先写一个关于单个线程的类,并且在线程池中,用数组存储所有的线程类

thread.hpp文件:

typedef void *(*fun_t)(void *);//线程要执行的函数是参数和返回值都为void*
class ThreadData
{
public:
    void *args_;//线程拥有的数据
    std::string name_;//线程的名字
};
class Thread
{
public:
    Thread(int num, fun_t callback, void *args) : func_(callback)
    {
        char nameBuffer[64];
        snprintf(nameBuffer, sizeof nameBuffer, "Thread-%d", num);
        name_ = nameBuffer;
        tdata_.args_ = args;
        tdata_.name_ = name_;
    }
    void start()
    {
        pthread_create(&tid_, nullptr, func_, (void*)&tdata_);//将线程名和参数都传给线程函数
    }
    void join()
    {
        pthread_join(tid_, nullptr);
    }
    std::string name()
    {
        return name_;
    }
    ~Thread()
    {}
private:
    std::string name_;//线程名字
    fun_t func_;//线程要执行的函数
    ThreadData tdata_;//线程的名字和数据
    pthread_t tid_;//线程ID
};

除此之外,还需要写一个锁相关的类
利用对象生命周期管理资源:

lockguard.hpp文件:

class Mutex
{
public:
    Mutex(pthread_mutex_t *mtx):pmtx_(mtx)
    {}
    void lock() 
    {
        // std::cout << "要进行加锁" << std::endl;
        pthread_mutex_lock(pmtx_);
    }
    void unlock()
    {
        // std::cout << "要进行解锁" << std::endl;
        pthread_mutex_unlock(pmtx_);
    }
    ~Mutex()
    {}
private:
    pthread_mutex_t *pmtx_;
};
// RAII风格的加锁方式
class lockGuard
{
public:
    lockGuard(pthread_mutex_t *mtx):mtx_(mtx)
    {
        mtx_.lock();
    }
    ~lockGuard()
    {
        mtx_.unlock();
    }
private:
    Mutex mtx_;
};

最后再看看看主要的函数:

在ThreadPool.hpp文件中:

const int g_thread_num = 3;//创建的线程数量
// 本质是: 生产消费模型
template <class T>
class ThreadPool
{
public:
    pthread_mutex_t *getMutex()
    {
        return &lock;
    }
    bool isEmpty()//判断队列是否为空
    {
        return task_queue_.empty();
    }
    void waitCond()
    {
        pthread_cond_wait(&cond, &lock);
    }
    T getTask()//拿到队列中的任务
    {
        T t = task_queue_.front();
        task_queue_.pop();
        return t;
    }

private:
    ThreadPool(int thread_num = g_thread_num) : num_(thread_num)
    {
        pthread_mutex_init(&lock, nullptr);
        pthread_cond_init(&cond, nullptr);
        for (int i = 1; i <= num_; i++)
        {
            threads_.push_back(new Thread(i, routine, this));//将创建出来的线程用数组管理
        }
    }
    ThreadPool(const ThreadPool<T> &other) = delete; //禁用拷贝构造函数
    const ThreadPool<T> &operator=(const ThreadPool<T> &other) = delete; //禁用运算符重载=
public:
    // 考虑一下多线程使用单例的过程
    static ThreadPool<T> *getThreadPool(int num = g_thread_num)
    {
        // 可以有效减少未来必定要进行加锁检测的问题
        // 拦截大量的在已经创建好单例的时候,剩余线程请求单例的而直接访问锁的行为
        if (nullptr == thread_ptr) 
        {
            lockGuard lockguard(&mutex);
            // 但是,未来任何一个线程想获取单例,都必须调用getThreadPool接口
            // 但是,一定会存在大量的申请和释放锁的行为,这个是无用且浪费资源的
            if (nullptr == thread_ptr)
                thread_ptr = new ThreadPool<T>(num);
        }
        return thread_ptr;
    }
    // 1. run()
    void run()//让线程池跑起来,也就是创建出多个线程
    {
        for (auto &iter : threads_)
        {
            iter->start();
			std::cout << iter->name() << " 启动成功" << std::endl;
        }
    }
    // 线程池本质也是一个生产消费模型
    // void *routine(void *args)
    // 消费过程
    static void *routine(void *args)//线程拿到任务后要执行的函数
    {
        ThreadData *td = (ThreadData *)args;
        ThreadPool<T> *tp = (ThreadPool<T> *)td->args_;
        while (true)
        {
            T task;
            {
                lockGuard lockguard(tp->getMutex());//去队列中拿任务前需要先加锁
                while (tp->isEmpty())//若队列为空,则使用条件变量进行等待
                    tp->waitCond();
                // 读取任务
                task = tp->getTask(); // 任务队列是共享的-> 将任务从共享,拿到自己的私有空间
            }
            //上来加上一对花括号的原因是让锁对象出了作用域自动销毁
            //此处来处理任务
        }
    }
    void pushTask(const T &task)
    {
        lockGuard lockguard(&lock);//插入任务时,也要加锁,队列是临界资源
        task_queue_.push(task);
        pthread_cond_signal(&cond);//插入成功后,直接使用条件变量唤醒线程来拿任务
    }
    ~ThreadPool()
    {
        for (auto &iter : threads_)
        {
            iter->join();
            delete iter;
        }
        pthread_mutex_destroy(&lock);
        pthread_cond_destroy(&cond);
    }
private:
    std::vector<Thread *> threads_;
    int num_;
    std::queue<T> task_queue_;
    static ThreadPool<T> *thread_ptr;
    static pthread_mutex_t mutex;
    pthread_mutex_t lock;
    pthread_cond_t cond;
};
template <typename T>
ThreadPool<T> *ThreadPool<T>::thread_ptr = nullptr;
template <typename T>
pthread_mutex_t ThreadPool<T>::mutex = PTHREAD_MUTEX_INITIALIZER;

5. 初识读写锁

其实出了互斥锁外,还有其他种类的锁:

【linux线程(四)】初识线程池&amp;手撕线程池-LMLPHP
而将要介绍的锁是读写锁

说白了就是一把锁,可以让只读的线程无限制的进入,而只对要对数据做修改的线程加锁

【linux线程(四)】初识线程池&amp;手撕线程池-LMLPHP

  1. 初始化锁
    【linux线程(四)】初识线程池&amp;手撕线程池-LMLPHP

  2. 销毁锁
    【linux线程(四)】初识线程池&amp;手撕线程池-LMLPHP

  3. 加解锁

【linux线程(四)】初识线程池&amp;手撕线程池-LMLPHP


6. 如何快速实现简易的线程池?

可以发现,上面的代码量是巨大的,所以在实际面试中遇见了,多半是记不住这么多代码的,所以这里我给大家打个样,写一个简易版的线程池,用来应对校招中需要手撕的场景:

#include<iostream>
#include<pthread.h>
#include<mutex>
#include<queue>
#include<functional>
using namespace std;
pthread_mutex_t MTX = PTHREAD_MUTEX_INITIALIZER;//用于初始化单例模式中要使用的锁
typedef function<void(int)> func_t;
void myprintf(int x)//模拟线程要执行的函数
{
    cout<<x<<" "<<endl;
}
class Task   //模拟线程要执行的任务
{
public:
    Task(func_t func = myprintf):_func(func)
    {}
public:
    func_t _func;
};
class ThreadPool
{
public:
    static ThreadPool* GetInstance()
    {
        if(_singleton == nullptr)
        {
            pthread_mutex_lock(&MTX);
            if(_singleton == nullptr)
            {
                _singleton = new ThreadPool();
                _singleton->InitThreadPool();
            }
            pthread_mutex_unlock(&MTX);
        }
        return _singleton;
    }
    void InitThreadPool()//启动线程池
    {
        for(int i=0;i<_num;i++)
        {
            pthread_t tid;
            if(pthread_create(&tid,nullptr,Routine,this)!=0)
                cout<<"线程启动失败"<<endl;
        }
        cout<<"线程池启动成功"<<endl;
    }
    static void* Routine(void* args)
    {
        ThreadPool* td = (ThreadPool*)args;
        while(1)
        {
            //拿到任务区执行
            Task t;
            pthread_mutex_lock(&td->_mtx);//加锁
            while(td->TaskQueueIsEmpty())//若资源不就绪就等待
                pthread_cond_wait(&td->_cond,&td->_mtx);
            cout<<"开始执行任务"<<endl;
            td->Pop(t);//任务队列的任务减一
            pthread_mutex_unlock(&td->_mtx);
            t._func(10);
            cout<<"一次任务执行完毕"<<endl;
        }
    }
    void Push(Task t)
    {
        pthread_mutex_lock(&_mtx);
        _q.push(t);
        pthread_mutex_unlock(&_mtx);
        pthread_cond_signal(&_cond);
        cout<<"任务push成功"<<endl;
    }
    void Pop(Task& t)
    {
        t = _q.front();
        _q.pop();
    }
    bool TaskQueueIsEmpty()
    {
        return _q.size()==0?true:false;
    }
private:
    ThreadPool(int num = 10):_num(num)
    {
        pthread_mutex_init(&_mtx,nullptr);
        pthread_cond_init(&_cond,nullptr);
    }
    ThreadPool(const ThreadPool& td) = delete;
public:
    static ThreadPool* _singleton;
    queue<Task> _q;
    int _num;//创建线程的数量
    pthread_mutex_t _mtx;
    pthread_cond_t _cond;
};
ThreadPool* ThreadPool::_singleton = nullptr;

上面是线程池的简易版,本人也是硬背的这段代码来应对手撕


7. 总结以及拓展

大家可能现在理解了线程的重要性,像12305铁路系统这种软件,它一秒钟可能会有百万个人同时上线,如果没有像线程池或者其他技术支持,那么一旦这么多人登陆12305软件,服务器肯定会直接崩溃,当然这里只是举一个线程池实际运用的例子,实际生活中的例子肯定不会像直接使用一个线程池这么简单,所以,respect!


03-23 17:38