前言

从本章的多线程开始,我们开始进入Linux系统的尾声,所以,在学习多线程的过程中,我们也会逐步对之前的内容进行复习,以达到知识巩固的效果。


预备

页表详解

对于我们的已经被编译好的可执行程序,其实早已被按照区域被划分为了4KB为单位,我们称它为页帧

而内存其实也是被划分为了4KB为单位,且内存的IO基本单位也是4KB,我们称内存这样被划分的区域称之为页框

缺页中断

在程序刚开始被运行的时候,我们的数据刚开始都还在磁盘当中,这个时候我们页表所映射的其实是磁盘地址,如果用户这个时候访问一个还在磁盘中的数据,首先要经过页表,然后页表+MMU会发现该数据没有被加载到内存,就会发生缺页中断:先将磁盘的数据加载到内存,然后更改页表映射。

页表的映射

那么为什么页框和页帧为4KB呢? 这就要详细讲解页表是如何映射的。

首先提出一个数学问题,如果只有一个页表单纯地去映射所有地址至少需要多少空间?

在32位系统中,一个地址要占32个bit位并且有多达2^32个地址。
这样计算下来,居然至少多达32GB。所以页表肯定不是这样映射的。
LInux-多线程基础概念-LMLPHP

页表其实被是被划分为N级页表的,在32位系统中,有一级页表和二级页表。

其中一级页表映射后10位bit位,二级页表映射中间的10位bit位。
LInux-多线程基础概念-LMLPHP
通过这样的方式,我们就可以完成页表的映射,我们再来计算一次采用这样的方案需要多少空间。
LInux-多线程基础概念-LMLPHP
这个时候就是MB为单位了,内存存储几十MB还是没有问题的。

一、多线程是什么?

之前我们所学习的信号知识里面,我们了解到了一个进程是可以拥有多个执行流的概念。 那么,一个进程拥有多个执行流有什么用呢? 答案是可以提高程序的工作效率 。

而在我们以往学习所写的代码程序,其实都是单进程单执行流程序。

那么多线程到底是什么? 我们又该如何理解多线程?
LInux-多线程基础概念-LMLPHP
线程在进程内部执行,在进程中的每一个执行流都是一个线程,其中一个进程的每个线程都共享且运行同一份地址空间,在上面的图中,我们可以将一个task_struct理解为一个线程。

对于CPU而言,它的基本调度单位是线程,它调度的其实是线程。

为什么这样工作效率更高?

首先毋庸置疑的,多执行流在CPU中运行肯定比单执行流效率更高。
第二, 因为他们共享一部分数据,不像进程一样具有独立性,所以线程所占用的资源更少。
第三,CPU中有cache缓冲,它会根据局部性原理,会将可能用上的一部分内存数据(/4KB)都保存在CPU的cache区中,所以CPU调用多线程就会使得减少CPU的cache区频繁改变。

可以总结为

轻量级进程

需要注意的是,在Linux系统中,其实并没有真正的线程概念,像Windows其实才具有真正的线程,在Linux系统中,我们采用的是轻量级进程(LWP:Light Weight Process),相对于其他系统的进程内核数据结构更加轻量化,并且也能达到多线程的效果。
就像上图所展示的,CPU所调度的是task_struct,Linux操作系统并没有为线程写一个数据结构。

线程是OS调度的基本单位,进程是承担OS资源的基本实体。


二、Pthread库

pthread_create

pthread库是一个第三方库,我们可以用它库中的pthread_create函数来在Linux系统中创建多线程。

参数 pthread_t *thread 是一个输出型函数,用于输出它创建出的线程的线程id。

参数 const pthread_attr_t *attr,也是一个输出型函数,用于输出该线程的属性数据。

参数 void* (*start_routine)(void *)是一个函数指针,是一个回调函数。

参数 void* arg 用于传递给void* (*start_routine)(void *)的参数。

#include <cstdio>
#include <pthread.h>
#include <iostream>
#include <unistd.h>
#include <string>


void *threadRun(void *args)
{
    const std::string name = (char*) args;
    while (1)
    {
        std::cout << name << " : pid " << getpid() << "\n" << std::endl;
        sleep(1);
    }

}
int main()
{
    char name[64];
    pthread_t tid[5];
    for (int n = 0; n < 5; n++)
    {
        snprintf(name, sizeof name, "%s-%d", "thread", n + 1);
        pthread_create(tid + n, nullptr, threadRun,(void*)name);
        sleep(3);
    }

    while(1)
    {
        std::cout << "Main thread : pid " << getpid() << std::endl;
        sleep(3);
    }
    return 0;
}

因为pthread是第三方库,所以我们需要链接它的库,我们需要使用

如果我们没有加-lpthread,则会出现下图报错
LInux-多线程基础概念-LMLPHP

通过 ps aL 来查看线程状态

LInux-多线程基础概念-LMLPHP
LWP(light weight process 轻量级进程)就是线程id。 它们的pid相同!


03-08 16:30