前言
从本章的多线程开始,我们开始进入Linux系统的尾声,所以,在学习多线程的过程中,我们也会逐步对之前的内容进行复习,以达到知识巩固的效果。
预备
页表详解
对于我们的已经被编译好的可执行程序,其实早已被按照区域被划分为了4KB为单位,我们称它为页帧。
而内存其实也是被划分为了4KB为单位,且内存的IO基本单位也是4KB,我们称内存这样被划分的区域称之为页框。
缺页中断
在程序刚开始被运行的时候,我们的数据刚开始都还在磁盘当中,这个时候我们页表所映射的其实是磁盘地址,如果用户这个时候访问一个还在磁盘中的数据,首先要经过页表,然后页表+MMU会发现该数据没有被加载到内存,就会发生缺页中断:先将磁盘的数据加载到内存,然后更改页表映射。
页表的映射
那么为什么页框和页帧为4KB呢? 这就要详细讲解页表是如何映射的。
首先提出一个数学问题,如果只有一个页表单纯地去映射所有地址至少需要多少空间?
在32位系统中,一个地址要占32个bit位并且有多达2^32个地址。
这样计算下来,居然至少多达32GB。所以页表肯定不是这样映射的。
页表其实被是被划分为N级页表的,在32位系统中,有一级页表和二级页表。
其中一级页表映射后10位bit位,二级页表映射中间的10位bit位。
通过这样的方式,我们就可以完成页表的映射,我们再来计算一次采用这样的方案需要多少空间。
这个时候就是MB为单位了,内存存储几十MB还是没有问题的。
一、多线程是什么?
之前我们所学习的信号知识里面,我们了解到了一个进程是可以拥有多个执行流的概念。 那么,一个进程拥有多个执行流有什么用呢? 答案是可以提高程序的工作效率 。
而在我们以往学习所写的代码程序,其实都是单进程单执行流程序。
那么多线程到底是什么? 我们又该如何理解多线程?
线程在进程内部执行,在进程中的每一个执行流都是一个线程,其中一个进程的每个线程都共享且运行同一份地址空间,在上面的图中,我们可以将一个task_struct理解为一个线程。
对于CPU而言,它的基本调度单位是线程,它调度的其实是线程。
为什么这样工作效率更高?
首先毋庸置疑的,多执行流在CPU中运行肯定比单执行流效率更高。
第二, 因为他们共享一部分数据,不像进程一样具有独立性,所以线程所占用的资源更少。
第三,CPU中有cache缓冲,它会根据局部性原理,会将可能用上的一部分内存数据(/4KB)都保存在CPU的cache区中,所以CPU调用多线程就会使得减少CPU的cache区频繁改变。
可以总结为
轻量级进程
需要注意的是,在Linux系统中,其实并没有真正的线程概念,像Windows其实才具有真正的线程,在Linux系统中,我们采用的是轻量级进程(LWP:Light Weight Process),相对于其他系统的进程内核数据结构更加轻量化,并且也能达到多线程的效果。
就像上图所展示的,CPU所调度的是task_struct,Linux操作系统并没有为线程写一个数据结构。
线程是OS调度的基本单位,进程是承担OS资源的基本实体。
二、Pthread库
pthread_create
pthread库是一个第三方库,我们可以用它库中的pthread_create函数来在Linux系统中创建多线程。
参数 pthread_t *thread 是一个输出型函数,用于输出它创建出的线程的线程id。
参数 const pthread_attr_t *attr,也是一个输出型函数,用于输出该线程的属性数据。
参数 void* (*start_routine)(void *)是一个函数指针,是一个回调函数。
参数 void* arg 用于传递给void* (*start_routine)(void *)的参数。
#include <cstdio>
#include <pthread.h>
#include <iostream>
#include <unistd.h>
#include <string>
void *threadRun(void *args)
{
const std::string name = (char*) args;
while (1)
{
std::cout << name << " : pid " << getpid() << "\n" << std::endl;
sleep(1);
}
}
int main()
{
char name[64];
pthread_t tid[5];
for (int n = 0; n < 5; n++)
{
snprintf(name, sizeof name, "%s-%d", "thread", n + 1);
pthread_create(tid + n, nullptr, threadRun,(void*)name);
sleep(3);
}
while(1)
{
std::cout << "Main thread : pid " << getpid() << std::endl;
sleep(3);
}
return 0;
}
因为pthread是第三方库,所以我们需要链接它的库,我们需要使用
如果我们没有加-lpthread,则会出现下图报错
通过 ps aL 来查看线程状态
LWP(light weight process 轻量级进程)就是线程id。 它们的pid相同!