在了解多线程前先给大家介绍下并发和并行:
并发:多个任务一起执行 在多任务之间快速切换处理 任务数量大于cpu核数
并行:一个cpu核处理一个任务,多个cpu核同时处理多个任务 任务数量等于或者小于cpu核数
再介绍下同步和异步 :
同步:指线程在访问某一资源时,获得了资源的返回结果之后才会执行其他操作(先做某件事,再做某件事)
异步: 与同步相对,是指线程在访问某一资源时,无论是否取得返回结果,都进行下一步操作;当有了资源返回结果时 系统自会通知线程
在Python中,使用threading库来创建多线程
import threading def func1(): for i in range(6): time.sleep(1) def func2(): for i in range(5): time.sleep(1) # 创建线程对象 t2 = threading.Thread(target=func2) # target = 方法名 t1 = threading.Thread(target=func1, name='线程1') # 可以设置线程名字 # start 启动线程活动 # join([time]) 设置主线程会等待time秒后再往下执行,time默认为子线程结束,多个子线程之间设置的值会增加 # isAlive 返回线程是否活动的 # getName() 返回线程名 # setName() 设置线程名 a = time.time() t2.start() # 开始执行线程2 t1.start() # 开始执行线程1 # 让主线程等待子线程执行完后再继续往下执行 同步的概念 t2.join() t1.join() b = time.time() c = b - a print(c) threading.currentThread() # 返回当前执行的线程 threading.enumerate() # 返回正在运行的所有线程(list) 正在运行指:启动后、结束前,不包括了启动前和终止后的线程 threading.activeCount() # 返回正在运行的线程数量
在threading库中调用start方法后,start方法调用了他内部的run()方法,我们可以通过继承threading重写run()方法来批量创建线程,代码如下
import threading import requests import time # 通过继承 threading 类来创建线程 重写run方法 因为start方法调用的就是run 重写run class MyClass(threading.Thread): def __init__(self, url): self.url = url super().__init__() # 如果要传入参数重写init方法时,一定要调用父类的init方法 # 发送requests请求 def run(self): res = requests.get(self.url) print('线程{},返回{}'.format(threading.current_thread(), res.status_code)) t1 = time.time() for i in range(5): t = MyClass('https://www.baidu.com') t.start() t.join() t2 = time.time() print(t2 - t1)
可以通过直接实例化类来创建线程对象,如果要传入参数,在重写init方法时要注意在最后调用父类的init方法,具体原因可以去查看thrreading库是如何实现的,在init方法中有很多其他的代码需要执行。
多线程共享全局变量:
在python中是使用单核来处理线程的,也就是并发并非并行,代码示例如下:
import threading a = 100 def func1(): for i in range(100000): global a a += 1 print(a) def func2(): for i in range(100000): global a a += 1 print(a) t1 = threading.Thread(func1()) t2 = threading.Thread(func2()) t1.start() t2.start()
当执行func1()方法时,获取全局变量为100,此时暂停切换到func2()方法,获取全局变量a为100,并进入for循环,当a循环到20000时(举例),又切换到func1()方法中开始执行for循环,此时在func1()中a的值为100,循环1次后把a的值又更新为101,造成数据不准确。
解决这个问题会用到互斥锁、同步、队列,在下一篇会给大家讲到