【python进阶】python多线程的实现方法,你还不知道吗?

简介: 多线程编程是一个非常重要的编程思想,本文主要介绍了python实现多线程的方法。

线程

想要理解线程的含义,首先我们先看一下百度百科的定义:

线程(英语:thread)是操作系统能够进行运算调度的最小单位。它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务。

简单来讲,当你打开电脑中的一个应用程序,其实此时计算机就为你创建了一个进程,系统会为其进行资源分配并且对其进行调度。而线程就是比进程还要小的单位,多个线程完成不同的工作组成了我们宏观上能够得到响应的工作结果。

举个例子,进程就像一个大的工厂,工厂中有很多机床设备和场地。而不同的线程就像工厂中工作的工人,工厂为其分配不同的工作来完成一个最终的生产目标。我们可以指派不同的工人做不同的工作或增加工人提高我们的生产效率。

在编程中,线程可以由我们启用帮助我们完成不同的工作实现多线程并发,提高我们的代码效率。

Python中的多线程

在python中主要有两种实现多线程的方式:

  • 通过threading.Thread () 方法创建线程
  • 通过继承 threading.Thread 类的继承重写run方法

接下来我们分别说一下多线程的两种实现形式。

threading.Thread () 创建线程

为了更直观的理解这个过程,首先我们先编写一个正常的函数,完成倒数5个数的功能,其中间隔一秒钟。

def fuc():
    for i in range(5):
        time.sleep(1)

在主函数中,我们调用Thread()来实例化两个线程,让他们同时运行。

if __name__ == '__main__':
    t1 = threading.Thread(target=fuc, args=(1,), daemon=True)
    t2 = threading.Thread(target=fuc, args=(2,), daemon=True)
    t2.start()
    t1.start()

整体代码如下所示:

import threading
import time


def fuc():
    for i in range(5):
        time.sleep(1)


if __name__ == '__main__':
    t1 = threading.Thread(target=fuc)
    t2 = threading.Thread(target=fuc)
    t2.start()
    t1.start()

我们先不讨论调用的函数以及传入的参数,先来看一下运行效果:

0
0
11
22
33
44

可以看到,两个打印的结果基本上是同时出现的,并且出现了混合的情况,证明两个打印的函数正在同时进行。

接下来我们就来介绍一下类的初始化参数以及我们调用的函数:

thread.Thread(group=Nore,targt=None,args=(),kwargs={},*,daemon=None)

在该类中主要由以下几个参数组成:

  • group:与ThreadGroup类相关,一般不使用。
  • target:线程调用的对象,就是目标函数,在上述的例子中我们传入的是我们编写的函数fuc。
  • name:线程的名字,默认是Tread-x。
  • args:为目标函数传递关键字参数,字典。
  • daemon:用来设置线程是否随主线程退出而退出,涉及到主线程相关知识,我们稍后介绍。

接下来介绍我们常用的几个方法:

  • run():表示线程启动的活动,在第二种继承写法中会用到。
  • start():激活线程,使其能够被调度。
  • join():等待至线程终止,这个方法涉及到主线程的知识,我们稍后介绍。
  • isAlive():返回线程是否活动。
  • getName():返回线程名称。
  • setName() : 设置线程名称。

接下来,我们使用上述参数更改示例,让函数获取一个参数,并为不同的线程设置名字。代码如下:

import threading
import time


def fuc(num):
    for i in range(5):
        print('接收到参数{}:'.format(num), i)
        time.sleep(1)


if __name__ == '__main__':
    # 传入参数及名字
    t1 = threading.Thread(target=fuc, args=(1,), name='t1')
    t2 = threading.Thread(target=fuc, args=(2,), name='t2')
    t1.start()
    print(t1.getName(), '开始运行...')
    t2.start()
    print(t2.getName(), '开始运行...')

运行结果如下:

接收到参数1:t1 开始运行... 
0
接收到参数2: t20 开始运行...

接收到参数1:接收到参数2: 1 
1
接收到参数1:接收到参数2:  2
2
接收到参数1:接收到参数2:  33

接收到参数1:接收到参数2:  4
4

可以看到,虽然结果很混乱,但是我们传入的参数以及获取的名字都被打印出来了。

另外,这里有两个注意:

  • trgat参数接受的是函数名字不需要加括号。
  • args传入的执行函数参数要加括号和逗号,保证其是一个元组。

继承 threading.Thread 类的线程创建

在上面的例子中,我们已经理解了多线程的一种创建方法。接下来我们来介绍第二种方法,这也是众多大佬很喜欢的一种方法,通过继承 threading.Thread 类的线程创建。

class MyThread(threading.Thread):
    def run(self) -> None:
        for i in range(5):
            print(i)
            time.sleep(1)


if __name__ == '__main__':
    t1 = MyThread(name='t1')
    t2 = MyThread(name='t2')
    t1.start()
    t2.start()

运行结果如下:

0
0
11
22
33
44

注意:这里调用的是start方法而不是run方法,否则会编程单线程执行。

主线程

在了解了多线程的编程方法之后,我们来介绍一下主线程及相关参数和方法。

在我们执行多线程程序的过程中,存在一个主线程,而我们开辟的其他线程其实都是它的子线程。由主线程主导的工作有以下两种情况:

  • 由于主线程结束了,强制停止其它线程的工作,但此时其他线程有可能还没有结束自己的工作。
  • 主线程结束后,等待其他线程结束工作,再停止所有线程的工作。

可以简单地理解为包工头,它是这些线程的头子!其从微观角度上讲掌管了一定的工作流程,它可以选择是否等待其它工人结束工作再结束整个工作。

而我们可以使用参数或者方法控制这个过程。

使用daemon参数控制过程

在上边的函数参数介绍中,提到了daemon参数,其为False时,线程不会随主线程结束而退出,主线程会等待其结束后再退出。而为True时则不论子线程是否完成了相关工作都会直接退出。

接下来我们看两个示例,我们修改刚才的示例代码的daemon参数为True,表示不论子线程是否完成了工作都强制退出。

import threading
import time


def fuc(num):
    for i in range(5):
        print('接收到参数{}:'.format(num), i)
        time.sleep(1)


if __name__ == '__main__':
    t1 = threading.Thread(target=fuc, args=(1,), name='t1', daemon=True)
    t2 = threading.Thread(target=fuc, args=(2,), name='t2', daemon=True)
    t1.start()
    print(t1.getName(), '开始运行...')
    t2.start()
    print(t2.getName(), '开始运行...')
    print("我是主线程,都给我停下!")

结果如下:

接收到参数1:t1 0 
开始运行...
接收到参数2:t2  0
开始运行...
我是主线程,都给我停下!

可以看到,子线程的倒数还没有结束,由于主线程结束了,所有线程一起结束了。
这里要注意以下几点:

  • daemon属性必须在start( )之前设置。
  • 从主线程创建的所有线程不设置daemon属性,则默认都是daemon=False。

使用.join()阻塞线程

除此之外,我们还可以调用.join()方法阻塞线程,调用该方法的时候,该方法的调用者线程结束后程序才会终止。

#timeout参数表明等待的时长,不设置该参数则默认为一直等待。
join(timeout-=None)

我们来看下面这个示例,我们更改了两个函数的倒计时时间,使第一个线程的倒计时时间更长,并对第二个线程进行了阻塞操作。代码如下:

import threading
import time


def fuc1():
    for i in range(10):
        print(i)
        time.sleep(1)


def fuc2():
    for i in range(5):
        print(i)
        time.sleep(1)


if __name__ == '__main__':
    t1 = threading.Thread(target=fuc1, name='t1', daemon=True)
    t2 = threading.Thread(target=fuc2, name='t2', daemon=True)
    t1.start()
    print(t1.getName(), '开始运行...')
    print('我是二儿子,等等我!')
    t2.start()
    print(t2.getName(), '开始运行...')
    t2.join()
    print("我是主线程,都给我停下!")

结果如下:

0t1
开始运行...
我是二儿子,等等我!
0t2 
开始运行...
11
22
33
44

我是主线程,都给我停下!5

我们可以看到,上述代码中线程一还没有结束倒数十个数,程序就结束了。在此过程中,主线程只等待了第二个线程结束,整个程序就结束了。

线程同步

在多个线程同步运行的情况下,会出现多个线程同时操作一个数据的情况。如果两个线程同时操作同一个变量的话,很容易出现混乱的情况。所以,我们需要一个工具来确保在同一时间只能有一个线程处理数据。

线程类提供了锁来解决问题,当线程申请处理某个数据时申请一个锁来控制住当前数据,结束处理时即将锁释放。

threading中的锁

python的threading中为我们提供了RLock锁来解决多线程同时处理一个数据的问题。在某个时刻,我们可以让线程申请锁来保护数据此时只能供该线程使用。

为了更好的理解该过程,我们定义一个全局变量,让每一个线程都对其操作但不设置锁,观察变量的变化:

R_LOCK = threading.Lock()
COUNT = 100


class MyThread(threading.Thread):
    def run(self) -> None:
        global COUNT
        #R_LOCK.acquire()
        COUNT -= 10
        time.sleep(1)
        print(self.getName(), COUNT)
        #R_LOCK.release()


if __name__ == '__main__':
    threads = [MyThread() for i in range(10)]
    for t in threads:
        t.start()

结果如下:

Thread-3Thread-10  0Thread-8Thread-7 0Thread-6 0Thread-5Thread-9
Thread-1 0Thread-2 00  0
Thread-4 000

可以看到,我们的数据发生了异常,这并不是我们想要得到的结果,若把锁给关闭注释让其正常运行可以看到以下的正常结果:

Thread-1 90
Thread-2 80
Thread-3 70
Thread-4 60
Thread-5 50
Thread-6 40
Thread-7 30
Thread-8 20
Thread-9 10
Thread-10 0

结语

多线程编程是一个非常重要的编程思想,理解多线程编程有助于我们更好的理解设计模式。

当然,python中的编程并不是真正的多线程执行,这涉及到GIL全局解释锁相关的知识。所以其针对CPU密集型任务来说并没有很好的效果,接下来我将会更新相关的内容进行更多的说明。

如果有什么问题可以私信我或者是在评论区留言与我一起交流,如果你觉得我写的不错,麻烦你帮我点个赞吧!

相关文章
|
2月前
|
机器学习/深度学习 Python
堆叠集成策略的原理、实现方法及Python应用。堆叠通过多层模型组合,先用不同基础模型生成预测,再用元学习器整合这些预测,提升模型性能
本文深入探讨了堆叠集成策略的原理、实现方法及Python应用。堆叠通过多层模型组合,先用不同基础模型生成预测,再用元学习器整合这些预测,提升模型性能。文章详细介绍了堆叠的实现步骤,包括数据准备、基础模型训练、新训练集构建及元学习器训练,并讨论了其优缺点。
105 3
|
1月前
|
安全
Python-打印99乘法表的两种方法
本文详细介绍了两种实现99乘法表的方法:使用`while`循环和`for`循环。每种方法都包括了步骤解析、代码演示及优缺点分析。文章旨在帮助编程初学者理解和掌握循环结构的应用,内容通俗易懂,适合编程新手阅读。博主表示欢迎读者反馈,共同进步。
|
1月前
|
JSON 安全 API
Python调用API接口的方法
Python调用API接口的方法
286 5
|
2月前
|
算法 决策智能 Python
Python中解决TSP的方法
旅行商问题(TSP)是寻找最短路径,使旅行商能访问每个城市一次并返回起点的经典优化问题。本文介绍使用Python的`ortools`库解决TSP的方法,通过定义城市间的距离矩阵,调用库函数计算最优路径,并打印结果。此方法适用于小规模问题,对于大规模或特定需求,需深入了解算法原理及定制策略。
59 15
|
25天前
|
缓存 安全 Java
【JavaEE】——单例模式引起的多线程安全问题:“饿汉/懒汉”模式,及解决思路和方法(面试高频)
单例模式下,“饿汉模式”,“懒汉模式”,单例模式下引起的线程安全问题,解锁思路和解决方法
|
25天前
|
Java 程序员 调度
【JavaEE】线程创建和终止,Thread类方法,变量捕获(7000字长文)
创建线程的五种方式,Thread常见方法(守护进程.setDaemon() ,isAlive),start和run方法的区别,如何提前终止一个线程,标志位,isinterrupted,变量捕获
|
2月前
|
数据采集 存储 数据处理
Python中的多线程编程及其在数据处理中的应用
本文深入探讨了Python中多线程编程的概念、原理和实现方法,并详细介绍了其在数据处理领域的应用。通过对比单线程与多线程的性能差异,展示了多线程编程在提升程序运行效率方面的显著优势。文章还提供了实际案例,帮助读者更好地理解和掌握多线程编程技术。
|
2月前
|
机器学习/深度学习 人工智能 算法
强化学习在游戏AI中的应用,从基本原理、优势、应用场景到具体实现方法,以及Python在其中的作用
本文探讨了强化学习在游戏AI中的应用,从基本原理、优势、应用场景到具体实现方法,以及Python在其中的作用,通过案例分析展示了其潜力,并讨论了面临的挑战及未来发展趋势。强化学习正为游戏AI带来新的可能性。
150 4
|
2月前
|
并行计算 数据处理 调度
Python中的并发编程:探索多线程与多进程的奥秘####
本文深入探讨了Python中并发编程的两种主要方式——多线程与多进程,通过对比分析它们的工作原理、适用场景及性能差异,揭示了在不同应用需求下如何合理选择并发模型。文章首先简述了并发编程的基本概念,随后详细阐述了Python中多线程与多进程的实现机制,包括GIL(全局解释器锁)对多线程的影响以及多进程的独立内存空间特性。最后,通过实例演示了如何在Python项目中有效利用多线程和多进程提升程序性能。 ####
|
2月前
|
Python
Python编程中的魔法方法(Magic Methods)
【10月更文挑战第40天】在Python的世界中,魔法方法就像是隐藏在代码背后的神秘力量。它们通常以双下划线开头和结尾,比如 `__init__` 或 `__str__`。这些方法定义了对象的行为,当特定操作发生时自动调用。本文将揭开这些魔法方法的面纱,通过实际例子展示如何利用它们来增强你的类功能。
35 1