Java 中线程和纤程Fiber的区别是什么?

本文涉及的产品
视觉智能开放平台,视频资源包5000点
NLP自然语言处理_高级版,每接口累计50万次
视觉智能开放平台,分割抠图1万点
简介: 【10月更文挑战第14天】

0 前言

线程和Fiber通常会一起讨论,但它们有各自不同使用场景和性能考虑。

线程和Fiber在抽象和实现上基本相同,主要区别在于使用场景:

  • os线程可用于任何语言,但需要大量RAM,且在同步和生成时较慢
  • 而Fiber则特定于某个语言或运行时,十分轻量,且同步时几乎没有额外开销
  • 虚拟线程随 Java 21 成为永久功能,解决了传统线程的一些性能限制,以最大化硬件性能

1 啥是 Java 中的线程?

线程是由调度程序安排在适当时间运行于 CPU 核心上的续延。续延简单来说就是程序计数器,它标记了我们在指令序列中的位置,以及一个堆栈,用于存储变量的值。

os会看到并使用硬件运行时:包括 CPU、应用数据寄存器、代码寄存器(即程序计数器)、内存寄存器(如堆栈指针)、虚拟内存和 CPU 模式。特别是,当发生陷阱事件或执行系统调用时,CPU可在受限的用户模式和功能更强大的内核模式之间切换。os线程共享大多数内核资源(如 I/O 描述符),且位于同一地址空间:这使得它们比多个单线程os进程更轻,同时允许它们共享数据。但它们不共享 CPU 寄存器,且拥有各自的堆栈,这使它们能并发执行不同的控制流。

2 JVM 线程与调度

线程数量可能超过可用的处理器,因此os需通过调度将它们在 CPU 上切换。调度事件可由抢占事件触发(当线程耗尽它的 CPU 配额时)或代码显式调用系统调用陷阱(如执行内核例程,如 I/O)。CPU会切换到内核模式,并将执行转移到包含陷阱处理程序的特殊内存区域:此时内核可以快照 CPU 寄存器,包括程序计数器和线程堆栈指针,并将它们打包到一个 线程控制块 续延中。

之后,调度程序被调用以选择下一个要运行的线程,可能是在不同的进程中;然后内核恢复所有相关的 CPU 寄存器,并设置处理器切换回用户模式,在恢复的程序计数器地址继续执行。

3 啥是虚拟线程?

虚拟线程是轻量级线程,简化了编写和维护具有高计算要求的并发应用程序的过程。

传统的os线程非常笨重。而虚拟线程则将线程调度的责任从os转移到 JVM,有效地在操作系统和应用程序之间引入了一个抽象层。虚拟线程随 JDK 21 成为永久功能,克服了传统线程的一些性能限制,以最大化硬件性能。

📚 进一步阅读: 深入了解虚拟线程的细节

4 Java中的线程和Fiber

线程是由os实现的,而Fiber(或用户模式线程)则在用户模式下实现。

简单来说,Fiber也是线程,即我们可以生成并与其他线程同步的顺序进程。不过,通常我们提到“线程”时是指由os实现的那些线程,而Fiber(有时称为轻量级线程或用户模式线程)则是在用户模式下实现的。

5 啥是 Quasar Fiber?

Quasar 是一个便于在 Java 中进行并发编程的轻量级线程库。

Quasar 将Fiber和线程抽象为一个统一的线,使Fiber和线程可以无缝协作。Quasar Fiber的实现方式与os线程类似,但它们是用 JVM 字节码而不是os内核实现的。

为啥用 Quasar Fiber?

os线程会带来较大的性能开销:在线程之间切换时,需要在用户模式和内核模式之间来回切换,甚至有时还会跨越地址空间边界。这些操作非常昂贵,部分原因在于它们会导致 TLB 刷新、缓存未命中和 CPU 管道混乱:这也是为什么陷阱和系统调用比普通的过程调用慢许多倍。

此外,内核使用通用调度算法为线程分配 CPU 核心,这种算法可能会处理各类线程,从只处理一个事务的线程到处理完整视频播放的线程。

6 啥时在 Java 中使用Fiber?

由于Fiber是在应用层调度的,它们可以使用更适合自身使用场景的调度程序。大多数Fiber用于处理事务,因此它们的活动时间非常短,并且经常被阻塞。Fiber的行为通常是被 I/O 或其他Fiber唤醒,运行一个简短的处理周期,然后将控制权转移给另一个Fiber(通过队列或其他同步机制)。这种行为最适合使用称为“工作窃取”的调度算法;这种调度算法被 Erlang、Go 和 Quasar(默认情况下)使用。当Fiber以这种方式运行时,工作窃取能够在Fiber之间切换时最小化缓存未命中。

内核可能成为高并发的瓶颈。假设线程切换的速度与普通过程调用一样快,并且我们可以避免为线程维护内核数据结构:那么我们可以在内存占用和切换效率方面获得巨大提升。

JVM Fiber性能如何?

管理Fiber的用户模式堆栈确实会带来一些开销;具体开销取决于插桩方法的调用频率以及Fiber调用堆栈的深度。如像 Comsat 这样的 Quasar 集成通常基于 FiberAsync 类,它会在调用异步 API 后挂起Fiber,并在完成回调时恢复Fiber。在这种情况下,堆栈非常浅,调用频率也很低,因为Fiber主要用于执行 I/O 操作(I/O 操作比方法调用慢很多倍)。

这篇基准分析 表明,与线程相比,使用Fiber处理 HTTP 请求显著提高了服务器的 容量,并使其更具弹性。我们的经验表明,Quasar Fiber在许多具体场景下表现良好:它们允许你编写简单的Fiber阻塞代码,同时开发高度并发且细粒度的系统,这些系统无法在笨重的操作系统线程上运行。

即便与异步和单子 API 相比,Fiber的开销也非常低。异步和单子 API 不仅带来了繁琐且具传染性的编程风格,还无法与语言内置的命令式控制流结构很好地协作。

那JVM Fiber是不是生成器或 async/await?

不,正如之前讨论,Fiber是真正的线程:即一个续延加上一个调度器。生成器和 async/await 是通过续延实现的(通常是一个更有限的续延形式,称为 无栈,它只能捕获单个堆栈帧),但这些续延没有调度器,因此它们不是线程。

7 最终想法

不要让关于Fiber和线程的讨论止步于性能改进。JRebel 可以跳过重新部署和重建,同时保持应用状态。这样开发者可以即时检查代码更改的效果,从而保持开发节奏。

目录
相关文章
|
12天前
|
Java 开发者
Java多线程编程中的常见误区与最佳实践####
本文深入剖析了Java多线程编程中开发者常遇到的几个典型误区,如对`start()`与`run()`方法的混淆使用、忽视线程安全问题、错误处理未同步的共享变量等,并针对这些问题提出了具体的解决方案和最佳实践。通过实例代码对比,直观展示了正确与错误的实现方式,旨在帮助读者构建更加健壮、高效的多线程应用程序。 ####
|
3天前
|
缓存 Java 开发者
Java多线程编程的陷阱与最佳实践####
本文深入探讨了Java多线程编程中常见的陷阱,如竞态条件、死锁和内存一致性错误,并提供了实用的避免策略。通过分析典型错误案例,本文旨在帮助开发者更好地理解和掌握多线程环境下的编程技巧,从而提升并发程序的稳定性和性能。 ####
|
9天前
|
存储 缓存 安全
java 中操作字符串都有哪些类,它们之间有什么区别
Java中操作字符串的类主要有String、StringBuilder和StringBuffer。String是不可变的,每次操作都会生成新对象;StringBuilder和StringBuffer都是可变的,但StringBuilder是非线程安全的,而StringBuffer是线程安全的,因此性能略低。
|
3天前
|
安全 Java 开发者
Java中的多线程编程:从基础到实践
本文深入探讨了Java多线程编程的核心概念和实践技巧,旨在帮助读者理解多线程的工作原理,掌握线程的创建、管理和同步机制。通过具体示例和最佳实践,本文展示了如何在Java应用中有效地利用多线程技术,提高程序性能和响应速度。
24 1
|
11天前
|
安全 Java 开发者
Java 多线程并发控制:深入理解与实战应用
《Java多线程并发控制:深入理解与实战应用》一书详细解析了Java多线程编程的核心概念、并发控制技术及其实战技巧,适合Java开发者深入学习和实践参考。
|
11天前
|
Java 开发者
Java多线程编程的艺术与实践####
本文深入探讨了Java多线程编程的核心概念、应用场景及实践技巧。不同于传统的技术文档,本文以实战为导向,通过生动的实例和详尽的代码解析,引领读者领略多线程编程的魅力,掌握其在提升应用性能、优化资源利用方面的关键作用。无论你是Java初学者还是有一定经验的开发者,本文都将为你打开多线程编程的新视角。 ####
|
10天前
|
存储 安全 Java
Java多线程编程中的并发容器:深入解析与实战应用####
在本文中,我们将探讨Java多线程编程中的一个核心话题——并发容器。不同于传统单一线程环境下的数据结构,并发容器专为多线程场景设计,确保数据访问的线程安全性和高效性。我们将从基础概念出发,逐步深入到`java.util.concurrent`包下的核心并发容器实现,如`ConcurrentHashMap`、`CopyOnWriteArrayList`以及`BlockingQueue`等,通过实例代码演示其使用方法,并分析它们背后的设计原理与适用场景。无论你是Java并发编程的初学者还是希望深化理解的开发者,本文都将为你提供有价值的见解与实践指导。 --- ####
|
16天前
|
安全 Java 开发者
深入解读JAVA多线程:wait()、notify()、notifyAll()的奥秘
在Java多线程编程中,`wait()`、`notify()`和`notifyAll()`方法是实现线程间通信和同步的关键机制。这些方法定义在`java.lang.Object`类中,每个Java对象都可以作为线程间通信的媒介。本文将详细解析这三个方法的使用方法和最佳实践,帮助开发者更高效地进行多线程编程。 示例代码展示了如何在同步方法中使用这些方法,确保线程安全和高效的通信。
43 9
|
13天前
|
安全 Java 开发者
Java多线程编程中的常见问题与解决方案
本文深入探讨了Java多线程编程中常见的问题,包括线程安全问题、死锁、竞态条件等,并提供了相应的解决策略。文章首先介绍了多线程的基础知识,随后详细分析了每个问题的产生原因和典型场景,最后提出了实用的解决方案,旨在帮助开发者提高多线程程序的稳定性和性能。
|
16天前
|
监控 安全 Java
Java中的多线程编程:从入门到实践####
本文将深入浅出地探讨Java多线程编程的核心概念、应用场景及实践技巧。不同于传统的摘要形式,本文将以一个简短的代码示例作为开篇,直接展示多线程的魅力,随后再详细解析其背后的原理与实现方式,旨在帮助读者快速理解并掌握Java多线程编程的基本技能。 ```java // 简单的多线程示例:创建两个线程,分别打印不同的消息 public class SimpleMultithreading { public static void main(String[] args) { Thread thread1 = new Thread(() -> System.out.prin