【C/C++ 关键字 存储类说明符 】 线程局部变量的魔法:C++ 中 thread_local的用法

简介: 【C/C++ 关键字 存储类说明符 】 线程局部变量的魔法:C++ 中 thread_local的用法

概述

thread_local指示对象拥有线程存储期。也就是对象的存储在线程开始时分配,而在线程结束时解分配。每个线程拥有其自身的对象实例。唯有声明为 thread_local 的对象拥有此存储期。 thread_local 能与 static 或 extern 结合一同出现,以调整链接(分别指定内部或外部链接),详细的可以查阅:存储类说明符 - cppreference.com

使用 thread_local 说明符声明的变量仅可在它在其上创建的线程上访问。 变量在创建线程时创建,并在销毁线程时销毁。 每个线程都有其自己的变量副本。
thread_local 说明符可以与 staticextern 合并。这将影响变量的链接属性。


表现形式

在 C++ 中,Thread Local Storage (TLS) 是通过使用 thread_local 关键字来实现的。它可以用于修饰全局变量、静态变量或类的静态成员变量,使其成为线程局部变量。对于一个使用 thread_local 修饰的变量,每个线程都拥有一个独立的副本。以下是使用 thread_local 的一些原型示例:

  • 全局变量
  • 每个线程都有自己单独的x副本,互不干预。
thread_local int globalVar; 

  • 局部变量(静态变量)
  • 线程存储期的变量都是和线程绑定的,所以只有第一次声明时被赋值。可以理解为线程专用的static变量。不过变量的作用域依然是在本身的作用域内。
void foo() {
   thread_local int staticVar;
}

  • 类对象(静态变量)
  • 与局部变量的情况相同,创建的实例相对于thread是static的,一般情况要求我们:thread_local对象声明时赋值.

类成员变量

  • thread_local作为类成员变量时必须是static的.
  • thread_local作为类成员时也是对于每个thread分别分配了一个,而static则是全局一个.
class MyClass {
public:
   static thread_local int staticMemberVar;
};

需要注意的是,使用 thread_local 关键字修饰的变量在每个线程中都有一个独立的副本,因此每个线程对其进行的操作都不会影响其他线程。在多线程环境下,这可以帮助避免数据竞争和同步开销。


作用和适用的场景

C++ 的 Thread Local Storage(TLS)特性在多线程环境中非常有用,它允许每个线程拥有一份单独的全局或静态变量副本。适用的场景包括:

  • 避免数据竞争:当多个线程需要访问全局或静态变量时,使用 TLS 可以为每个线程提供一个变量副本,从而避免数据竞争。每个线程只操作自己的变量副本,不会影响其他线程。
  • 减少同步开销:由于每个线程都有自己的变量副本,因此在某些情况下可以减少同步开销,例如减少互斥锁的使用。这可以提高多线程程序的性能。
  • 线程独立的资源分配:当某个资源需要在多个线程之间共享,但又希望每个线程独立使用该资源时,可以使用 TLS。例如,线程独立的内存分配器、线程独立的随机数生成器等。
  • 线程特有的状态跟踪:TLS 可用于跟踪每个线程的特定状态,如错误信息、递归调用计数、线程局部缓存等。这可以使每个线程在处理自己的数据时,能够访问和操作这些特定状态。
  • 模拟线程局部变量:在一些没有原生支持线程局部变量的环境中,可以使用 TLS 来模拟这个功能。例如,在 C++11 之前的版本中,可以通过自定义的实现来模拟线程局部变量。

需要注意的是,TLS 可能会增加内存消耗,因为每个线程都有自己的变量副本。此外,在某些情况下,TLS 可能会导致一定的性能损失,因为操作系统需要在线程切换时处理线程局部数据。因此,在使用 TLS 时,请确保权衡这些因素,并在适当的场景下使用。


实现逻辑

C++ 的 Thread Local Storage(TLS)特性在底层的实现和逻辑上有很多不同的方面。主要实现方法包括编译器支持、操作系统支持和库支持。在这里,我们将概述 TLS 的一般实现原理和底层逻辑:

  • 编译器支持:编译器在生成目标代码时,对于使用 thread_local 修饰的变量,会将其分配到特殊的存储区域。这个存储区域是每个线程独立的,因此在运行时,每个线程都可以访问自己独立的变量副本。
  • 操作系统支持:操作系统通常提供一种机制来管理线程局部存储。例如,Windows 使用 TlsAlloc、TlsGetValue 和 TlsSetValue 等函数管理线程局部存储,而 Linux 使用 pthread_key_create、pthread_getspecific 和 pthread_setspecific 等函数。当一个线程访问 thread_local 变量时,操作系统会将请求重定向到这个线程对应的局部存储区域。
  • 库支持:在 C++ 标准库中,线程局部存储的功能由 thread_local 关键字和相关的库函数提供。这些库函数在底层调用操作系统提供的 API 来实现线程局部存储的功能。
  • 线程创建时的初始化:当一个新线程被创建时,运行时系统会分配一个独立的 TLS 区域,并为该区域中的 thread_local 变量进行初始化。这些初始化操作可能包括调用默认构造函数、执行初始化表达式等。
  • 线程退出时的清理:当一个线程退出时,运行时系统会负责释放线程局部存储区域,并为该区域中的 thread_local 变量调用析构函数。这个过程通常由操作系统或 C++ 运行时库自动完成。
    需要注意的是,不同的编译器和操作系统可能有不同的实现细节。在实际使用中,开发者无需了解所有这些底层逻辑,只需使用 thread_local 关键字和相关的库函数就可以享受到线程局部存储带来的便利。

示例

示例1:使用 thread_local 计算每个线程的累积和

#include <iostream>
#include <thread>
#include <vector>
thread_local int sum = 0;
void accumulate(int n) {
  for (int i = 1; i <= n; ++i) {
    sum += i;
  }
  std::cout << "Thread id: " << std::this_thread::get_id() << ", Sum: " << sum << std::endl;
}
int main() {
  std::vector<std::thread> threads;
  for (int i = 1; i <= 5; ++i) {
threads.emplace_back(accumulate, i * 10);
}
for (auto& t : threads) {
t.join();
}
return 0;
}

示例2:模拟一个简单的线程安全计数器

#include <iostream>
#include <mutex>
#include <thread>
#include <vector>
std::mutex mtx;
unsigned int globalCounter = 0;
thread_local unsigned int localCounter = 0;
void incrementCounter(int n) {
  for (int i = 0; i < n; ++i) {
    ++localCounter;
    std::unique_lock<std::mutex> lock(mtx);
    ++globalCounter;
    lock.unlock();
  }
  std::cout << "Thread id: " << std::this_thread::get_id()
            << ", Local counter: " << localCounter
            << ", Global counter: " << globalCounter << std::endl;
}
int main() {
  std::vector<std::thread> threads;
  for (int i = 0; i < 5; ++i) {
    threads.emplace_back(incrementCounter, 100);
  }
  for (auto& t : threads) {
    t.join();
  }
  std::cout << "Final global counter: " << globalCounter << std::endl;
  return 0;
}

这两个示例展示了如何使用 thread_local 关键字创建线程局部变量。在第一个示例中,我们计算了每个线程的累积和。在第二个示例中,我们模拟了一个简单的线程安全计数器,它使用 thread_local 存储每个线程的局部计数,并使用互斥锁保护全局计数器。


需要注意的地方

thread_local 变量是线程局部存储的变量,它的生命周期与线程的生命周期相同。在多线程程序中,thread_local 变量可以用来保存线程相关的状态,从而避免了线程间的共享状态可能导致的同步问题。
然而,如果在使用 thread_local 变量时不小心,可能会导致内存泄漏问题。具体来说,如果一个线程结束时,它仍然持有一个指向 thread_local 变量的指针,那么这个 thread_local 变量就会一直存在,直到整个程序结束才会被释放。如果这个 thread_local 变量是一个大的对象,那么就会导致内存泄漏。
为了避免这个问题,需要确保在线程结束时及时清理 thread_local 变量。一种常见的做法是在 thread_local 变量的析构函数中清理相关的资源。例如,如果 thread_local 变量是一个指针类型,那么在析构函数中应该释放指针所指向的资源。同时,还可以使用一些 RAII 技巧,例如使用 std::unique_ptr 等智能指针,来帮助自动化资源清理的工作。


除了在 thread_local 变量的析构函数中及时清理资源外,还有一些其他的可能导致内存泄漏的情况,例如:
1.在使用 thread_local 变量时发生异常,导致析构函数没有被正确调用,从而导致资源泄漏。
2.在使用 thread_local 变量的线程中调用 std::exit 函数或者使用 std::quick_exit 函数退出程序,导致 thread_local 变量的析构函数没有被调用,从而导致资源泄漏。
3.在使用 thread_local 变量的线程中创建了一些子线程,并且这些子线程也使用了相同的 thread_local 变量,但是没有正确清理子线程中的 thread_local 变量,从而导致资源泄漏。


针对这些情况,我们需要采取相应的措施来避免内存泄漏,例如:
1.使用 RAII 技巧,例如使用 std::unique_ptr 等智能指针来管理资源,从而避免异常导致的资源泄漏。
2.在程序退出时,可以使用 std::atexit 函数来注册一个清理函数,该函数会在程序退出前被调用,从而确保 thread_local 变量的析构函数被正确调用。
3.在子线程中正确清理 thread_local 变量,可以使用类似于在主线程中清理 thread_local 变量的方式,即在 thread_local 变量的析构函数中清理相关资源。同时,还需要确保在子线程退出时,thread_local 变量的析构函数被正确调用。

总结

  • 本质上thread_local修饰后仍然是一个变量,我们依旧能够使用取地址操作者通过引用的方法传递给其他线程对其进行修改,
  • thread-local storage 和 static(或者说global) 存储很类似,每一个线程都将拥有一份这个数据的拷贝,thread_local对象的生命周期从线程开始时开始(对于全局变量),或者首先分配空间。当线程退出的时候对象析构;
  • 一般在声明时赋值,在本thread中只执行一次。当用于类成员变量时,必须是static的。
目录
相关文章
|
编译器 C++ 容器
【c++11】c++11新特性(上)(列表初始化、右值引用和移动语义、类的新默认成员函数、lambda表达式)
C++11为C++带来了革命性变化,引入了列表初始化、右值引用、移动语义、类的新默认成员函数和lambda表达式等特性。列表初始化统一了对象初始化方式,initializer_list简化了容器多元素初始化;右值引用和移动语义优化了资源管理,减少拷贝开销;类新增移动构造和移动赋值函数提升性能;lambda表达式提供匿名函数对象,增强代码简洁性和灵活性。这些特性共同推动了现代C++编程的发展,提升了开发效率与程序性能。
513 12
|
11月前
|
人工智能 机器人 编译器
c++模板初阶----函数模板与类模板
class 类模板名private://类内成员声明class Apublic:A(T val):a(val){}private:T a;return 0;运行结果:注意:类模板中的成员函数若是放在类外定义时,需要加模板参数列表。return 0;
272 0
|
11月前
|
存储 编译器 程序员
c++的类(附含explicit关键字,友元,内部类)
本文介绍了C++中类的核心概念与用法,涵盖封装、继承、多态三大特性。重点讲解了类的定义(`class`与`struct`)、访问限定符(`private`、`public`、`protected`)、类的作用域及成员函数的声明与定义分离。同时深入探讨了类的大小计算、`this`指针、默认成员函数(构造函数、析构函数、拷贝构造、赋值重载)以及运算符重载等内容。 文章还详细分析了`explicit`关键字的作用、静态成员(变量与函数)、友元(友元函数与友元类)的概念及其使用场景,并简要介绍了内部类的特性。
434 0
|
编译器 C++
类和对象(下)C++
本内容主要讲解C++中的初始化列表、类型转换、静态成员、友元、内部类、匿名对象及对象拷贝时的编译器优化。初始化列表用于成员变量定义初始化,尤其对引用、const及无默认构造函数的类类型变量至关重要。类型转换中,`explicit`可禁用隐式转换。静态成员属类而非对象,受访问限定符约束。内部类是独立类,可增强封装性。匿名对象生命周期短,常用于临时场景。编译器会优化对象拷贝以提高效率。最后,鼓励大家通过重复练习提升技能!
|
10月前
|
Java API 微服务
为什么虚拟线程将改变Java并发编程?
为什么虚拟线程将改变Java并发编程?
448 83
|
7月前
|
Java
如何在Java中进行多线程编程
Java多线程编程常用方式包括:继承Thread类、实现Runnable接口、Callable接口(可返回结果)及使用线程池。推荐线程池以提升性能,避免频繁创建线程。结合同步与通信机制,可有效管理并发任务。
297 6
|
机器学习/深度学习 消息中间件 存储
【高薪程序员必看】万字长文拆解Java并发编程!(9-2):并发工具-线程池
🌟 ​大家好,我是摘星!​ 🌟今天为大家带来的是并发编程中的强力并发工具-线程池,废话不多说让我们直接开始。
428 0
|
8月前
|
算法 Java
Java多线程编程:实现线程间数据共享机制
以上就是Java中几种主要处理多线程序列化资源以及协调各自独立运行但需相互配合以完成任务threads 的技术手段与策略。正确应用上述技术将大大增强你程序稳定性与效率同时也降低bug出现率因此深刻理解每项技术背后理论至关重要.
538 16
|
7月前
|
Java 调度 数据库
Python threading模块:多线程编程的实战指南
本文深入讲解Python多线程编程,涵盖threading模块的核心用法:线程创建、生命周期、同步机制(锁、信号量、条件变量)、线程通信(队列)、守护线程与线程池应用。结合实战案例,如多线程下载器,帮助开发者提升程序并发性能,适用于I/O密集型任务处理。
723 0
|
Linux
Linux编程: 在业务线程中注册和处理Linux信号
通过本文,您可以了解如何在业务线程中注册和处理Linux信号。正确处理信号可以提高程序的健壮性和稳定性。希望这些内容能帮助您更好地理解和应用Linux信号处理机制。
294 26

热门文章

最新文章