一、线程概念
1.线程概念
线程,是进程中的一条执行流,是cpu调度运行的基本单元。
在Linux下线程通过pcb实现,一个进程中可以有多个pcb,并且这些pcb共享进程中的大部分资源,因此也被称为轻量级进程。
2.线程与进程的区别
2.1进程概念
进程,就是pcb(在Linux下是一个task_struct结构体),是操作系统对于程序运行的动态描述,操作系统通过这个描述实现对程序运行的调度以及管理。
2.2线程与进程的区别
可以看出,在Linux系统下,线程和进程的概念是比较混淆的,因此要换一个角度来进行区别:
进程:是系统进行资源分配的基本单元;
线程:是cpu进行调度执行的基本单元。
3.线程之间的独有与共享
独有:
标识符,上下文数据,程序计数器,栈,信号屏蔽字,errno……
共享:
虚拟地址空间,IO信号,信号处理方式,工作路径……
二、多任务处理:多线程VS多进程
1.多线程的优点
1)线程间通信更加灵活;
2)线程的创建与销毁成本更低;
3) 同一进程的线程间调度切换成本更低;
2.多进程的优点
1)多进程具有更好的稳定性和健壮性;
2)有些系统调用接口是针对进程的(例:信号,exit);
3.并发处理的优点(共同优点)
大大提高多任务的处理效率。
3.1 cpu密集型程序
程序中几乎都是大量的数据运算处理。
采用多执行流并发处理,更加充分的利用cpu资源;
但是执行流并不是越多越好,太多会增加cpu切换调度的成本,应该对程序进行压力测试,从而找到一个最合适的执行流数量。
3.2 IO密集型程序
程序中几乎都是大量的IO操作。
IO操作包含过程:IO等待+数据拷贝;
并发同时发起调用,压缩IO等待时间,提高效率
三、线程控制
1.线程创建
Linux操作系统并没有提供用于实现线程的系统调用接口,因此前辈大佬们针对一些特殊系统调用接口,在上层用户态进行封装了一套线程的操作接口。因此Linux下的线程控制接口都是库函数。
线程创建:
int pthread_create(pthread_t *tid, pthread_arr_t *arr, void* (*thread_routine)(void *), void *arg); pthread_t *tid:传入pthread_t类型变量的地址,获取线程id; pthread_arr_t *arr:线程属性,通常置为NULL; void* (*thread_routine)(void *):函数地址,线程的入口函数 void *arg:向线程入口函数传递的参数。
返回值:成功,返回0;失败,返回非0。
tid相关知识:
每个线程都会有自己相对独立的一块空间作为自己的局部存储。
创建线程时,返回的tid的值就是这块空间的首地址,所以通过tid就能找到这块空间,进而访问其中的数据实现对线程的控制操作。
2.线程终止
线程终止:退出线程
2.1在线程入口函数中return
线程的入口函数运行完毕,对应线程就会退出。
2.2在任意位置调用pthread_exit函数
void pthread_exit(void *retval);
retval:线程的退出返回值
2.3在任意位置调用pthread_cancel函数
int pthread_cancel(pthread_t tid);
tid:想要退出的线程的tid
返回值:
如果一个线程是被取消的,则这个线程的返回值是:PTHREAD_CANCELED
功能:取消指定的线程
3.线程等待
线程也有返回值,且在线程退出后,默认也是不会自动释放所有资源的;
需要其他线程进行等待处理,获取它的返回值,然后释放所有资源。
线程等待:
int pthread_join(pthread_t tid, void **retval);
tid:要等待的线程tid;
void **retval:用于获取线程退出返回值
返回值:
成功,返回0;失败,返回错误编号(非0)
4.线程分离
问题引入:
如果一个线程完成一个任务有返回值,我们可以通过pthread_join获取返回值,然后程序进行后续处理。这种情况属于不得不等待,因为若不等待就没有返回值,程序无法继续往下运行。
特殊情况:
当线程创建一个线程,只是想让其完成一个功能,不需要返回值。但是线程退出后为了保存返回值就不会自动释放资源,必须被等待,否则就会产生资源泄露。此时,则需要利用线程的分离属性。
总结:
如果创建一个线程后,不想等待这个线程的退出,也不想获取这个线程的退出返回值,则可以将此线程的属性设置为分离属性,让它退出后自动释放资源。
4.1线程分离属性
1)默认的joinable状态:线程退出后,不会自动释放资源,需要被等待。
2)detach状态:线程退出后,会自动释放资源,不需要被等待。
4.2设置分离属性接口
int pthread_detach(pthread_t tid);
tid:要分离的线程tid。
返回值:
成功,返回0;失败,返回错误编号(非0)