在linux中的线程是轻量级线程(Light-Weight-process,LWP)
文章目录
- 线程概念
- 线程实现
- 线程拓展
线程概念
线程分类
- 用户级线程
- 内核级线程,没有用户空间,完全工作在内核中(下图中没有[]的就是用户级线程)
Linux线程特点
- Linux内核不区分进程和线程,PCB和TCB本质都是
task_struct
实例 task_struct
包含pid和tgid,无论进程还是线程它们的pid都是独一无二的- 一个进程包含一个线程组,线程组号=进程的pid=所有线程的tgid(包括主线程)
- 我们使用ps和getpid方法获取的pid其实就是tgid
对下图用户看到的PID其实就是pgid,而LWP其实是pid
pid用于调度,pgid用于资源管理
线程实现
创建进程我们使用fork,创建线程的时候可以使用new thread,逻辑层的变化大概如下
下面分析物理层的变化
看下函数的调用关系,kernel_thread是创建内核级线程的函数,它们的底层都是通过调用clone函数来实现功能的,区别是flag参数传的不太,下面看下clone函数的函数签名
int clone(int (*fn)(void *), void *stack, int flags, void *arg, ... /* pid_t *parent_tid, void *tls, pid_t *child_tid */ );
我挑了几个flag介绍一下,别的你可以执行:man clone
自个看
- CLONE_VM:标志在进程间共享地址空间,虚拟内存
- CLONE_FS:标志进程间共享文件系统信息
- CLONE_FILES:标志在进程间共享打开的文件
- CLONE_SIGHAND:标志在进程间共享信号处理程序
- …
创建进程时上述几个都不设置,创建线程时上述都设置,所以说创建线程的时候流程其实和进程是一样的,只不过共享的资源不同,所以说本质上来说内核不区分什么进程/线程,都会当作进程处理。
说到这里了不知道你有没有意识到,进程和线程就好像文件系统中的硬链接文件一样,其实相同的逻辑也可以带到C++中的shared_ptr智能指针,这些逻辑都是类似的,线程对进程资源维持一个计数,当计数为0时释放进程
。
注意:这些资源都是借助指针指向的如果需要共享的话只需要浅拷贝,主线程和其它线程的区别只有运行开始的时候起始位置不同
线程拓展
线程是作为栈帧存在于进程的栈中的,对一块内存它的栈指针和代码区运行位置的指针是唯一的,线程上下文切换的过程中会保存/恢复这两个指针的位置从而让线程觉得自己可以像进程一样工作,
线程模型
- 多对一模型(用户级线程),现在不用了,就是在用户态维持线程的TCB,因此在内核态他会认为这是多线程是一个进程,简单间理解的话就是用户模拟多线程自己调度,这个东西有点像协程,好处是调度灵活,上下文切换小。
问题: -
- 一个线程阻塞,所有线程阻塞
-
- 在多核系统中,多线程无法并行
-
- 只有一个内核线程在内核中
- 一对一模型(内核级线程),TCB由内核去管理,真正将线程暴露在内核中,使得并发性更好可以充分的利用多核CPU的资源(windows/linux/…主流操作系统采用这种模型)
问题: -
- 系统开销大,调度压力增大,调度自由度低
-
- 上下文切换变大
注意:内核级线程和内核线程是两个东西,内核级强调这种模式下的每一个线程由内核直接调度/控制,内核线程是内核为了满足操作系统并发性而独立维护的线程
参考:
【Linux系列】深入理解task_struct结构体