多线程的那点儿事(基础篇)
多线程编程是现代软件技术中很重要的一个环节。要弄懂多线程,这就要牵涉到多进程?当然,要了解到多进程,就要涉及到操作系统。不过大家也不要紧张,听我慢慢道来。这其中的环节其实并不复杂。
(1)单CPU下的多线程
在没有出现多核CPU之前,我们的计算资源是唯一的。如果系统中有多个任务要处理的话,那么就需要按照某种规则依次调度这些任务进行处理。什么规则呢?可以是一些简单的调度方法,比如说
1)按照优先级调度
2)按照FIFO调度
3)按照时间片调度等等
当然,除了CPU资源之外,系统中还有一些其他的资源需要共享,比如说内存、文件、端口、socket等。既然前面说到系统中的资源是有限的,那么获取这些资源的最小单元体是什么呢,其实就是进程。
举个例子来说,在linux上面每一个享有资源的个体称为task_struct,实际上和我们说的进程是一样的。我们可以看看task_struct(linux 0.11代码)都包括哪些内容
struct task_struct { /* these are hardcoded - dont touch */ long state; /* -1 unrunnable, 0 runnable, 0 stopped */ long counter; long priority; long signal; struct sigaction sigaction[32]; long blocked; /* bitmap of masked signals */ /* various fields */ int exit_code; unsigned long start_code,end_code,end_data,brk,start_stack; long pid,father,pgrp,session,leader; unsigned short uid,euid,suid; unsigned short gid,egid,sgid; long alarm; long utime,stime,cutime,cstime,start_time; unsigned short used_math; /* file system info */ int tty; /* -1 if no tty, so it must be signed */ unsigned short umask; struct m_inode * pwd; struct m_inode * root; struct m_inode * executable; unsigned long close_on_exec; struct file * filp[NR_OPEN]; /* ldt for this task 0 - zero 1 - cs 2 - ds ss */ struct desc_struct ldt[3]; /* tss for this task */ struct tss_struct tss;每一个task都有自己的pid,在系统中资源的分配都是按照pid进行处理的。这也就说明,进程确实是资源分配的主体。
这时候,可能有朋友会问了,既然task_struct是资源分配的主体,那为什么又出来thread?为什么系统调度的时候是按照thread调度,而不是按照进程调度呢?原因其实很简单,进程之间的数据沟通非常麻烦,因为我们之所以把这些进程分开,不正是希望它们之间不要相互影响嘛。
假设是两个进程之间数据传输,那么需要如果需要对共享数据进行访问需要哪些步骤呢
1)创建共享内存
2)访问共享内存- 系统调用- 读取数据
3)写入共享内存- 系统调用- 写入数据
要是写个代码,大家可能就更明白了
#include unistd.h #include stdio.h int value = 10; int main(int argc, char* argv[]) int pid = fork(); if(!pid){ Value = 12; return 0; } printf("value = %d\n", value); return 1;上面的代码是一个创建子进程的代码,我们发现打印的value数值还是10。尽管中间创建了子进程,修改了value的数值,但是我们发现打印下来的数值并没有发生改变,这就说明了不同的进程之间内存上是不共享的。
那么,如果修改成thread有什么好处呢?其实最大的好处就是每个thread除了享受单独cpu调度的机会,还能共享每个进程下的所有资源。要是调度的单位是进程,那么每个进程只能干一件事情,但是进程之间是需要相互交互数据的,而进程之间的数据都需要系统调用才能应用,这在无形之中就降低了数据的处理效率。
(2)多核CPU下的多线程
没有出现多核之前,我们的CPU实际上是按照某种规则对线程依次进行调度的。在某一个特定的时刻,CPU执行的还是某一个特定的线程。然而,现在有了多核CPU,一切变得不一样了,因为在某一时刻很有可能确实是n个任务在n个核上运行。我们可以编写一个简单的open mp测试一下,如果还是一个核,运行的时间就应该是一样的。
#include omp.h #define MAX_VALUE 10000000 double _test(int value) int index; double result; result = 0.0; for(index = value + 1; index MAX_VALUE; index +=2 ) result += 1.0 / index; return result; void test() int index; int time1; int time2; double value1,value2; double result[2]; time1 = 0; time2 = 0; value1 = 0.0; time1 = GetTickCount(); for(index = 1; index MAX_VALUE; index ++) value1 += 1.0 / index; time1 = GetTickCount() - time1; value2 = 0.0; memset(result , 0, sizeof(double) * 2); time2 = GetTickCount(); #pragma omp parallel for for(index = 0; index index++) result[index] = _test(index); value2 = result[0] + result[1]; time2 = GetTickCount() - time2; printf("time1 = %d,time2 = %d\n",time1,time2); return;(3)多线程编程
为什么要多线程编程呢?这其中的原因很多,我们可以举例解决
1)有的是为了提高运行的速度,比如多核cpu下的多线程
2)有的是为了提高资源的利用率,比如在网络环境下下载资源时,时延常常很高,我们可以通过不同的thread从不同的地方获取资源,这样可以提高效率
3)有的为了提供更好的服务,比如说是服务器
4)其他需要多线程编程的地方等等
本文出自seven的测试人生公众号最新内容请见作者的GitHub页:http://qaseven.github.io/
理解进程调度的基本过程,为学好多线程打好基础 操作系统是一组专门做计算机资源管理的软件的统称。目前常见的操作系统有:Windows,Unix,Linux,OSX,Android,ios等。
拜托!别再问我多线程的这些问题了 很多同学面对多线程的问题都很头大,因为自己做项目很难用到,但是但凡高薪的职位面试都会问到。。毕竟现在大厂里用的都是多线程高并发,所以这块内容不吃透肯定是不行的。 今天这篇文章,作为多线程的基础篇,先来谈谈以下问题: 为什么要用多线程? 程序 vs 进程 vs 线程 创建线程的 4 种方式?
相关文章
- 多线程基础(五)NSThread线程通信
- 多线程基础(四)线程的状态、安全性
- java实现多线程(车站卖票)
- .NET多线程执行函数
- C#编程总结(二)多线程基础
- paip.java 多线程参数以及返回值Future FutureTask 的使用.
- paip.java 多线程参数以及返回值Future FutureTask 的使用.
- 100天精通Python(进阶篇)——第37天:多线程threading模块基础+代码实战
- Python中的多线程是什么?如何实现?(附零基础学习资料)
- 详解openGauss多线程架构启动过程
- unordered_map多线程崩溃在find
- 生产者消费者模型:Kotlin 多线程读写文件实例
- Java并发编程与高并发之多线程
- 006-多线程-基础-同步解决 概述【ReentrantLock、Semaphore、CyclicBarrier、CountDownLatch】
- 005-多线程-基础-sleep、join、yield、wait、notify、notifyAll、run、start、synchronized
- 004-多线程-基础-同步问题引出、同步问题解决、死锁、线程间通信(wait/notify)、生产者与消费者
- iOS开发中多线程基础
- LabVIEW中使用多线程运行速度是否会更快
- 多线程间的互斥-锁(下)