解密并发幕后黑手:线程切换引发的原子性问题
摘要:原子性是指一个或者多个操作在CPU中执行的过程不被中断的特性。原子性操作一旦开始运行,就会一直到运行结束为止,中间不会有中断的情况发生。
本文分享自华为云社区《【高并发】解密导致并发问题的第二个幕后黑手——原子性问题》,作者: 冰 河。
原子性
原子性是指一个或者多个操作在CPU中执行的过程不被中断的特性。原子性操作一旦开始运行,就会一直到运行结束为止,中间不会有中断的情况发生。
我们也可以这样理解原子性,就是线程在执行一系列操作时,这些操作会被当做一个不可拆分的整体执行,这些操作要么全部执行,要么全部不执行,不会存在只执行一部分的情况,这就是原子性操作。
关于原子性操作一个典型的场景就是转账,例如,小明和小刚的账户余额都是200元,此时小明给小刚转账100元,如果转账成功,则小明的账户余额为100元,小刚的账户余额为300元;如果转账失败,则小明和小刚的账户余额仍然为200元。不会存在小明账户为100元,小刚账户为200元,或者小明账户为200元,小刚账户为300元的情况。
这里,小明给小刚转账100元的操作,就是一个原子性操作,它涉及小明账户余额减少100元,小刚账户余额增加100元的操作,这两个操作是一个不可分割的整体,要么全部执行,要么全部不执行。
小明给小刚转账成功,则如下所示。
小明给小刚转账失败,则如下所示。
不会出现小明账户为100元,小刚账户为200元的情况。
也不会出现小明账户为200元,小刚账户为300元的情况。
线程切换
在并发编程中,往往设置的线程数目会大于CPU数目,而每个CPU在同一时刻只能被一个线程使用。而CPU资源的分配采用了时间片轮转策略,也就是给每个线程分配一个时间片,线程在这个时间片内占用CPU的资源来执行任务。当占用CPU资源的线程执行完任务后,会让出CPU的资源供其他线程运行,这就是任务切换,也叫做线程切换或者线程的上下文切换。
如果大家还是不太理解的话,我们可以用下面的图来模拟线程在CPU中的切换过程。
在图中存在线程A和线程B两个线程,其中线程A和线程B中的每个小方块代表此时线程占有CPU资源并执行任务,这个小方块占有的时间,被称为时间片,在这个时间片中,占有CPU资源的线程会在CPU上执行,未占有CPU资源的线程则不会在CPU上执行。而每个虚线部分就代表了此时的线程不占用CPU资源。CPU会在线程A和线程B之间频繁切换。
原子性问题
理解了什么是原子性,再看什么是原子性问题就比较简单了。
原子性问题是指一个或者多个操作在CPU中执行的过程中出现了被中断的情况。
线程在执行某项操作时,此时如果CPU发生了线程切换,CPU转而去执行其他的任务,中断了当前线程执行的操作,这就会造成原子性问题。
如果你还不能理解的话,我们来举一个例子:假设你在银行排队办理业务,小明在你前面,柜台的业务员为小明办理完业务,正好排到你时,此时银行下班了,柜台的业务员微笑着告诉你:实在不好意思,先生(女士),我们下班了,您明天再来吧!此时的你就好比是正好占有了CPU资源的线程,而柜台的业务员就是那颗发生了线程切换的CPU,她将线程切换到了下班这个线程,执行下班的操作去了。
Java中的原子性问题
在Java中,并发程序是基于多线程技术来编写的,这也会涉及到CPU的对于线程的切换问题,正是CPU中对任务的切换机制,导致了并发编程会出现原子性的诡异问题,而原子性问题,也成为了导致并发问题的第二个“幕后黑手”。
在并发编程中,往往Java语言中一条简单的语句,会对应着CPU中的多条指令,假设我们编写的ThreadTest类的代码如下所示。
package io.mykit.concurrent.lab01; /** * @author binghe * @version 1.0.0 * @description 测试原子性 */ public class ThreadTest { private Long count; public Long getCount(){ return count; } public void incrementCount(){ count++; } }
接下来,我们打开ThreadTest类的class文件所在的目录,在cmd命令行输入如下命令。
javap -c ThreadTest
得出如下的结果信息,如下所示。
d:>javap -c ThreadTest Compiled from "ThreadTest.java" public class io.mykit.concurrent.lab01.ThreadTest { public io.mykit.concurrent.lab01.ThreadTest(); Code: 0: aload_0 1: invokespecial #1 // Method java/lang/Object."<init>":()V 4: return public java.lang.Long getCount(); Code: 0: aload_0 1: getfield #2 // Field count:Ljava/lang/Long; 4: areturn public void incrementCount(); Code: 0: aload_0 1: getfield #2 // Field count:Ljava/lang/Long; 4: astore_1 5: aload_0 6: aload_0 7: getfield #2 // Field count:Ljava/lang/Long; 10: invokevirtual #3 // Method java/lang/Long.longValue:()J 13: lconst_1 14: ladd 15: invokestatic #4 // Method java/lang/Long.valueOf:(J)Ljava/lang/Long; 18: dup_x1 19: putfield #2 // Field count:Ljava/lang/Long; 22: astore_2 23: aload_1 24: pop 25: return }
这里,我们主要关注下incrementCount()方法对应的CPU指令,如下所示。
public void incrementCount(); Code: 0: aload_0 1: getfield #2 // Field count:Ljava/lang/Long; 4: astore_1 5: aload_0 6: aload_0 7: getfield #2 // Field count:Ljava/lang/Long; 10: invokevirtual #3 // Method java/lang/Long.longValue:()J 13: lconst_1 14: ladd 15: invokestatic #4 // Method java/lang/Long.valueOf:(J)Ljava/lang/Long; 18: dup_x1 19: putfield #2 // Field count:Ljava/lang/Long; 22: astore_2 23: aload_1 24: pop 25: return
可以看到,Java语言中短短的几行incrementCount()方法竟然对应着那么多的CPU指令。这些CPU指令我们大致可以分成三步。
- 指令1:把变量count从内存加载的CPU寄存器。
- 指令2:在寄存器中执行count++操作。
- 指令3:将结果写入缓存(可能是CPU缓存,也可能是内存)。
在操作系统执行线程切换时,可能发生在任何一条CPU指令完成后,而不是程序中的某条语句完成后。如果线程A执行完指令1后,操作系统发生了线程切换,当两个线程都执行count++操作后,得到的结果是1而不是2。这里,我们可以使用下图来表示这个过程。
由上图,我们可以看出:线程A将count=0加载到CPU的寄存器后,发生了线程切换。此时内存中的count值仍然为0,线程B将count=0加载到寄存器,执行count++操作,并将count=1写到内存。此时,CPU切换到线程A,执行线程A中的count++操作后,线程A中的count值为1,线程A将count=1写入内存,此时内存中的count值最终为1。
所以,如果在CPU中存在正在执行的线程,恰好此时CPU发生了线程切换,则可能会导致原子性问题,这也是导致并发编程频繁出问题的根源之一。我们只有充分理解并掌握线程的原子性以及引起原子性问题的根源,并在日常工作中时刻注意编写的并发程序是否存在原子性问题,才能更好的编写出并发程序。
总结
缓存带来的可见性问题、线程切换带来的原子性问题和编译优化带来的有序性问题,是导致并发编程频繁出现诡异问题的三个源头,我们已经介绍了缓存带来的可见性问题和线程切换带来的原子性问题。下一篇中,我们继续深耕高并发中的有序性问题。
相关文章
- Spring并发访问的线程安全性问题
- 详解IOS开发应用之并发
- Java并发编程(01):线程的创建方式,状态周期管理
- 第一节: Timer的定时任务的复习、Quartz.Net的入门使用、Aop思想的体现 第十九节: 结合【表达式目录树】来封装EF的BaseDal层的方法 第二十节: 深入理解并发机制以及解决方案(锁机制、EF自有机制、队列模式等) 框架搭建篇 第二十一节:ADO层次上的海量数据处理方案(SqlBulkCopy类插入和更新) 第十四节: 介绍四大并发集合类并结合单例模式下的队列来说明线程
- PV UV QPS 并发数
- 并发集合(六)使用线程安全的NavigableMap
- 并发集合(四)用优先级对使用阻塞线程安全的列表排序
- Java并发编程【1.2时代】
- 并发编程--JAVA线程池实现讲解及使用示例
- 并发编程--LockSupport工具类介绍、线程等待和唤醒的方式对比及使用示例
- 《Java线程与并发编程实践》—— 1.2 操作更高级的线程任务
- 《Java线程与并发编程实践》—— 2.3 谨防活跃性问题
- 小滴课堂并发与多线程相关面试题总结
- 微信高并发资金交易系统设计方案——百亿红包背后的技术支撑
- java并发5-volatile关键字解析
- 《Python编程实战:运用设计模式、并发和程序库创建高质量程序》—— 2.1 适配器模式
- java并发之线程同步(synchronized和锁机制)
- 浅析Java对集合进行操作时报java.util.ConcurrentModificationException并发修改异常问题:产生原因、单线程/多线程环境解决、CopyOnWriteArrayList线程安全的ArrayList、fail-fast快速失败机制防止多线程修改集合造成并发问题
- 并发编程面试题
- 什么是并发控制?并发控制技术的原理,最基本的分锁模式(排他锁,共享锁)
- Java并发编程(十一)线程池的使用
- springmvc在使用@ModelAttribute注解获取Request和Response会产生线程并发不安全问题
- 树莓派获取LAN ip地址并发送到微信
- 高并发可以不加锁吗
- 学习笔记(32):Python网络编程&并发编程-线程queue
- 学习笔记(24):Python网络编程&并发编程-进程与线程的区别
- 学习笔记(23):Python网络编程&并发编程-开启线程的两种方式
- JVM+微服务+多线程+锁+高并发性能
- Java 线程池模拟用户并发请求接口代码示例