JavaSE高级:JVM重点内容探究
目录
1.JVM的位置
2.JVM的体系结构
详细图解
重点图解
3.类加载器
作用:加载Class文件
一个类的引用(名字)在栈里面,实例在堆里面
类的class只有一个,而实例可以有很多个
1.虚拟机自带的加载器
2.启动类(根)加载器
3.扩展类加载器
4.应用程序加载器
5.百度:双亲委派机制
4. 双亲委派机制
双亲委派机制:安全
1. APP–>EXC—B0OT(最终执行)
B0OT
EXC
APP
- 1.类加载器收到类加载的请求
- 2.将这个请求向上委托给父类加载器去完成,依次向上委托,直到启动类加载器
- 3.启动加载器检查是否能够加载当前这个类,能加载就结束, 使用当前的加载器,否则, 抛出异常,通知子加载器进行加载
- 4.重复步骤3
Class Not Found异常就是这么来的
这里的null 可能是我调用不到或者不存在
Java早期的名字:C+±-
Java = C++:去掉繁琐的东西,指针,内存管理~
双亲委派模型的工作流程是:如果一个类加载器收到了类加载的请求,它首先不会自己去尝试加载这个类,而是把请求委托给父加载器去完成,依次向上,因此,所有的类加载请求最终都应该被传递到顶层的启动类加载器中,
只有当父加载器在它的搜索范围中没有找到所需的类时,即无法完成该加载,子加载器才会尝试自己去加载该类。
双亲委派机制:
- 1、当AppClassLoader加载一个class时,它首先不会自己去尝试加载这个类,而是把类加载请求委派给父类加载器ExtClassLoader去完成。
- 2、当ExtClassLoader加载一个class时,它首先也不会自己去尝试加载这个类,而是把类加载请求委派给BootStrap ClassLoader去完成。
- 3、如果BootStrap ClassLoader加载失败(例如在$JAVA_HOME/jre/lib里未查找到该class),会使用ExtClassLoader来尝试加载;
- 4、若ExtClassLoader也加载失败,则会使用AppClassLoader来加载,如果AppClassLoader也加载失败,则会报出异常ClassNotFoundException。
双亲委派模型意义:
- -系统类防止内存中出现多份同样的字节码
- -保证Java程序安全稳定运行
5.沙箱安全机制
Java安全模型的核心就是Java沙箱(sandbox) ,
什么是沙箱?沙箱是一个限制程序运行的环境。沙箱机制就是将Java代码限定在虚拟机(JVM)特定的运行范围中,并且严格限制代码对本地系统资源访问,通过这样的措施来保证对代码的有效隔离,防止对本地系统造成破坏。
沙箱主要限制系统资源访问,那系统资源包括什么? CPU、内存、文件系统、网络。不同级别的沙箱对这些资源访问的限制也可以不一样。
所有的Java程序运行都可以指定沙箱,可以定制安全策略。
在Java中将执行程序分成本地代码和远程代码两种,本地代码默认视为可信任的,而远程代码则被看作是不受信的。对于授信的本地代码,可以访问一切本地资源。而对于非授信的远程代码在早期的Java实现中,安全依赖于沙箱Sandbox)机制。如下图所示JDK1.0安全模型
![](https://img-blog.csdnimg.cn/a2b00929d5bb4bc98b930d4040523e06.png)
但如此严格的安全机制也给程序的功能扩展带来障碍,比如当用户希望远程代码访问本地系统的文件时候,就无法实现。因此在后续的Java1.1版本中,针对安全机制做了改进,增加了安全策略,允许用户指定代码对本地资源的访问权限。如下图所示JDK1.1安全模型
![](https://img-blog.csdnimg.cn/bdea4c94575240ed8b64aac990d057a6.png)
在Java1.2版本中,再次改进了安全机制,增加了代码签名。不论本地代码或是远程代码,都会按照用户的安全策略设定,由类加载器加载到虚拟机中权限不同的运行空间,来实现差异化的代码执行权限控制。如下图所示
![](https://img-blog.csdnimg.cn/a3e8f1312d7c46d1b83a9d71e7d5ac69.png)
当前最新的安全机制实现,则引入了域(Domain)的概念。虚拟机会把所有代码加载到不同的系统域和应用域,系统域部分专门负责与关键资源进行交互,而各个应用域部分则通过系统域的部分代理来对各种需要的资源进行访问。虚拟机中不同的受保护域(Protected Domain),对应不一样的权限(Permission)。存在于不同域中的类文件就具有了当前域的全部权限,如下图所示最新的安全模型(jdk 1.6)
![](https://img-blog.csdnimg.cn/b607fe9353b64eedb19503ad6f77918c.png)
组成沙箱的基本组件
- 字节码校验器(bytecode verifier) :确保Java类文件遵循Java语言规范。这样可以帮助Java程序实现内存保护。但并不是所有的类文件都会经过字节码校验,比如核心类。
- 类裝载器(class loader) :其中类装载器在3个方面对Java沙箱起作用
- 它防止恶意代码去干涉善意的代码; 双亲委派机制
- 它守护了被信任的类库边界; 双亲委派机制
- 它将代码归入保护域,确定了代码可以进行哪些操作。 沙盒安全机制
虚拟机为不同的类加载器载入的类提供不同的命名空间,命名空间由一系列唯一的名称组成, 每一个被装载的类将有一个名字,这个命名空间是由Java虚拟机为每一个类装载器维护的,它们互相之间甚至不可见。
类装载器采用的机制是双亲委派模式。
1.从最内层JVM自带类加载器开始加载,外层恶意同名类得不到加载从而无法使用;
2.由于严格通过包来区分了访问域,外层恶意的类通过内置代码也无法获得权限访问到内层类,破坏代码就自然无法生效。
- 存取控制器(access controller) :存取控制器可以控制核心API对操作系统的存取权限,而这个控制的策略设定,可以由用户指定。
- 安全管理器(security manager) : 是核心API和操作系统之间的主要接口。实现权限控制,比存取控制器优先级高。
- 安全软件包(security package) : java.security下的类和扩展包下的类,允许用户为自己的应用增加新的安全特性,包括:
- 安全提供者
- 消息摘要
- 数字签名
- 加密
- 鉴别
6.Native
- native :凡是带了native关键字的,说明java的作用范围达不到了,回去调用底层c语言的库!
- 凡是带有native会进入本地方法栈,本地方法栈调用本地方法本地接口 JNI (Java Native Interface)
- JNI作用:扩展Java的使用,融合不同的编程语言为Java所用!最初想融合: C、C++
- Java诞生的时候C、C++横行,想要立足,必须要有调用C、C++的程序
- 它在内存区域中专门开辟了一块标记区域: Native Method Stack,登记native方法
- 在最终执行的时候,通过JNI加载本地方法库中的方法
- 例如:Java程序驱动打印机,管理系统,掌握即可,在企业级应用比较少
- private native void start0();
- //调用其他语言接口可以使用:Socket. . WebService~. .http~
Native Method Stack
它的具体做法是Native Method Stack中登记native方法,在( Execution Engine )执行引擎执行的时候加载Native Libraies。[本地库]
Native Interface本地接口
本地接口的作用是融合不同的编程语言为Java所用,它的初衷是融合C/C++程序, Java在诞生的时候是C/C++横行的时候,想要立足,必须有调用C、C++的程序,于是就在内存中专门开辟了块区域处理标记为native的代码,它的具体做法是在Native Method Stack 中登记native方法,在( Execution Engine )执行引擎执行的时候加载Native Libraies。
目前该方法使用的越来越少了,除非是与硬件有关的应用,比如通过Java程序驱动打印机或者Java系统管理生产设备,在企业级应用中已经比较少见。因为现在的异构领域间通信很发达,比如可以使用Socket通信,也可以使用Web Service等等,不多做介绍!
7.PC寄存器
程序计数器: Program Counter Register
每个线程都有一个程序计数器,是线程私有的,就是一个指针, 指向方法区中的方法字节码(用来存储指向像一条指令的地址, 也即将要执行的指令代码),在执行引擎读取下一条指令, 是一个非常小的内存空间,几乎可以忽略不计
8.方法区 Method Area
方法区是被所有线程共享,所有字段和方法字节码,以及一些特殊方法,如构造函数,接口代码也在此定义,简单说,所有定义的方法的信息都保存在该区域,此区域属于共享区间;
静态变量、常量、类信息(构造方法、接口定义)、运行时的常量池存在方法区中,但是实例变量存在堆内存中,和方法区无关
9.栈
栈:先进后出
桶:后进先出
队列:先进先出( FIFO : First Input First Output )
栈:栈内存,主管程序的运行,生命周期和线程同步;
为什么main方法先执行,最后结束?
递归栈溢出的问题?
栈内存中:
8大基本类型+对象引用+实例的方法
栈运行原理:栈帧
栈满了: StackOverflowError
10.三种JVM
- Sun公司HotSpot Java Hotspot™ 64-Bit Server VM (build 25.181-b13,mixed mode)
- BEA JRockit
- IBM J9VM
11.堆
Heap, 一个JVM只有一个堆内存,堆内存的大小是可以调节的。
类加载器读取了类文件后,一般会把什么东西放到堆中?
类, 方法,常量,变量~,保存我们所有引用类型的真实对象;
堆内存中还要细分为三个区域:
- 新生区(伊甸园区) Young/New
- 养老区old
- 永久区Perm
GC垃圾回收,主要是在伊甸园区和养老区~
假设堆内存满了,OOM,堆内存不够! java.lang.OutOfMemoryError:Java heap space
永久存储区里存放的都是Java自带的 例如lang包中的类 如果不存在这些,Java就跑不起来了
在JDK8以后,永久存储区改了个名字(元空间)
12.新生区-老年区
新生区
- 类:诞生和成长的地方,甚至死亡;
- 伊甸园,所有的对象都是在伊甸园区new出来的!
- 幸存者区(0、1)
真理:经过研究,99%的对象都是临时对象!
13.永久区
这个区域常驻内存的。用来存放JDK自身携带的Class对象。Interface元数据,存储的是Java运行时的一些环境~ 这个区域不存在垃圾回收,关闭虚拟机就会释放内存
一个启动类,加载了大量的第三方jar包。Tomcat部署 了太多的应用,大量动态生成的反射类。不断的被加载。直到内存满,就会出现OOM;
- jdk1.6之前:永久代,常量池是在方法区;
- jdk1.7:永久代,但是慢慢的退化了,去永久代,常量池在堆中
- jdk1.8之后:无永久代,常量池在元空间
元空间:逻辑上存在,物理上不存在 (因为存储在本地磁盘内) 所以最后并不算在JVM虚拟机内存中
14.堆内存调优
堆的内存大小
public class Demo01 {
public static void main(String[] args) {
//返回虚拟机试图使用的最大内存
long maxMemory = Runtime.getRuntime().maxMemory();
//返回jvm的初始化总内存
long totalMemory = Runtime.getRuntime().totalMemory();
System.out.println("max"+maxMemory+"字节\t"+(maxMemory/(double)1024/1024)+"MB");
System.out.println("total"+totalMemory+"字节\t"+(totalMemory/(double)1024/1024)+"MB");
//默认情况下:分配的总内存是电脑内存的1/4,而初始化内存:1/64
}
}
扩大堆内存
PSyoungGen:新生区+ParOldGen:老年区
305664K+699392K=1005056K=951.5MB
Metaspace:永久区4496K
发现根本不在堆中,新生区+老年区的空间已经占满堆的空间了
测试OOM错误
测试:
public class Demo {
public static void main(String[] args) {
String s = "";
while (true) {
s += s + new Random().nextInt(666666666) + new Random().nextInt(666666666)
+ new Random().nextInt(666666666) + new Random().nextInt(666666666)
+ new Random().nextInt(666666666) + new Random().nextInt(666666666);
}
}
}
启动测试
先走的轻GC,幸存区满了,走了一下重GC,还存活的放到老年区里面,然后继续轻GC然后重GC,直到重GC走过后,养老区的区域也满了就会报OOM错误
1.尝试扩大堆内存看结果
2.分析内存,内存查看哪个地方出现了问题然后解决
在一个项目中,突然出现了OOM故障,那么该如何排除 研究为什么出错~
- 能够看到代码第几行出错的内存快照分析工具:MAT, Jprofiler
- Dubug, 一行行分析代码!
MAT, Jprofiler作用
- 分析Dump内存文件,快速定位内存泄露;
- 获得堆中的数据
- 获得大的对象~
MAT是eclipse集成使用 在这里不学
Jprofile使用
- 1.在idea中下载jprofile插件
- 2.去jprofile官网下载jprofile客户端
jprofile官网:https://www.ej-technologies.com/products/jprofiler/overview.html
这里下载9.2版本的,新版本需要自行找许可证码,这里就用旧版本的了,因为许可证好找
许可证:L-Larry_Lau@163.com#23874-hrwpdp1sh1wrn#0620
在查看idea就多了一个标志
3.配置idea
- 4.在idea中VM参数中写参数 -Xms1m -Xmx8m -XX:+HeapDumpOnOutOfMemoryError
- 5.运行程序后生成了一个文件与src同级
- 6.双击打开文件即可
命令参数详解
-Xms设置初始化内存分配大小1/64
-Xmx设置最大分配内存,默以1/4
-XX: +PrintGCDetails 打印GC垃圾回收信息
-XX: +HeapDumpOnOutOfMemoryError OOM DUMP内存文件
15. GC
JVM在进行GC时,并不是对这三个区域统一回收。 大部分时候,回收都是新生代~
- 新生代
- 幸存区(form,to)
- 老年区
GC两种类:轻GC (普通的GC), 重GC (全局GC)
GC常见面试题目:
- JVM的内存模型和分区~详细到每个区放什么?
- 堆里面的分区有哪些?
Eden, form, to, 老年区,说说他们的特点!
- GC的算法有哪些?
标记清除法、标记整理(压缩)法、复制算法、引用计数法
- 轻GC和重GC分别在什么时候发生?
轻GC在伊甸(新生)区满了的时候会触发清理之后,进入幸存区(0(from、to)、1(from、to))
幸存区和伊甸区都满了就触发重GC进行清理,然后存活的进入养老(老年)区
16.常用GC算法
引用计数法
统计对象被引用的次数,如果被引用了,计数器就+1,如果计数器为0就是没有被引用就会被回收
缺点:
- 1.每次对对象赋值时均要维护引用计数器,且计数器本身也有一定的消耗 ;
- 2.较难处理循环引用
复制算法
优点:没有内存的碎片~
缺点:
- 1.浪费了内存空间~ :多了一半空间永远是空to。
- 2.假设对象100%存活(极端情况),那么我们需要将所有对象都复制一遍,并将所有引用地址重置一遍。复制这一工作所花费的时间,在对象存活率达到一定程度时,将会变的不可忽视。 所以从以上描述不难看出,复制算法要想使用,最起码对象的存活率要非常低
复制算法最佳使用场景:对象存活度较低的时候;新生区~
标记清除法
缺点:
- 1.首先,它的缺点就是效率比较低(递归与全堆对象遍历),而且在进行GC的时候,需要停止应用程序,这会导致用户体验非常差劲
- 2.其次,主要的缺点则是这种方式清理出来的空闲内存是不连续的(内存碎片),这点不难理解,我们的死亡对象都是随即的出现在内存的各个角落的,现在把它们清除之后,内存的布局自然会乱七八糟。而为了应付这一点,JVM就不得不维持一个内存的空闲列表,这又是一种开销。而且在分配数组对象的时候,寻找连续的内存空间会不太好找。
优点:
- 不需要双倍的内存空间。
标记压缩法
清除之后需要在
标记清除压缩算法
总结
内存效率:复制算法>标记清除算法>标记压缩算法
内存整齐度:复制算法=标记压缩算法>标记清除算法
内存利用率:标记压缩算法>标记清除算法>复制算法
可以看出,效率上来说,复制算法是当之无愧的老大,但是却浪费了太多内存,而为了尽量兼顾上面所提到的三个指标,标记/整理算法相对来说更平滑一些,但效率上依然不尽如人意,它比复制算法多了一个标记的阶段,又比标记/清除多了一个整理内存的过程。
所以针对不同的垃圾回收的算法的不同的特点,所以针对jvm堆中不同的区采用不同的算法,即分代收集算法。
年轻代:
- 存活率低:复制算法
老年代:
- 区域大存活率高:标记清除(产生内存碎片)+标记压缩 混合实现。当内存随便不多的时候可以继续标记清除,比较多的时候就进行一次标记压缩
17.JMM
- 1.什么是JMM?
JMM: (ava Memory Model的缩写),JAVA内存模型,不存在的东西,是一个概念,也是一个约定!
- 2.它干嘛的?
作用:缓存一致性协议,用于定义数据读写的规则(遵守,找到这个规则)。
JMM定义了线程工作内存和主内存之间的抽象关系:线程之间的共享变量存储在主内存(Main Memory)中,每个线程都有一个私有的本地内存 (Local Memory)
解决共享对象可见性:voliate
voliate:
- 1.保证可见性
- 2.不保证原子性
- 3.禁止指令重排
JMM给了相应的规定:
- 不允许read和load、store和write操作之一单独出现。即使用了read必须load,使用了store必须write
- 不允许线程丢弃他最近的assign操作,即工作变量的数据改变了之后,必须告知主存
- 不允许一个线程将没有assign的数据从工作内存同步回主内存
- 一个新的变量必须在主内存中诞生,不允许工作内存直接使用一个未被初始化的变量。就是对变量实施use、store操作之前,必须经过assign和load操作
- 一个变量同一时间只有一个线程能对其进行lock。多次lock后,必须执行相同次数的unlock才能解锁
- 如果对一个变量进行lock操作,会清空所有工作内存中此变量的值,在执行引擎使用这个变量前,必须重新load或assign操作初始化变量的值
- 如果一个变量没有被lock,就不能对其进行unlock操作。也不能unlock一个被其他线程锁住的变量
- 对一个变量进行unlock操作之前,必须把此变量同步回主内存