zl程序教程

您现在的位置是:首页 >  后端

当前栏目

第29课:彻底解密Spark 1.6.X以前Shuffle中JVM内存使用及配置内幕详情:Spark到底能够缓存多少数据、Shuffle到底占用了多少数据、磁盘的数据远远比内存小却还是报告内存不足?

2023-09-27 14:26:48 时间

第29课:彻底解密Spark 1.6.X以前Shuffle中JVM内存使用及配置内幕详情:Spark到底能够缓存多少数据、Shuffle到底占用了多少数据、磁盘的数据远远比内存小却还是报告内存不足?

本文根据家林大神系列课程编写 http://weibo.com/ilovepains


1 JVM内存使用架构剖析
2 Spark集群在1.6.x以前中JVM到底可以缓存多少数据?
3 spark集群在1.6.x以前中shuffle JVM到底缓存多少数据?
4 spark on yarn实际计算对内存的使用案例
5 spark1.6.x以前shufflejvm使用配置


1 JVM内存使用架构剖析

JVM 有很多不同的区,最开始的时候,它会通过类装载器把类加载进来,在运行期数据区中有 "本地方法栈","程序计数器","Java 栈"、"Java 堆"和"方法区"以及本地方法接口和它的本地库。从 Spark 的角度来谈代码的运行和数据的处理,主要是谈 Java 堆 (Heap) 空间的运用。 JVM的体现架构:
  • 本地方法栈:这个是在迭归的时候肯定是至关重要的;
  • <