jvm探究

常见面试题

  • 请你谈谈你对jvm的理解?
  • 什么是内存溢出OOM,什么是栈溢出StackOverFlowError
  • JVM常用调优参数有哪些
  • 内存快照如何抓取,怎么分析Dump文件
  • 谈谈JVM类加载器的认识

需要掌握

1、jvm的位置

​ 操作系统之上

2、jvm的体系结构

image-20220720234941169

  • jvm调优99%的情况下都是在调堆和方法区

3、类加载器

​ 作用:加载class文件~

image-20220721002353062

image-20220721002437456

​ 类加载器种类

  1. 虚拟机自带的加载器
  2. 启动类(根)加载器 BootstrapClassLoader
    • c++编写,加载java核心库 java.*,构造ExtClassLoaderAppClassLoader。由于引导类加载器涉及到虚拟机本地实现细节,开发者无法直接获取到启动类加载器的引用,所以不允许直接通过引用进行操作
  3. 扩展类加载器 ExtClassLoader
    • java编写,加载扩展库,如classpath中的jrejavax.*或者 java.ext.dir` 指定位置中的类,开发者可以直接使用标准扩展类加载器。
  4. 应用程序加载器 AppClassLoader

4、双亲委派机制

  1. 类加载器收到类加载的请求
  2. 将这个请求向上委托给父类加载加载器区完成,一直向上委托,直到启动类加载器
  3. 启动类加载器检查是否能够加载当前这个类,能加载就结束,使用当前的加载器,通知子类进行加载
  4. 重复步骤3

作用:

1、防止重复加载同一个.class。通过委托去向上面问一问,加载过了,就不用再加载一遍。保证数据安全。
2、保证核心.class不能被篡改。通过委托方式,不会去篡改核心.class,即使篡改也不会去加载,即使加载也不会是同一个.class对象了。不同的加载器加载同一个.class也不是同一个Class对象。这样保证了Class执行安全。

5、沙箱安全机制

Java安全模型的核心就是Java沙箱(sandbox) ,

 什么是沙箱?沙箱是一个限制程序运行的环境。沙箱机制就是**将Java代码限定在虚拟机(JVM)特定的运行范围中,并且严格限制代码对本地系统资源访问**,通过这样的措施来保证对代码的有效隔离,防止对本地系统造成破坏。

在Java中将执行程序分成本地代码和远程代码两种,本地代码默认视为可信任的,而远程代码则被看作是不受信的。对于授信的本地代码,可以访问一切本地资源。而对于非授信的远程代码在早期的Java实现中,安全依赖于沙箱Sandbox)机制。如下图所示JDK1.0安全模型

组成沙箱的基本组件

  • 字节码校验器(bytecode verifier) :确保Java类文件遵循Java语言规范。这样可以帮助Java程序实现内存保护。但并不是所有的类文件都会经过字节码校验,比如核心类。

  • 类裝载器(class loader) :其中类装载器在3个方面对Java沙箱起作用

    • 它防止恶意代码去干涉善意的代码;
    • 它守护了被信任的类库边界
    • 它将代码归入保护域,确定了代码可以进行哪些操作

     虚拟机为不同的类加载器载入的类提供不同的命名空间,命名空间由一系列唯一的名称组成, 每一个被装载的类将有一个名字,这个命名空间是由Java虚拟机为每一个类装载器维护的,它们互相之间甚至不可见。

    类装载器采用的机制是双亲委派模式。

     1.从最内层JVM自带类加载器开始加载,外层恶意同名类得不到加载从而无法使用;
     2.由于严格通过包来区分了访问域,外层恶意的类通过内置代码也无法获得权限访问到内层类,破坏代码就自然无法生效。

  • 存取控制器(access controller) :存取控制器可以控制核心API对操作系统的存取权限,而这个控制的策略设定,可以由用户指定。

  • 安全管理器(security manager) : 是核心API和操作系统之间的主要接口。实现权限控制,比存取控制器优先级高。

  • 安全软件包(security package) : java.security下的类和扩展包下的类,允许用户为自己的应用增加新的安全特性,包括:

    • 安全提供者
    • 消息摘要
    • 数字签名
    • 加密
    • 鉴别

6、Native

1
2
3
4
5
6
7
native:凡是带了native关键字的,说明java的作用范围达不到了,会去调用底层c的库
会进入本地方法栈-调用本地方法接口 JNI (java native interface)
JNI的作用:扩展Java的使用,融合不同的语言为java所用 最初 c c++
java诞生的时候c,c++横行,想要立足必须调用c c++的程序
java在内存中开辟了一块标记区域:Native Method Stack 登记native方法
在最终执行的时候,加载本地方法库中方法通过JNI
在企业级应用中少见

7、PC寄存器

程序计数器: Program Counter Register
 每个线程都有一个程序计数器,是线程私有的,就是一个指针, 指向方法区中的方法字节码(用来存储指向像一条指令的地址, 也即将要执行的指令代码),在执行引擎读取下一条指令, 是一个非常小的内存空间,几乎可以忽略不计

8、方法区

方法区是被所有线程共享,所有字段和方法字节码,以及一些特殊方法,如构造函数,接口代码也在此定义,简单说,所有定义的方法的信息都保存在该区域,此区域属于共享区间;
静态变量、常量、类信息(构造方法、接口定义)、运行时的常量池存在方法区中,但是实例变量存在堆内存中,和方法区无关

image-20220721153627624

9、栈

数据结构

程序 = 数据结构+算法 :持续学习

程序 = 框架+业务逻辑:吃饭

栈:栈内存,主管程序的运行,生命周期和线程同步;
线程结束,栈内存也就是释放,对于栈来说,不存在垃圾回收问题

栈:8大基本类型(形参,局部变量)+对象的引用+实例的方法

栈运行原理:栈帧

image-20220721160022852

对象实例化内存模型图

img

10、jdk1.8内存模型

jvm内存模型

image-20220721162351569

img

java8中,==运行时常量池在元空间中,字符串常量池在堆中==

Java堆是被所有线程共享的一块内存区域,在虚拟机启动时创建。此内存区域的唯一目的就是存放对象实例,几乎所有的对象实例都在这里分配内存。

永久区和元空间都是对方法区的一种实现,因为永久区的实现容易产生OOM,所以放到了实际的本地内存用永久区实现,内存那么大,就不容易OOM了 (堆内存满了)

Java堆是垃圾收集器管理的主要区域,收集器主要使用分代收集算法,所以Java堆中还可以细分为:新生代和老年代;(Eden空间、From Survivor空间、To Survivor空间等)分配缓冲区。

java虚拟机栈

image-20220721162512936

元数据区(方法区)

它主要存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。

常量池

img

JDK8常量池整理

11、三种Jvm

  • Sun公司 HotSpot Java HotSpot(TM) 64-Bit Server VM (build 25.131-b11, mixed mode)

  • BEA JRockit

  • IBM J9 VM

12、堆

Heap,一个jvm只有一个堆内存,堆内存的大小是可以调节的

类记载器读取了类文件后,一般会把什么东西放到堆中?类的实例,方法常量

堆内存还要细分三个区域

  • 新生区
  • 养老区
  • 永久区
image-20220721172542128

GC垃圾回收,主要是在伊甸园区和养老区~
假设内存满了,OOM,堆内存不够! ==java.lang.OutOfMemoryError:Java heap space==
永久存储区里存放的都是Java自带的 例如lang包中的类 如果不存在这些,Java就跑不起来了
在JDK8以后,永久存储区改了个名字(元空间)

新生区

  • 类:诞生和成长的地方,甚至死亡
  • 伊甸园(Eden space),所有对象都是在伊甸园区new出来的
  • 幸存者区(0,1)

image-20220721173613555

理解:

假设伊甸园区只能存放10个对象 ,此时已经new了10个对象,这时已经满了,此时会触发轻GC将伊甸园存活的对象移入到幸村区

存在引用的对象会存活下来,活下来的对象会存入到幸存0区,在此过程中会幸存0区和幸存1区会不断交换位置。假设经历10次循环以后,伊甸园区,幸存0区和幸存1区都满了,此时会触发一次重GC,将能活下来的对象移入养老区

如果新生的对象无法在 Eden 区创建(Eden 区无法容纳) 就会触发一次Young GC,此时会将 S0 区与Eden 区的对象一起进行可达性分析,找出活跃的对象将它复制到 S1 区并且将S0区域和 Eden 区的对象给清空,这样那些不可达的对象进行清除,并且将S0 区 和 S1区交换。

对象在伊甸园放不下将会执行一次轻GC,清理幸存区直到能放下对象,如果幸存区清理不出来,任然放不下对象,则会发生重GC,将清理幸存者区并且将幸存区存活下来的对象移到养老区,

  • 伊甸园满了就触发轻GC,经过轻GC存活下来的就到了幸存者区(0和1相互交替)age++,当幸存者区age>=15时,则进入老年区;老年区满了触发重GC,如果触发后还放不下,就OOM。

  • 真理:经过研究,99%的对象都是临时对象!

  • 年轻代空间(包括 Eden 和 Survivor 区域)回收内存被称为 Minor GC,对老年代GC称为Major GC,而Full GC是对整个堆来说的

  1. 新生代 GC (Minor GC):发生在新生代的垃圾回收动作,频繁,速度快。此时如果新生的对象无法在 Eden 区创建(Eden 区无法容纳) 就会触发一次Young GC,此时会将 S0 区与Eden 区的对象一起进行可达性分析,找出活跃的对象,将它复制到 S1 区并且将S0区域和 Eden 区的对象给清空,这样那些不可达的对象进行清除,并且将S0 区 和 S1区交换。
    没进行一次MinorGC,就age++,当age>=15时就会进入老年区。
    Q:为啥会有两个 Survivor 区?
    A: 因为假设设想一下只有一个 Survibor 区 那么就无法实现对于 S0 区的垃圾收集,以及分代年龄的提升。
    MajorGC和FullGC

  2. 老年代 GC (Major GC):发生在老年代的GC ,基本上发生了一次Major GC 就会发生一次 Minor GC。并且Major GC 的速度往往会比 Minor GC 慢 10 倍。
    Q:什么时候会触发?

    1. 对于一个大对象,我们会首先在Eden 尝试创建,如果创建不了,就会触发Minor GC
    2. 随后继续尝试在Eden区存放,发现仍然放不下
    3. 尝试直接进入老年代,老年代也放不下
    4. 触发 Major GC 清理老年代的空间
    5. 放的下 成功
    6. 放不下 OOM
  • 什么时候会调用FULL GC
    1. System.gc()方法的调用
    2. 老年代空间不足
    3. 永生区空间不足
    4. 堆中分配很大的对象

永久区

用与存放JDK自身携带的Class对象,Interface元数据,存储的是java运行时的一些环境下·或类信息,这个区域不存在垃圾回收

关闭vm虚拟就会释放这个区域的内存

一个启动类,加载了大量的第三方jar包;Tomcat部署了太多的应用;大量动态生成的反射类,不断地被加载直到内存满就会出现OOM

1、JDK1.7之前版本运行时常量池包含字符串常量池位于方法区。
2、JDK1.7版本字符串常量池位置从方法区搬到了堆中; 运行时常量池还在方法区。
3、JDK1.8hotspot永久代被元空间(Metaspace)取代, 字符串常量池位置还在堆中, 运行时常量池位置变成了元空间(Metaspace)。

4、java中常量池再理解 Java中的常量池(字符串常量池、class常量池和运行时常量池)_zhuminChosen的博客-CSDN博客_java常量池在哪](https://blog.csdn.net/zm13007310400/article/details/77534349))

5、JVM的方法区和永久带是什么关系?

​ 方法区是规范层面的东西,规定了这一个区域要存放哪些东西
​ 永久带或者是metaspace是对方法区的不同实现,是实现层面的东西。
​ 永久带里面存的东西基本上就是方法区规定的那些东西。
​ 可以说,永久带是方法区的一种实现(奥迪和汽车的关系),当然,在hotspot jdk8中metaspace元空间可以看成是方法区的一种实现

image-20220723155424104

总结:

  • 元空间:逻辑上存在,物理上不存在 (因为存储在本地磁盘内) 所以最后并不算在JVM虚拟机内存中(有的说元空间在本地内存,不在JVM内存)
  • 默认情况下:指定最大分配内存,通常是物理内存的1/4,初始分配的总堆内存,通常是物理内存的1/64
  • OOM
    首先HeapDumpOnOutOfMemoryError分析内存,看一下哪个地方出了问题,确定是内存泄漏还是内存溢出,内存溢出才会尝试扩大堆内存看结果(//-Xms1024m -Xmx1024m -XX:+PrintGCDetails)

13、堆内存调优

在一个项目中,突然出现了OOM故障,那么该如何排除,研究为什么出错

  • 能够看到代码第几行出错:内存快照分析工具,MAT,Jprofiler
  • Debug,一行行分析代码

MAT,Jprofiler作用

  • 分析dump内存文件,快速定位内存泄漏

  • 获得堆中数据

  • 获得大的对象

  • ….

Jprofiler的使用

在idea中安装Jprofiler插件

安装Jprofiler客户端

在idea中指定Jprofiler客户端程序

在idea中配置 vm options

-Xms1m -Xmx8m -XX:+HeapDumpOnOutOfMemoryError

执行main方法后会产生一个dump文件

-Xms1024m -Xmx1024m -XX:+PrintGCDetails

总结

1
2
3
4
5
6
7
-Xms1m -Xmx8m -XX:+HeapDumpOnOutOfMemoryError 
-Xms1024m -Xmx1024m -XX:+PrintGCDetails

-Xms 设置初始化分配内存大小
-Xmx 设置最大分配内存
-XX:+PrintGCDetails 打印GC垃圾回收信息
-XX:+HeapDumpOnOutOfMemoryError 输出OOM dump文件

14、GC垃圾回收

image-20220723170124791

JVM在进行GC时,并不是对这三个区域统一回收,回收都是在新生代

  • 新生区
  • 幸存区(0,1)
  • 老年区

GC种类:轻GC,重GC(全局GC)

常见面试题

  • JVM内存模型和分区,详细到每个区放什么

  • 堆里面的分区有哪些?说说他们的特点

  • GC算法有哪些?标记清除法,标记整理法,复制算法,分代收集法,怎么用的

  • 轻GC和重GC分别在什么时候发生

15、GC-常用算法

image-20220723173542353

​ 复制算法大致图

image-20220723173851901

​ 复制算法图解

  • 好处:没有内存的碎片~
  • 坏处:浪费了内存空间~ :多了一半空间永远是空to。假设对象100%存活(极端情况)
    复制算法最佳使用场景:对象存活度较低的时候;新生区~

没有最好的算法,只有最合适的算法

年轻代

  • 存活率低
  • 复制算法

老年代

  • 区域大:存活率高
  • 标记清除(内存碎片不是太多)+标记压缩混合实现