JVM优化

  • Post author:
  • Post category:其他




第1章 JVM回顾



1 什么是JVM

JVM是Java Virtual Machine(Java虚拟机)的缩写,JVM是一种用于计算设备的规范,它是一个虚构出来的计算机,是通过在实际的计算机上仿真模拟各种计算机功能来实现的。

虚拟机名称 介绍
HotSpot Oracle/Sun JDK和OpenJDK都使用HotSPot VM的相同核心
J9 J9是IBM开发的高度模块化的JVM
JRockit JRockit 与 HotSpot 同属于 Oracle,目前为止 Oracle 一直在推进 HotSpot 与 JRockit 两款各有优势的虚拟机进行融合互补
Zing 由Azul Systems根据HostPot为基础改进的高性能低延迟的JVM
Dalvik Android上的Dalvik 虽然名字不叫JVM,但骨子里就是不折不扣的JVM



2 JVM与操作系统

Java 是一门抽象程度特别高的语言,提供了自动内存管理等一系列的特性。这些特性直接在操作系统上实现是不太可能的,所以就需要 JVM 进行一番转换。

在这里插入图片描述

在这里插入图片描述

从图中可以看到,有了 JVM 这个抽象层之后,Java 就可以实现跨平台了。JVM 只需要保证能够正确执行 .class 文 件,就可以运行在诸如 Linux、Windows、MacOS 等平台上了。

而 Java 跨平台的意义在于一次编译,处处运行,能够做到这一点 JVM 功不可没。比如我们在 Maven 仓库下载同一 版本的 jar 包就可以到处运行,不需要在每个平台上再编译一次。

现在的一些 JVM 的扩展语言,比如 Clojure、JRuby、Groovy 等,编译到最后都是 .class 文件,Java 语言的维护者,只需要控制好 JVM 这个解析器,就可以将这些扩展语言无缝的运行在 JVM 之上了。

在这里插入图片描述



3 JVM、JRE、JDK 的关系

在这里插入图片描述

JVM 是 Java 程序能够运行的核心。但是需要注意,JVM 自己什么也干不了,你需要给它提供生产原料(.class 文件) 。

仅仅是 JVM,是无法完成一次编译,处处运行的。它需要一个基本的类库,比如怎么操作文件、怎么连接网络等。 而 Java 体系很慷慨,会一次性将 JVM 运行所需的类库都传递给它。JVM 标准加上实现的一大堆基础类库,就组成 了 Java 的运行时环境,也就是我们常说的 JRE(Java Runtime Environment)

对于 JDK 来说,就更庞大了一些。除了JRE,JDK 还提供了一些非常好用的小工具,比如 javac、java、jar 等。它是 Java 开发的核心。

我们也可以看下 JDK 的全拼,Java Development Kit。JVM、JRE、JDK 它们三者之间的关系,可以用一个包含关系表示。

在这里插入图片描述



4 Java虚拟机规范和 Java 语言规范的关系

在这里插入图片描述

左半部分是 Java 虚拟机规范,其实就是为输入和执行字节码提供一个运行环境。右半部分是我们常说的 Java 语法 规范,比如 switch、for、泛型、lambda 等相关的程序,最终都会编译成字节码。而连接左右两部分的桥梁依然是 Java 的字节码。

如果 .class 文件的规格是不变的,这两部分是可以独立进行优化的。但 Java 也会偶尔扩充一下 .class 文件的格式, 增加一些字节码指令,以便支持更多的特性。

我们可以把 Java 虚拟机可以看作是一台抽象的计算机,它有自己的指令集以及各种运行时内存区域,学过《计算 机组成结构》的同学会在课程的后面看到非常多的相似性。

最后,我们简单看一下一个 Java 程序的执行过程,它到底是如何运行起来的。

在这里插入图片描述

这里的 Java 程序是文本格式的。比如下面这段 HelloWorld.java,它遵循的就是 Java 语言规范。其中,我们调用了 System.out 等模块,也就是 JRE 里提供的类库。

 public class HelloWorld {
    public static void main(String[] args) {
		System.out.println("Hello World");
	}
}

使用 JDK 的工具 javac 进行编译后,会产生 HelloWorld 的字节码。

我们一直在说 Java 字节码是沟通 JVM 与 Java 程序的桥梁,下面使用 javap 来稍微看一下字节码到底长什么样子。

在这里插入图片描述

Java 虚拟机采用基于栈的架构,其指令由操作码和操作数组成。这些

字节码指令

,就叫作 opcode。其中, getstatic、ldc、invokevirtual、return 等,就是 opcode,可以看到是比较容易理解的。

JVM 就是靠解析这些 opcode 和操作数来完成程序的执行的。当我们使用 Java 命令运行 .class 文件的时候,实际上就相当于启动了一个 JVM 进程。然后 JVM 会翻译这些字节码,它有两种执行方式。

  • 常见的就是

    解释执行

    ,将 opcode + 操作数翻译成机器代码;
  • 另外一种执行方式就是

    JIT

    ,也就是我们常说的即时编译,它会在一定条件下将字节码编译成机器码之后再执行。



第2章 java虚拟机的内存管理



1.JVM整体架构

根据 JVM 规范,

JVM 内存

共分为 虚拟机栈、堆、方法区、程序计数器、本地方法栈五个部分。

在这里插入图片描述

名 称 特征 作用 配置参数 异常
程序计数器 线程私有,生命周期与线程相同, 占用内存小 大致为字节码行号指示器
虚拟机栈 线程私有,生命周期与线程相同,使用连续的内存空间 Java 方法执行的内存模型,存储局部变量表、 操作栈、动态链接、方法出口等信息 -Xss StackOverflowError/ OutOfMemoryError
线程共享,生命周期与虚拟机相同,可以不使用 连续的内存地址 保存对象实例,所有对象实例(包括数组)都要在堆上分配 -Xms -Xsx -Xmn OutOfMemoryError
方法区 线程共享,生命周期与虚拟机相同,可以不使用连续的内存地址 存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据 -XX:PermSize=16M -XX:MaxPermSize=64M/ -XX:MetaspaceSize=16M -XX:MaxMetaspaceSize=64M OutOfMemoryError
本地方法栈 线程私有 为虚拟机使用到的 Native 方法服务 StackOverflowError/ OutOfMemoryError


JVM分为五大模块

: 类装载器子系统 、 运行时数据区 、 执行引擎 、 本地方法接口 和 垃圾收集模块

在这里插入图片描述



2.JVM运行时内存

Java 虚拟机有自动内存管理机制

在这里插入图片描述


Java7和Java8内存结构的不同主要体现在方法区的实现

方法区是java虚拟机规范中定义的一种概念上的区域,不同的厂商可以对虚拟机进行不同的实现。

我们通常使用的Java SE都是由Sun JDK和OpenJDK所提供,这也是应用最广泛的版本。而该版本使用的VM就是 HotSpot VM。通常情况下,我们所讲的java虚拟机指的就是HotSpot的版本。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

对于Java8,HotSpots取消了永久代,那么是不是就没有方法区了呢?

当然不是,方法区只是一个规范,只不过它的实现变了。

在Java8中,元空间(Metaspace)登上舞台,方法区存在于元空间(Metaspace)。同时,元空间不再与堆连续,而且是存在于本地内存(Native memory)。

方法区Java8之后的变化

  • 移除了永久代(PermGen),替换为元空间(Metaspace)
  • 永久代中的class metadata(类元信息)转移到了native memory(本地内存,而不是虚拟机)
  • 永久代中的interned Strings(字符串常量池) 和 class static variables(类静态变量)转移到了Java heap
  • 永久代参数(PermSize MaxPermSize)-> 元空间参数(MetaspaceSize MaxMetaspaceSize)

Java8为什么要将永久代替换成Metaspace?

  • 字符串存在永久代中,容易出现性能问题和内存溢出。
  • 类及方法的信息等比较难确定其大小,因此对于永久代的大小指定比较困难,太小容易出现永久代溢出,太大则容易导致老年代溢出。
  • 永久代会为 GC 带来不必要的复杂度,并且回收效率偏低。
  • Oracle 可能会将HotSpot 与 JRockit 合二为一,JRockit没有所谓的永久代。



2.1 PC 程序计数器

程序计数器(Program Counter Register): 也叫PC寄存器,是一块较小的内存空间,它可以看做是当前线程所执行的字节码的行号指示器。在虚拟机的概念模型里,字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令、分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。

在这里插入图片描述

PC寄存器的特点:

(1)区别于计算机硬件的pc寄存器,两者略有不同。计算机用pc寄存器来存放“伪指令”或地址,而相对于虚拟机,pc寄存器它表现为一块内存,虚拟机的pc寄存器的功能也是存放伪指令,更确切的说存放的是将要执行指令的地址。

(2)当虚拟机正在执行的方法是一个本地(native)方法的时候,jvm的pc寄存器存储的值是undefined。

(3)程序计数器是线程私有的,它的生命周期与线程相同,每个线程都有一个。

(4)此内存区域是唯一一个在Java虚拟机规范中没有规定任何OutOfMemoryError情况的区域。

在这里插入图片描述

Java虚拟机的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的,在任何一个确定的时刻,一个处 理器只会执行一条线程中的指令。

因此,为了线程切换后能恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器,各条线程之间的计数器互不影响,独立存储,我们称这类内存区域为“线程私有”的内存。



2.2 虚拟机栈


Java虚拟机栈

(Java Virtual Machine Stacks)也是线程私有的,即生命周期和线程相同。

Java虚拟机栈和线程同时创建,用于存储栈帧

。每个方法在执行时都会创建一个栈帧(Stack Frame)。

public class StackDemo {
	public static void main(String[] args) { 
		StackDemo sd = new StackDemo(); 
		sd.A();
	}
	public void A(){ 
		int a = 10;
		System.out.println(" method A start"); 
		System.out.println(a);
		B();
		System.out.println("method A end");
	}
	public void B(){ 
		int b = 20;
		System.out.println(" method B start"); 
		C();
		System.out.println("method B end");
	}
	private void C() { 
		int c = 30;
		System.out.println(" method C start");
		System.out.println("method C end"); 
	}
}

在这里插入图片描述


栈帧

(Stack Frame) 是用于支持虚拟机进行方法调用和方法执行的数据结构。栈帧存储了方法的局部变量表、操作数栈、动态连接和方法返回地址等信息。每一个方法从调用至执行完成的过程,都对应着一个栈帧在虚拟机栈里从入栈到出栈的过程。

在这里插入图片描述

在这里插入图片描述


设置虚拟机栈的大小


-Xss 为jvm启动的每个线程分配的内存大小,默认JDK1.4中是256K,JDK1.5+中是1M

一般使用默认栈内存大小就够了

例如递归操作,会无限的会往里压栈,而且还没有弹栈, 导致最终总会溢出,无论你设置栈内存有多大

Linux/x64 (64-bit): 1024 KB
macOS (64-bit): 1024 KB
Oracle Solaris/x64 (64-bit): 1024 KB
Windows: The default value depends on virtual memory

-Xss1m 
-Xss1024k
-Xss1048576


局部变量表


局部变量表(Local Variable Table)是一组变量值存储空间,用于存放方法参数和方法内定义的局部变量。包括8种基本数据类型、对象引用(reference类型)和returnAddress类型(指向一条字节码指令的地址)。

其中64位长度的long和double类型的数据会占用2个局部变量空间(Slot),其余的数据类型只占用1个。

在这里插入图片描述


操作数栈


操作数栈(Operand Stack)也称作操作栈,是一个后入先出栈(LIFO)。随着方法执行和字节码指令的执行,会从局部变量表或对象实例的字段中复制常量或变量写入到操作数栈,再随着计算的进行将栈中元素出栈到局部变量表或者返回给方法调用者,也就是出栈/入栈操作。

 public class StackDemo2 {
    public static void main(String[] args) {
		int i = 1;
		int j = 2;
		int z = i + j;
	} 
}

在这里插入图片描述


动态链接


Java虚拟机栈中,每个栈帧都包含一个指向运行时常量池中该栈所属方法的符号引用,持有这个引用的目的是为了支持方法调用过程中的动态链接(Dynamic Linking)。

动态链接的作用: 将符号引用转换成直接引用。

在这里插入图片描述


方法返回地址


方法返回地址存放调用该方法的PC寄存器的值。一个方法的结束,有两种方式:正常地执行完成,出现未处理的异常非正常的退出。无论通过哪种方式退出,在方法退出后都返回到该方法被调用的位置。方法正常退出时,调用者的PC计数器的值作为返回地址,即调用该方法的指令的下一条指令的地址。而通过异常退出的,返回地址是要通过异常表来确定,栈帧中一般不会保存这部分信息。

无论方法是否正常完成,都需要返回到方法被调用的位置,程序才能继续进行。



2.3 本地方法栈

本地方法栈(Native Method Stacks) 与虚拟机栈所发挥的作用是非常相似的, 其区别只是虚拟机栈为虚拟机执行Java方法(也就是字节码) 服务, 而本地方法栈则是为虚拟机使用到的本地(Native) 方法服务。


特点


(1) 本地方法栈加载native的但是方法, native类方法存在的意义当然是填补java代码不方便实现的缺陷而提出的。

(2 )虚拟机栈为虚拟机执行Java方法服务,而本地方法栈则是为虚拟机使用到的Native方法服务。

(3) 是线程私有的,它的生命周期与线程相同,每个线程都有一个。

在Java虚拟机规范中,对本地方法栈这块区域,与Java虚拟机栈一样,规定了两种类型的异常:

(1)StackOverFlowError: 线程请求的栈深度>所允许的深度。

(2)OutOfMemoryError: 本地方法栈扩展时无法申请到足够的内存。



2.4 堆



2.4.1 Java堆 概念

对于Java应用程序来说, Java堆(Java Heap) 是虚拟机所管理的内存中最大的一块。 Java堆是被所有线程共享的一块内存区域, 在虚拟机启动时创建。 此内存区域的唯一目的就是存放对象实例, Java 世界里“几乎”所有的对象实例都在这里分配内存。“几乎”是指从实现角度来看, 随着Java语言的发展, 现在已经能看到些许迹象表明日后可能出现值类型的支持, 即使只考虑现在, 由于即时编译技术的进步, 尤其是逃逸分析技术的日渐强大, 栈上分配、 标量替换优化手段已经导致一些微妙的变化悄然发生, 所以说Java对象实例都分配在堆上也渐渐变得不是那么绝对了。


特点


(1)是Java虚拟机所管理的内存中最大的一块。

(2)堆是jvm所有线程共享的。

堆中也包含私有的线程缓冲区 Thread Local Allocation Buffer (TLAB) 

(3)在虚拟机启动的时候创建。

(4)唯一目的就是存放对象实例,几乎所有的对象实例以及数组都要在这里分配内存。

(5)Java堆是垃圾收集器管理的主要区域。

(6)很多时候java堆也被称为“GC堆”(Garbage Collected Heap)。从内存回收的角度来看,由于现在收集器基本都采用分代收集算法,所以Java堆还可以细分为: 新生代和老年代; 新生代又可以分为: Eden空间、From Survivor空间、To Survivor空间。

(7)java堆是计算机物理存储上不连续的、逻辑上是连续的,也是大小可调节的(通过-Xms和-Xmx控制)。

(8)方法结束后,堆中对象不会马上移出仅仅在垃圾回收的时候时候才移除。

(9)如果在堆中没有内存完成实例的分配,并且堆也无法再扩展时,将会抛出OutOfMemoryError异常


设置堆空间大小


内存大小 -Xmx / -Xms

使用示例: -Xmx20m -Xms5m

说明: 当下Java应用最大可用内存为20M, 最小内存为5M

public class TestVm {
    public static void main(String[] args) {
		//补充
		//byte[] b=new byte[5*1024*1024]; 
		//System.out.println("分配了5M空间给数组");
		
		System.out.print("Xmx="); 
		System.out.println(Runtime.getRuntime().maxMemory() / 1024.0 / 1024 + "M");
		
		System.out.print("free mem="); 
		System.out.println(Runtime.getRuntime().freeMemory() / 1024.0 / 1024 + "M");
		
		System.out.print("total mem=");
		System.out.println(Runtime.getRuntime().totalMemory() / 1024.0 / 1024 + "M"); 
	}
}

执行结果

 Xmx=20.0M
 free mem=4.1877593994140625M 
 total mem=6.0M

大家可以发现,这里打印出来的值和设置的值之间是有差异的,total Memory和最大的内存之间还是存在一定差异的,就是说JVM一般会尽量保持内存在一个尽可能底的层面,而非贪婪做法按照最大的内存来进行分配。

在测试代码中新增如下语句,申请内存分配:

 byte[] b=new byte[4*1024*1024]; 
 System.out.println("分配了4M空间给数组");

在申请分配了4m内存空间之后,total memory上升了,同时可用的内存也上升了,可以发现其实JVM在分配内存过程中是动态的, 按需来分配的。


堆的分类


现在垃圾回收器都使用分代理论,堆空间也分类如下:

-XX:+PrintGCDetails 打印GC详情

在这里插入图片描述

在Java8以后 ,由于方法区的内存不在分配在Java堆上,而是存储于本地内存元空间Metaspace中,所以永久代就不存在了 ,(约2018年925日)在Java11正式发布以后,从官网上找到了关于Java11中垃圾收集器的官方文档, 文档中没有提到“永久代”,而只有青年代和老年代。

在这里插入图片描述



2.4.2 年轻代和老年代


1.JVM中存储java对象可以被分为两类:


(1)年轻代(Young Gen)

:年轻代主要存放新创建的对象,内存大小相对会比较小,垃圾回收会比较频繁。年轻代分成1个Eden Space和2个Suvivor Space(from 和to)。 新创建的对象会进入 Eden区,但是大部分(80%)对象生命周期很短,用完之后就被垃圾回收器给销毁了,但是有些对象虽然变成垃圾但是没有被销毁掉,此时这些垃圾对象会被转移到 from survivor 0 区中,而 0区中也有对应的垃圾回收器来销毁对象,如果达到了设置的清理预值次数还没有清理掉。则会转移到 old memory 区中。


(2)年老代(Tenured Gen)

:年老代主要存放JVM认为生命周期比较长的对象(经过几次的Young Gen的垃圾回收后仍 然存在),内存大小相对会比较大,垃圾回收也相对没有那么频繁。


2.配置新生代和老年代堆结构占比


在这里插入图片描述

默认的,新生代 ( Young ) 与老年代 ( Old ) 的比例的值为 1:2 ( 该值可以通过参数 –XX:NewRatio 来指定 ),即:新生代 ( Young ) = 1/3 的堆空间大小。老年代 ( Old ) = 2/3 的堆空间大小。其中,新生代 ( Young ) 被细分为 Eden 和 两个 Survivor 区域,这两个 Survivor 区域分别被命名为 from 和 to,以示区分。 默认的,Edem : from : to = 8 : 1 : 1 ( 可以 通过参数 –XX:SurvivorRatio 来设定 ),即: Eden = 8/10 的新生代空间大小,from = to = 1/10 的新生代空间大小。

几乎所有的java对象都在Eden区创建, 但80%的对象生命周期都很短,创建出来就会被销毁.

JVM 每次只会使用 Eden 和其中的一块 Survivor 区域来为对象服务,所以无论什么时候,总是有一块 Survivor 区域是空闲着的。因此,新生代实际可用的内存空间为 9/10 ( 即90% )的新生代空间。

默认 -XX:NewRatio=2 , 标识新生代占1 , 老年代占2 ,新生代占整个堆的1/3

修改占比 -XX:NewPatio=4 , 标识新生代占1 , 老年代占4 , 新生代占整个堆的1/5

可以通过操作选项 -XX:SurvivorRatio 调整这个空间比例。 比如 -XX:SurvivorRatio=8



2.4.3 对象分配过程



第3章 JVM加载机制详解



第4章 垃圾回收机制及算法



第5章 常用指令与可视化调优工具



第6章 GC日志分析



第7章.JVM调优实战



版权声明:本文为GEFEICHEN原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。