java虚拟机JVM堆(概述、GC、内存、TLAB和代码的优化)

  • Post author:
  • Post category:java




7. 堆



7.1 堆的核心概述

  • 一个JVM实例只存在一个堆内存,堆也是Java内存管理的核心区域。
  • Java堆区在JVM启动的时候即被创建,其空间大小也就确定了。是JVM管理的最大一块内存空间。

    • 堆内存的大小是可以调节的。
  • 《Java虚拟机规范》规定,堆可以处于物理上不连续的内存空间中,但在逻辑上它应该被视为连续的。
  • 所有的线程共享Java堆,在这里还可以划分线程私有的缓冲区(ThreadLocal Allocation Buffer,TLAB)。
  • 数组和对象可能永远不会存储在栈中,因为栈帧中保存引用,这个引用指向对象或者数组在堆中的位置。
  • 在方法结束后,堆中的对象不会马上被移除,仅仅在垃圾收集的时候才会被移除。(如果方法结束后,堆中的实例对象就被垃圾回收,GC频繁回收垃圾用户线程就会受到影响)
  • 堆,是GC ( Garbage collection,垃圾收集器)执行垃圾回收的重点区域。



7.1.1内存细分

java 7及以前堆内存逻辑上分为三部分:新生区+养老区+永久区

java 8及以后堆内存逻辑上分为三部分:新生区+养老区+

元空间



7.2设置堆内存的大小与OOM


  • -Xms

    用来设置堆空间(年轻代+老年代)的初始内存大小


  • -X

    是jvm的运行参数

    ms

    是memory start


  • -Xmx

    用来设置堆空间(年轻代+老年代)的最大内存大小

默认情况下:

  • 初始内存大小:物理电脑内存大小/64
  • 最大内存大小:物理电脑内存大小/4
  • 建议将初始对内存和最大的堆内存设置成相同的值
     long initialMemory = Runtime.getRuntime().totalMemory() / 1024 / 1024;
     long maxMemory = Runtime.getRuntime().maxMemory() / 1024 / 1024;

     System.out.println("-Xms:" + initialMemory + "M");
     System.out.println("-Xmx:" + maxMemory + "M");

查看设置的参数,显示垃圾回收的一些细节:

方式一:cmd中输入

jps

,获得进程IP,然后输入

jstat -gc 进程id

方式二:在

VM options

输入:

-XX:+PrintGCDetails



7.3 年轻代和老年代

存储在JVM中的Java对象可以被划分为两类:

  • 一类是生命周期较短的瞬时对象,这类对象的创建和消亡都非常迅速保持一致。

  • 另外一类对象的生命周期却非常长,在某些极端的情况下还能够与JVM的生命周期

Java堆区进一步细分的话,可以划分为年轻代(YoungGen)和老年代(oldGen)

其中年轻代又可以划分为Eden空间、Survivor0空间和survivor1空间(有时也叫做from区、to区)。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-8VPAI7vA-1603007755524)(C:\Users\GO FOR IT\AppData\Roaming\Typora\typora-user-images\1602642528367.png)]

配置新生代与老年代在堆结构的占比:

  • 默认

    -XX:NewRatio=2

    ,表示新生代占1,老年代占2,新生代占整个堆的1/3
  • 可以修改-XX :NewRatio=4,表示新生代占1,老年代占4,新生代占整个堆的1/5

配置幸存者区与Eden区在堆结构的占比:

  • 默认

    -XX:SurvivorRation=8

    ,表示幸存者区占1,Eden区占8,幸存者区占整个堆的1/9

  • 几乎所有的java对象的销毁都在Eden区被new出来的

Eden满的时候触发

YGC/MInor GC

,幸存者区满的时候不会触发

YGC/MInor GC

总结:

  • 针对幸存者s,s1区的总结:

    复制之后有交换,谁空谁是to

  • 关于垃圾回收:频繁在新生区收集,很少在养老区收集,几乎不在永久区/元空间收集。



7.4 GC

JVM在进行GC时,并非每次都对上面三个内存(新生代、老年代;方法区)区域一起回收的,大部分时候回收的都是指新生代。

针对HotSpot VM的实现,它里面的GC按照回收区域又分为两大种类型:一种是部分收集(Partial GC),一种是整堆收集(Full GC)

  • 部分收集:不是完整收集整个Java堆的垃圾收集。其中又分为:

    • 新生代收集(Minor GC / Young GC):只是新生代的垃圾收集

    • 老年代收集(Major GC / old GC):只是老年代的垃圾收集。

      目前,只有CMS GC会有单独收集老年代的行为。

      注意,很多时候Major GC会和Full GC混淆使用,需要具体分辨是老年代回收还是整堆回收

    • 混合收集(Mixed Gc):收集整个新生代以及部分老年代的垃圾收集。

      目前,只有G1 GC会有这种行为

  • 整堆收集(Full GC):收集整个java堆和方法区的垃圾收集。



7.4.1 Minor GC触发的机制

  • 当年轻代空间不足时,就会触发Minor GC,这里的年轻代满指的是Eden代满,Survivor满不会引发GC。(每次Minor GC会清理年轻代的内存。)
  • 因为Java对象大多都具备朝生夕灭的特性,所以Minor GC非常频繁,一般回收速度也比较快。这一定义既清晰又易于理解。
  • Minor GC会引发STW,暂停其它用户的线程,等垃圾回收结束,用户线程才恢复运行。



7.4.2 Major GC触发的机制

  • 指发生在老年代的GC,对象从老年代消失时,我们说“Major GC”或“Full GC”发生了。

  • 出现了Major GC,经常会伴随至少一次的Minor GC(但非绝对的,在Parallel scavenge收集器的收集策略里就有直接进行Major GC的策略选择过程)。

    也就是在老年代空间不足时,会先尝试触发Minor Gc。如果之后空间还不足,则触发Major GC

  • Major GC的速度一般会比Minor GC慢10倍以上,STW的时间更长。

  • 如果Major GC后,内存还不足,就报OOM了。

  • Major Gc的速度一般会比Minor GC慢10倍以上。



7.4.3 Full GC触发机制

触发Full GC执行的情况有如下五种:

  1. 调用system.gc()时,系统建议执行Full GC,但是不必然执行
  2. 老年代空间不足
  3. 方法区空间不足
  4. 由Eden区、survivor space0 (From Space)区向survivor space1 (To Space)区复制时,对象大小大于To Space可用内存,则把该对象转存到老年代,且老年代的可用内存小于该对象大小
  5. 通过Minor GC后进入老年代的平均大小大于老年代的可用内存

为什么需要把java堆分代?不分代就不能正常工作吗?

不同对象的生命周期不同,70%-99%的对象都是临时对象。分代的理由就是为了优化GC性能。



7.5 内存分配策略

  • 针对不同年龄段的对象分配原则如下所示:

    • 优先分配到Eden

    • 大对象直接分配到老年代

      尽量避免程序中出现过多的大对象

    • 长期存活的对象分配到老年代

  • 动态对象年龄判断

    如果survivor区中相同年龄的所有对象大小的总和大于survivor空间的一半,年龄大于或等于该年龄的对象可以直接进入老年代,无须等到MaxTenuringThreshold中要求的年龄。

  • 空间分配担保

    -XX:HandlePromotionFailure



7.6 TLAB

  • 从内存模型而不是垃圾收集的角度,对Eden区域继续进行划分,JVM为每个线程分配了一个私有缓存区域它包含在Eden空间内。

  • 多线程同时分配内存时,使用TLAB可以避免一系列的非线程安全问题,同时还能够提升内存分配的吞吐量,因此我们可以将这种内存分配方式称之为快速分配策略。

尽管不是所有的对象实例都能够在TLAB中成功分配内存,但JVM确实是将TLAB作为内存分配的首选。

  • 通过选项

    XX:UseTLAB

    设置是否开启TLAB空间。
  • 一旦对象在TLAB空间分配内存失败时,JVM就会尝试着通过使用加锁机制确保数据操作的原子性,从而直接在Eden空间中分配内存
  • 默认情况下,TLAB空间的内存非常小,仅占有整个Eden空间的1%,当然我们可以通过选项

    XX:TLABWasteTargetPercent

    设置TLAB空间所占用Eden空间的百分比大小。



7.7堆空间的参数设置


  • -Xms

    :初始堆空间内存(默认为物理内存的1/64)


  • -Xmx

    :最大堆空间内存(默认为物理内存的1/4)


  • -Xmn

    :设置新生代的大小〈初始值及最大值)


  • -XX:NewRatio

    :配置新生代与老年代在堆结构的占比


  • -XX:+PrintFlagsInitial

    :查看所有的参数的默认初始值


  • -XX:+PrintFlagsFinal

    :查看所有的参数的最终值(可能会存在修改,不再是初始值)


  • XX:+PrintGCDetails

    :输出详细的GC处理日志

    打印gc简要信息:①

    -XX:+PrintGc



    -verbose:gc


  • -XX:SurvivorRatio

    :设置新生代中Eden和s0/s1空间的比例


  • -XX:MaxTenuringThreshold

    :设置新生代垃圾的最大年龄


  • -XX:HandlePromotionFalilure

    :是否设置空间分配担保

堆是分配对象的唯一选择吗?

经过逃逸分析后发现,一个对象没有逃逸出方法的话,那么就可能被优化成栈上分配。这是常见的堆外储存技术。


-XX:+DoEscapeAnalysis

:开启逃逸分析(JDK7及以后默认开启)

  • 逃逸分析的基本行为就是分析对象实体动态作用域:

    • 当一个对象在方法中被定义后,对象只在方法内部使用,则认为没有发生逃逸。
    • 当一个对象在方法中被定义后,它被外部方法所引用,则认为发生逃逸。例如作为调用参数传递到其他地方中。
   public String escape(String s1, String s2){
       StringBuilder sb = new StringBuilder();
       sb.append(s1);
       sb.append(s2);
       //转化成string新的对象,sb发生逃逸
       return sb.toString();
   }


结论:能使用局部变量的就不要打在方法外定义



7.8 代码的优化

使用逃逸分析,编译器可以对代码做如下优化:

  • 栈上分配

    发现一个对象没有发生逃逸,可能被优化成栈上分配,线程结束,栈空间被回收,局部变量也被回收。这样就无须进行垃圾回收。

  • 同步省略

    如果一个对象被发现只能从一个线程被访问到,那么对于这个对象的操作可以不考虑同步。

    在动态编译同步块的时候,JIT编译器可以借助逃逸分析来判断同步块所使用的锁对象是否只能够被一个线程访问而没有被发布到其他线程。

  • 分离对象或标量替换

    有的对象可能不需要作为一个连续的内存结构存在也可以被访问到,那么对象的部分(或全部)可以不存储在内存,而是存储在CPU寄存器中。

  • 标量(Scalar)是指一个无法再分解成更小的数据的数据。Java中的原始数据类型就是标量。

  • 相对的,那些还可以分解的数据叫做聚合量(Aggregate), Java中的对象就是聚合量,因为他可以分解成其他聚合量和标量。

  • 在JIT阶段,如果经过逃逸分析,发现一个对象不会被外界访问的话,那么经过JIT优化,就会把这个对象拆解成若干个其中包含的若干个成员变量来代替。这个过程就是标量替换。


xx:+EliminateAllocations

:开启标量替换,默认开启



版权声明:本文为See_Csdn_原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。