类从被加载到虚拟机内存中开始,到卸载出内存为止,它的整个生命周期包括:
加载(Loading)
、
验证(Verification)
、
准备(Preparation)
、
解析(Resolution)
、
初始化(Initialization)
、
使用(Using)
和
卸载(Unloading)
7个阶段。其中验证、准备、解析3个部分统称为
连接(Linking)
。
加载、校验、准备、初始化和卸载这五个阶段的顺序是确定的,但是对于“解析”阶段则不一定,它在某些情况下可以在初始化之后再开始,这样做是为了支持 java 的运行时绑定特征(也称为动态绑定或晚期绑定)。
一、加载
在加载阶段,虚拟机需要完成以下3件事情:
- 通过一个类的全限定名来获取定义此类的二进制字节流。
- 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构。
- 在内存中生成一个代表这个类的 java.lang.Class 对象,作为方法区这个类的各种数据的访问入口。
二、验证(了解即可)
是连接阶段的第一步,这一阶段的目的是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。
但从整体上看,验证阶段大致上会完成下面4个阶段的检验动作:
文件格式验证
、
元数据验证
、
字节码验证
、
符号引用验证
。
2.1、文件格式验证
第一阶段要验证字节流是否符合 Class 文件格式的规范,并且能被当前版本的虚拟机处理。这一阶段可能包括下面这些验证点:
- 是否以魔数0xCAFEBABE开头。
- 主、次版本号是否在当前Java虚拟机接受范围之内。
- 常量池的常量中是否有不被支持的常量类型(检查常量tag标志)。
- 指向常量的各种索引值中是否有指向不存在的常量或不符合类型的常量。
- …
2.2、元数据验证
第二阶段是对字节码描述的信息进行语义分析,以保证其描述的信息符合《Java 语言规范》的要求,这个阶段可能包括的验证点如下:
- 这个类是否有父类(除了 java.lang.Object 之外,所有的类都应当有父类)。
- 这个类的父类是否继承了不允许被继承的类(被final修饰的类)。
- 如果这个类不是抽象类,是否实现了其父类或接口之中要求实现的所有方法。
- 类中的字段、方法是否与父类产生矛盾(例如覆盖了父类的final字段,或者出现不符合规则的方法重载,例如方法参数都一致,但返回值类型却不同等)。
- …
2.3、字节码验证
字节码验证第三阶段是整个验证过程中最复杂的一个阶段, 主要目的是通过数据流分析和控制流分析,确定程序语义是合法的、符合逻辑的。在第二阶段对元数据信息中的数据类型校验完毕以后,这阶段就要对类的方法体(Class 文件中的 Code 属性)进行校验分析,保证被校验类的方法在运行时不会做 出危害虚拟机安全的行为,例如:
- 保证任意时刻操作数栈的数据类型与指令代码序列都能配合工作,例如不会出现类似于“在操作栈放置了一个int类型的数据,使用时却按long类型来加载入本地变量表中”这样的情况。
- 保证任何跳转指令都不会跳转到方法体以外的字节码指令上。
- …
2.4、符号引用验证
最后一个阶段的校验行为发生在虚拟机将符号引用转化为直接引用的时候,这个转化动作将在连接的第三阶段一解析阶段中发生。符号引用验证可以看 作是对类自身以外(常量池中的各种符号引用)的各类信息进行匹配性校验,通俗来说就是,该类是否缺少或者被禁止访问它依赖的某些外部类、方法、字段等资源。本阶段通常需要校验下列内容:
- 符号引用中通过字符串描述的全限定名是否能找到对应的类。
- 在指定类中是否存在符合方法的字段描述符及简单名称所描述的方法和字段。
- 符号引用中的类、字段、方法的可访问性( private、 protected、public)。
- 是否可被当前类访问。
- …
三、准备
准备阶段是正式为类变量分配内存并设置类变量初始值的阶段,这些变量所使用的内存都将在方法区中进行分配。
这个阶段中有两个容易产生混淆的概念需要强调一下,首先,这时候进行内存分配的仅包括类变量(被static修饰的变量),而不包括实例变量,实例变量将会在对象实例化时随着对象一起分配在Java堆中。
其次,这里所说的初始值“通常情况”下是数据类型的零值,假设一个类变量的定义为:
public static int value = 123;
那么变量value在准备阶段过后的初始值为0而不是123,因为这时候尚未开始执行任何Java方法,而把value赋值为123的putstatic指令是程序被编译后,存放于类构造器 <clinit>() 方法之中,所以把value赋值为123的动作将在初始化阶段才会执行。
数据类型 | 零值 | 数据类型 | 零值 |
---|---|---|---|
int | 0 | boolean | false |
long | 0L | float | 0.0f |
short | (short) 0 | double | 0.0d |
char | ‘\u0000’ | reference | null |
byte | (byte) 0 |
但是也是会有一些特殊情况的,如类字段的字段属性表中存在 ConstantValue 属性,那在准备阶段变量 value 就会被初始化为 ConstantValue 属性所指定的值、假设上面的例子如:
public static final int value = 123;
编译时javac将会为value生成ConstantValue属性,在准备阶段虚拟机就会根据ConstantValue的设置将value赋值为123
四、解析
解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程。
符号引用(Symbolic References)
符号引用以一组符号来描述所引用的目标,符号可以是任何形式的字面量,只要使用时能无歧义地定位到目标即可。
直接引用(Direct References)
直接引用可以是直接指向目标的指针、相对偏移量或者是一个能间接定位到目标的句柄。
解析大体可以分为:
- 类或接口的解析
- 字段解析
- 类方法解析
- 接口方法解析
下列几个常见的异常,就与这个阶段有关:
-
java.lang.NoSuchFieldError
根据继承关系从下往上,找不到相关字段时的报错。(字段解析异常) -
java.lang.IllegalAccessError
字段或者方法,访问权限不具备时的错误。(类或接口的解析异常) -
java.lang.NoSuchMethodError
找不到相关方法时的错误。(类方法解析、接口方法解析时发生的异常)
五、初始化
初始化主要是对一个 class 中的 static 语句进行操作(对应字节码就是 clinit 方法)。<clinit>() 方法对于类或接口来说并不是必需的,如果一个类中没有静态语句块,也没有对变量的赋值操作,那么编译器可以不为这个类生成 <clinit>() 方法。
虚拟机会保证一个类的 <clinit>() 方法在多线程环境中被正确地加锁、同步,如果多个线程同时去初始化一个类,那么只会有一个线程去执行这个类的 <clinit>() 方法,其他线程都需要阻塞等待,直到活动线程执行 <clinit>() 方法完毕。如果在一个类的 <clinit>() 方法中有耗时很长的操作,就可能造成多个进程阻塞。
对于初始化阶段,虚拟机规范则是严格规定了
有且只有
5种情况必须立即对类进行“初始化”(而加载、验证、准备自然需要在此之前开始,解析阶段则不一定):
-
遇到
new
、
getstatic
、
putstatic
或
invokestatic
这4条字节码指令时,如果类没有进行过初始化,则需要先触发其初始化。生成这4条指令的最常见的Java代码场景是:- 使用new关键字实例化对象的时候
- 读取或设置一个类的静态字段(被final修饰、已在编译期把结果放入常量池的静态字段除外)的时候
- 调用一个类的静态方法的时候
-
使用 java.lang.reflect 包的方法对类进行反射调用的时候,如果类没有进行过初始化,则需要先触发其初始化。
-
当初始化一个类的时候,如果发现其父类还没有进行过初始化,则需要先触发其父类的初始化。
-
当虚拟机启动时,用户需要指定一个要执行的主类(包含 main() 方法的那个类),虚拟机会先初始化这个主类。
-
当使用JDK 1.7的动态语言支持时,如果一个 java.lang.invoke.MethodHandle 实例最后的解析结果REF_getStatic、REF_putStatic、REF_invokeStatic的方法句柄,并且这个方法句柄所对应的类没有进行过初始化,则需要先触发其初始化。
-
当一个接口中定义了 JDK1.8 新加入的默认方法(被 default 关键字修饰的接口方法)时,如果这个接口的实现类发生了初始化,那该接口要在其之前 被初始化。
5.1、常见案例
-
通过子类引用父类的静态字段,只会触发父类的初始化,不会导致子类初始化(子类只会被加载)
public class SuperClass { static { System.out.println("SuperClass init..."); } public static int value = 123; }
public class SubClass extends SuperClass { static { System.out.println("SubClass init..."); } }
public class App { public static void main(String[] args) { System.out.println(SubClass.value); } }
这里我们发现,控制台只输出了“SuperClass init…”,而不会输出“SubClass init…”,对于静态字段,只有直接定义这个字段的类才会被初始化,因此通过其子类来引用父类中定义的静态字段,只会触发父类的初始化而不会触发子类的初始化。
-
通过数组定义来引入类,不会触发此类的初始化
public class ArrayClass { static { System.out.println("ArrayClass init..."); } }
public class App { public static void main(String[] args) { SuperClass[] classArr = new SuperClass[10]; } }
运行之后发现没有输出“ArrayClass init…”,说明并没有触发ArrayClass类的初始化阶段。
-
常量在编译阶段会存入调用类的常量池中,本质上并没有直接引用到定义常量的类,因此不会触发定义常量的类的初始化
public class ConstClass { static { System.out.println("ConstClass init..."); } public static final String HELLO_WORLD = "Hello World"; }
public class App { public static void main(String[] args) { System.out.println(ConstClass.HELLO_WORLD); } }
执行完代码之后,也没有输出“ConstClass init…”,这是因为虽然在Java源码中引用了ConstClass类中的常量HELLO_WORLD,但其实在编译阶段通过常量传播优化,已经将此常量的值“Hello World”存储到Client类的常量池中,以后Client对常量ConstClass.HELLO_WORLD的引用实际都转化为Client类对自身常量池的引用了。