JVM(十二):方法调用
方法调用
首先,我们要明白一个基础性概念:方法调用并不是方法执行。其只是确定该调用哪一个方法而已(多态的影响,选择方法的不同版本)。并且因为 Java 调用的动态性,有些方法需要在类加载阶段动态解析,这也为 JVM 解析符号引用成直接引用提供了难度。
解析
在 JVM(五):探究类加载过程-上 中,我们说过在类加载过程的解析阶段, JVM 会将符号引用转变为直接引用。但这需要方法在程序真正运行的之前就有一个 可确定 的版本,且这个版本在整个运行期间是不可更改的。这种在类加载阶段就能解析出的方法调用被称为 解析。
解析条件
满足解析条件的方法在 Java 语言中有 静态方法 和 私有方法 两类。前者与类类型直接关联,后者在外部无法被访问。这种特性也使得其不可能通过继承或别的方式来重写其版本,因此适合在解析阶段就进行处理。
在 JVM 内部与之相对应的就是invokestatic
和 invokespecial
两种字节码指令。这两种指令对应的就是 调用静态方法 、调用实例构造器 、 私有方法 、 父类方法。 在执行这四类方法时,在类加载的解析阶段就会将符号引用直接转变为直接引用。
上述的这些方法也被称为 非虚方法 。
满足加载阶段解析的还有一个特殊的方法为 final方法,因为其无法被覆盖,也没有其他版本,因此虽然其是用 invokevirtual
来调用,其也是一种 非虚方法,可以在编译期间就完全确定。
分派
分派则是在程序运行的期间才能确定调用哪个版本的方法。其也揭示了 重载 和 重写 的本质。下面就让我们来看一下其在 JVM 内是如何实现的。
静态分派
// 代码参考自<<深入理解Java虚拟机>>
public class Demo {
static class Human{
public void overWriteDemo(){
System.out.println("human overWriteDemo");
}
}
static class Man extends Human {
@Override
public void overWriteDemo(){
System.out.println("Man overWriteDemo");
}
}
static class Woman extends Human{
@Override
public void overWriteDemo(){
System.out.println("Woman overWriteDemo");
}
}
public void sayHello(Human human){
System.out.println("human");
}
public void sayHello(Man man){
System.out.println("Man");
}
public void sayHello(Woman woman){
System.out.println("Woman");
}
public static void main(String[] args) throws InterruptedException {
Human man = new Man();
Human woman = new Woman();
Demo demo = new Demo();
demo.sayHello(man);
demo.sayHello(woman);
}
}
首先各位读者可以看一下以下代码输出的是什么。
读者可以带着您这边的答案来看下一些概念。上面的 Human 我们称之为变量的 静态类型,或者叫做变量的 外观类型 。后面的 Man 或 Women 我们则称之为变量的 实际类型。
对应这两种类型,变量的静态类型是本身不变的,只有在使用的时候才可以对其进行改变使用,而且最终的静态类型在编译期就可知,如
demo.sayHello((Man)man);
demo.sayHello((Women)man);
这样就可以在使用的时候,使用指定的类型,但其变量本身的属性还是不会更改。
这种语法对应就是 Java 语言中的 重载 语法,虚拟机是通过参数的 静态类型 来确定该调用哪个版本的方法。
现在回到代码输出结果上,第一次代码输出的结果为
Human
Human
第二次代码输出结果为:
Man
Women
动态分派
// 为了节约篇幅,前面的内容就不复制了,只是在调用的时候更改了一下代码,如下所示:
public static void main(String[] args) throws InterruptedException {
Human man = new Man();
Human woman = new Woman();
man.overWriteDemo();
woman.overWriteDemo();
man = new Woman();
man.overWriteDemo();
}
现在读者再来看一下以上这段代码的输出结果是什么,带着心中的答案我们再来看一下 动态分派 的概念。
通过javap
分析其字节码表现,我们发现其调用的是invokevirtual
指令 , 而invokevirtual
在调用的时候,运行时解析步骤为以下方式:
- 找到元素找到的实际类型,记为 C
- 如果在类型 C 中找到签名相符的方法 , 则进行权限校验。 如果通过 , 则返回其对应引用 , 如果没通过 , 则抛出异常;
- 在第二步中 , 如果没找到相符的方法 , 则从 C 从下而上地对其父类进行查找和验证;
- 如果仍旧没有找到 , 则抛出异常 .
通过以上者多层的步骤推进 , 则可以找到实际调用的对象类型,从而决定调用哪个版本的方法。
实现方式
上面我们看到了动态多态的实现逻辑,现在我们来看一下在 JVM 内是如何实现这个过程的.
首先,我们看到该过程需要逐层搜索以找到对应类。但是如果在实际调用过程中,这样逐层的搜索是会影响性能的。因此,面对这种情况,JVM 采用了虚方法表 的形式来实现。在虚方法表中存储了每个方法的实际地址。
方法执行
Java 执行方法分为 解释执行(通过解释器执行) 和 编译执行(通过编译器编译为本地代码执行)两种。
在本文中,我们着重讲一下在解释执行的过程中,JVM 内部是如何实现的。至于编译执行,因为还涉及到 JIT 的优化等概念。放在后面的 编译优化 章节再详细叙说。
基于栈的执行模型
方法执行的过程其实就是在执行 Class 中字节码的指令集部分,而从 # JVM(六):探究类加载过程-下 中,我们已经看到指令集的大部分组成部分,都是零地址指令。那么什么是零地址指令呢,下面给大家举个例子:
iconst_1
iconst_1
iadd
istore_0
以上这段代码就是一段零地址指令,其含义为计算1+1
的结果,具体操作过程为:
- 首先将 1 入栈
- 将另一个 1 入栈
- 将栈顶的两个元素相加,并将计算结果重新入栈
- 将栈顶元素(结果),放入局部变量表中 slot0 位置
基于寄存器的执行模型
而另外还有一种基于寄存器的执行方式,比如上面这段代码如果用寄存器的方式来实现就是如下所示:
mov eax,1
add eax,1
这段指令集的内容就是:
- 将 EAX 寄存器的值设为 1;
- add 指令将eax的值+1,然后结果就保存在eax寄存器上。
执行模型对比
我们很难说清楚两种设计理念哪个更加的好,因为在现如今,两套指令集都在茁壮发展中,因此肯定都有各自的优点,接下来就让我们看一下其各自的优点是什么。
首先既然是基于栈的,那么其最大的优点应该就是 可移植,因为寄存器是与硬件息息相关的,其会受到硬件寄存器的数量等原因限制;其次在栈结构中,大部分指令都是零地址的,那么其第二个优点就是 代码更加的紧凑,而寄存器这样的指令集还需要带上多个参数;最后基于栈的模型,编译器 实现起来也会更加简单,因为所有的操作都是在栈上进行,不需要考虑内存空间分配的问题。
而对寄存器模型来说,其最大的优点就是 执行速度块,因为基于栈来操作的话,同样的操作,基于栈要比基于寄存器来说, 多出大量的指令内容,并且需要频繁的 出栈入栈操作,也就是大量的内存访问操作, 这都会影响指令执行的效率。而这也是所有主流物理机都使用基于寄存器来实现指令集的原因。
总结
在本文中,我们讲述了方法调用和方式执行的过程,与# JVM(七):JVM内存结构 中方法执行时涉及到的内存结构相结合,这三者,使我们详细理清了 Java 程序执行一个方法的全过程,希望读者们以后在写代码中,可以在脑海中清晰地明白这个过程。