本文主要是介绍jvm(3)-运行时数据区、指令集,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
1. Runtime Data Area and Instruction Set(运行时数据区和指令集)
1.1 jvm运行时数据区
分为以下几部分:
- jvm stacks ,就是我们常说的栈,栈里面包含frame(窗口,也叫栈帧)
- Program Counter,简称PC
- method area 方法区,包括常量池。
- native method stacks,本地方法栈。
- Direct, 直接内存
- heap,堆
详细了解一下这几个区:
1.2 Program Counter 简称PC
- PC计数器,用来存放指令。每一个线程都一个自己的PC计数器
- 为什么每一个线程都有自己的PC计数器呢?
便于线程切换。
到底是什么意思呢?
A线程执行到某个位置后,cpu切换到B线程,当B线程执行完,回到A线程,此时,A线程需要知道自己执行到哪里了。得记住自己执行到那个指令了,切换回来之后还需要继续执行。
虚拟机的运行,类似于这样的循环:
while( not end(指令不结束) ) {
取PC中的位置,找到对应位置的指令;
执行该指令;
PC ++;
}
1.3 jvm stacks 栈
每一个线程对应一个jvm栈,每一个方法对应一个栈帧
Frame- 每个方法对应一个栈帧。
Frame的构成如下图:
包括四部分:Local Variables Operand Stacks. dynamic liking return address
详细了解一下:
1.3.1 . Local Variable Table(局部变量表)
局部变量表,指这个方法中定义的局部变量,下面看一下静态方法中的局部变量表和成员方法中的局部变量表
- 如果方法是static方法,则有几个局部变量就是几个局部变量。
原始代码:
package com.tzw.classMode;
public class MyTest02 {public static void main(String[] args) {MyTest02.hi("hi");}public static void hi(String s){System.out.println(s);}
}
通过jclasslib插件查看指令:
-
有两个方法,分别是main方法和code方法
-
这连个方法都是static方法,所以LacalVariableTable(局部变量表)中只有一个参数s对应常量池中的 #21。
-
所以在静态方法中能看到几个变量就是几个变量
-
如果方法是普通方法,则局部变量表中0号位置的变量默认就是this。
原始代码:
package com.tzw.classMode;public class MyTest01 {public static void main(String[] args) {MyTest01 myTest01 = new MyTest01();myTest01.hello("hello");}public void hello(String str){System.out.println(str);}
}
通过jclasslib插件查看指令:
- 有两个方法,分别是main方法和hello方法
- hello方法是成员方法都,所以LacalVariableTable(局部变量表)中看似只有一个参数,实则有两个参数,表的第一个位置放的是this。
- 所以在成员方法中能看到几个变量就是几个变量+1个参数,因为在成员方法中,默认在方法中放了一个this的参数。
1.3.2. Operand Stack(操作栈)
这个理解为一个栈帧中的小栈,叫做操作栈,用来做数据操作的地方。
每个线程都有一个栈,每个栈有多个栈帧,每个栈帧里都有一个Operand stack(操作栈)
根据不同的指令在栈里做相关的处理。我们先需要了解一下指令集。详细见第2章指令集。
1.3.3. Dynamic Linking (动态链接)
指向常量池的的linking。链接
1.3.4. return address (返回地址)
a() -> b(),方法a调用了方法b, b方法的返回值放在什么地方。
就是说一个方法就是一个栈帧,那么这个方法有返回值,这个返回值的地址就是这个return address。
1.4 native method stacks 本地方法栈。
调用c c++的方法。
1.5 direct Memory 直接内存
- 不归属jvm管理,归属操作系统管理
在之前,当有io数据传递过来,会存储到操作系统的内核空间内存中,当jvm要使用的时候,需要拷贝一份数据到jvm中。有拷贝的过程
现在有了直接内存,直接内存直接去读取os内核的内存,不需要在去拷贝。零拷贝 - JVM可以直接访问的内核空间的内存 (OS 管理的内存)
- NIO , 提高效率,实现zero copy
1.6 method area 方法区
存储每一个class的结构,常量池等。method area是一个概念上的东西。
- Prem Space(<1.8),jdk1.8之前
在1.8之前方法区的具体实现就叫Prem generation。可以理解为1.8之前方法区就叫做Prem generation
字符串常量位于Permgeneration, FGC不会清理, 大小启动的时候指定,不能变。 - Meta Space(>1.8),jdk1.8之后
在1.8之后方法区的具体实现就叫Meta Space,可以理解为1.8之前方法区就叫做MateSpace。
字符串常量位于堆,会触发FGC清理,不设定大小的话,最大就是物理内存
如何证明: 1.7 字符串常量位于Perm,而1.8位于Heap中
提示:结合GC, 一直创建字符串常量,观察堆,和Metaspace
jdk1.8之前,jvm的对内存分为新生代+老年代+持久代。而持久代就是perm generation。方法区(Method
Area)与Java堆一样,是各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。虽然Java虚拟机规范把方法区描述为堆的一个逻辑部分,但是它却有一个别名叫做Non-Heap(非堆),目的应该是与Java堆区分开来。很多人都更愿意把方法区称为“永久代”(Permanent
Generation)。jdk1.7之前永久代包含字符串常量池,静态变量等。而在jdk1.7的Hotspot中,已经将字符串常量池,静态变量等移动heap堆中了,不在永久代中了。
jdk1.8中,永久代已经不存在,存储的类信息、编译后的代码数据等已经移动到了元空间(MetaSpace)中,元空间并没有处于堆内存上,而是直接占用的本地内存(NativeMemory)。而字符串常量池,静态变量等移动heap堆中。
元空间的本质和永久代类似,都是对JVM规范中方法区的实现。不过元空间与永久代之间最大的区别在于:元空间并不在虚拟机中,而是使用本地内存。因此,默认情况下,元空间的大小仅受本地内存限制,但可以通过以下参数来指定元空间的大小:
-XX:MetaspaceSize,初始空间大小,达到该值就会触发垃圾收集进行类型卸载,同时GC会对该值进行调整:如果释放了大量的空间,就适当降低该值;如果释放了很少的空间,那么在不超过MaxMetaspaceSize时,适当提高该值。
-XX:MaxMetaspaceSize,最大空间,默认是没有限制的。
除了上面两个指定大小的选项以外,还有两个与 GC 相关的属性:
-XX:MinMetaspaceFreeRatio,在GC之后,最小的Metaspace剩余空间容量的百分比,减少为分配空间所导致的垃圾收集
-XX:MaxMetaspaceFreeRatio,在GC之后,最大的Metaspace剩余空间容量的百分比,减少为释放空间所导致的垃圾收集
简单理解就是:
在Java7之前,HotSpot虚拟机中将GC分代收集扩展到了方法区,使用永久代来实现了方法区。这个区域的内存回收目标主要是针对常量池的回收和对类型的卸载。而在Java8中,已经彻底没有了永久代,将方法区直接放在一个与堆不相连的本地内存区域,这个区域被叫做元空间。
1.7. Heap 堆
gc 补充
2. 指令集
指令集的分类:
- 基于寄存器的指令集
- 基于栈的指令集
Hotspot中的Local Variable Table = JVM中的寄存器
2.1 创建对象的指令
- 先来分析一个创建对象的指令集,仅分析main方法中MyTest01 myTest01 = new MyTest01();这一个指令
源代码:MyTest01 myTest01 = new MyTest01();
package com.tzw.classMode;public class MyTest01 {public static void main(String[] args) {MyTest01 myTest01 = new MyTest01();myTest01.hello("hello");}public void hello(String str){System.out.println(str);}
}
- 这个类经过翻译的字节码指令集如下。
前四行就是MyTest01 myTest01 = new MyTest01();操作。
0 new #2 <com/tzw/classMode/MyTest01>3 dup4 invokespecial #3 <com/tzw/classMode/MyTest01.<init> : ()V>7 astore_18 aload_19 ldc #4 <hello>
11 invokevirtual #5 <com/tzw/classMode/MyTest01.hello : (Ljava/lang/String;)V>
14 return
- 分析:(查看jvm指令集文档https://docs.oracle.com/javase/specs/jvms/se16/html/jvms-6.html#jvms-6.5.dup)
(1) new 。 new一个空间,将地址存入opeand stacks。类此时赋值为默认值。
(2)dup 。文档意思:Duplicate the top operand stack value。 在opeand stacks中在复制一份地址。此时opeand中有两个地址。
(3)invokespecial 调用构造方法,同时将复制的那个地址从operand stack中弹出用来使用,类此时赋值为初始化。
(4)astore_1 。 将operand stack 中对象空间地址弹出,并赋值带变量值myTest01。这就是为什么我们打印一个对象时打印的是一个地址。
上面4步完成了MyTest01 myTest01 = new MyTest01();操作。
2.2 继续深入
上述已经完成了对象的创建,但是这个方法还没有完成,我们继续来读指令。
(5)aload_1 ,再次将变量表中第1个位置的变量值那出来压栈。就是将myTest01拿出来压栈。
(6)ldc ,将参数值“hello” 推到常量池中
(7)invokeviirtual ,调用hello()方法。接下来的事就到了另一个方法或者栈帧中。
(8)return 返回。
分析一下hello()方法:hello方法的指令集为
0 getstatic #6 <java/lang/System.out : Ljava/io/PrintStream;>
3 aload_1
4 invokevirtual #7 <java/io/PrintStream.println : (Ljava/lang/String;)V>
7 return
(1)getstatic 调用静态方法System.out
(2) aload_1将变量s的值压栈
(3)invokevirtual,调用成员方法 println。
(4)返回。
2.3 常用指令集
- astore_x,将值存储到局部变量表第x个位置的变量名上
- aload_x,将第x个位置的变量的值取出压栈。
- pop 弹栈
- mul 乘
- sub 减
- invoke系列:
- InvokeStatic 调用静态方法
- InvokeVirtual 调用成员方法/实例方法
自带多态。什么意思呢?比如说一个类有多个子类。
在调用实例方法时,new的是哪个子类,就是调用这个子类的方法。
首先需要将对象实例化,并赋值给变量。
调用方法,将该变量压栈,然后调用栈里的对象的方法。
- InvokeInterface 接口调用方法
eg:
List list = new ArrayList();
list.add();
- InovkeSpecial 构造方法,private 方法,不需要多态的方法等可以直接定位的方法
- InvokeDynamic
JVM最难的指令,lambda表达式或者反射或者其他动态语言scala kotlin,或者CGLib ASM,动态产生的class,会用到的指令
这篇关于jvm(3)-运行时数据区、指令集的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!