jvm(3)-运行时数据区、指令集

2024-05-02 09:08
文章标签 java 数据 jvm 运行 指令集

本文主要是介绍jvm(3)-运行时数据区、指令集,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1. Runtime Data Area and Instruction Set(运行时数据区和指令集)

1.1 jvm运行时数据区

分为以下几部分:

  1. jvm stacks ,就是我们常说的栈,栈里面包含frame(窗口,也叫栈帧)
  2. Program Counter,简称PC
  3. method area 方法区,包括常量池。
  4. native method stacks,本地方法栈。
  5. Direct, 直接内存
  6. heap,堆

在这里插入图片描述
详细了解一下这几个区:

1.2 Program Counter 简称PC

  1. PC计数器,用来存放指令。每一个线程都一个自己的PC计数器
  2. 为什么每一个线程都有自己的PC计数器呢?
    便于线程切换。
    到底是什么意思呢?
    A线程执行到某个位置后,cpu切换到B线程,当B线程执行完,回到A线程,此时,A线程需要知道自己执行到哪里了。得记住自己执行到那个指令了,切换回来之后还需要继续执行。

虚拟机的运行,类似于这样的循环:

while( not end(指令不结束) ) {
取PC中的位置,找到对应位置的指令;
执行该指令;
PC ++;
}

1.3 jvm stacks 栈

每一个线程对应一个jvm栈,每一个方法对应一个栈帧

Frame- 每个方法对应一个栈帧。

Frame的构成如下图:
包括四部分:Local Variables Operand Stacks. dynamic liking return address
在这里插入图片描述
详细了解一下:

1.3.1 . Local Variable Table(局部变量表)

局部变量表,指这个方法中定义的局部变量,下面看一下静态方法中的局部变量表和成员方法中的局部变量表

  1. 如果方法是static方法,则有几个局部变量就是几个局部变量。
    原始代码:
package com.tzw.classMode;
public class MyTest02 {public static void main(String[] args) {MyTest02.hi("hi");}public static void hi(String s){System.out.println(s);}
}

通过jclasslib插件查看指令

  1. 有两个方法,分别是main方法和code方法

  2. 这连个方法都是static方法,所以LacalVariableTable(局部变量表)中只有一个参数s对应常量池中的 #21。

  3. 所以在静态方法中能看到几个变量就是几个变量
    在这里插入图片描述

  4. 如果方法是普通方法,则局部变量表中0号位置的变量默认就是this。
    原始代码:

package com.tzw.classMode;public class MyTest01 {public static void main(String[] args) {MyTest01 myTest01 = new MyTest01();myTest01.hello("hello");}public void hello(String str){System.out.println(str);}
}

通过jclasslib插件查看指令:

  1. 有两个方法,分别是main方法和hello方法
  2. hello方法是成员方法都,所以LacalVariableTable(局部变量表)中看似只有一个参数,实则有两个参数,表的第一个位置放的是this。
  3. 所以在成员方法中能看到几个变量就是几个变量+1个参数,因为在成员方法中,默认在方法中放了一个this的参数。
    在这里插入图片描述

1.3.2. Operand Stack(操作栈)

这个理解为一个栈帧中的小栈,叫做操作栈,用来做数据操作的地方。
每个线程都有一个栈,每个栈有多个栈帧,每个栈帧里都有一个Operand stack(操作栈)

根据不同的指令在栈里做相关的处理。我们先需要了解一下指令集。详细见第2章指令集。

1.3.3. Dynamic Linking (动态链接)

指向常量池的的linking。链接

1.3.4. return address (返回地址)

a() -> b(),方法a调用了方法b, b方法的返回值放在什么地方。
就是说一个方法就是一个栈帧,那么这个方法有返回值,这个返回值的地址就是这个return address。
​​​​ ​​​​​​​

1.4 native method stacks 本地方法栈。

调用c c++的方法。

1.5 direct Memory 直接内存

  1. 不归属jvm管理,归属操作系统管理
    在之前,当有io数据传递过来,会存储到操作系统的内核空间内存中,当jvm要使用的时候,需要拷贝一份数据到jvm中。有拷贝的过程
    现在有了直接内存,直接内存直接去读取os内核的内存,不需要在去拷贝。零拷贝
  2. JVM可以直接访问的内核空间的内存 (OS 管理的内存)
  3. NIO , 提高效率,实现zero copy

1.6 method area 方法区

存储每一个class的结构,常量池等。method area是一个概念上的东西。

  1. Prem Space(<1.8),jdk1.8之前
    在1.8之前方法区的具体实现就叫Prem generation。可以理解为1.8之前方法区就叫做Prem generation
    字符串常量位于Permgeneration, FGC不会清理, 大小启动的时候指定,不能变。
  2. Meta Space(>1.8),jdk1.8之后
    在1.8之后方法区的具体实现就叫Meta Space,可以理解为1.8之前方法区就叫做MateSpace。
    字符串常量位于堆,会触发FGC清理,不设定大小的话,最大就是物理内存

如何证明: 1.7 字符串常量位于Perm,而1.8位于Heap中
提示:结合GC, 一直创建字符串常量,观察堆,和Metaspace

jdk1.8之前,jvm的对内存分为新生代+老年代+持久代。而持久代就是perm generation。方法区(Method
Area)与Java堆一样,是各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。虽然Java虚拟机规范把方法区描述为堆的一个逻辑部分,但是它却有一个别名叫做Non-Heap(非堆),目的应该是与Java堆区分开来。很多人都更愿意把方法区称为“永久代”(Permanent
Generation)。

jdk1.7之前永久代包含字符串常量池,静态变量等。而在jdk1.7的Hotspot中,已经将字符串常量池,静态变量等移动heap堆中了,不在永久代中了。

jdk1.8中,永久代已经不存在,存储的类信息、编译后的代码数据等已经移动到了元空间(MetaSpace)中,元空间并没有处于堆内存上,而是直接占用的本地内存(NativeMemory)。而字符串常量池,静态变量等移动heap堆中。

元空间的本质和永久代类似,都是对JVM规范中方法区的实现。不过元空间与永久代之间最大的区别在于:元空间并不在虚拟机中,而是使用本地内存。因此,默认情况下,元空间的大小仅受本地内存限制,但可以通过以下参数来指定元空间的大小:
  -XX:MetaspaceSize,初始空间大小,达到该值就会触发垃圾收集进行类型卸载,同时GC会对该值进行调整:如果释放了大量的空间,就适当降低该值;如果释放了很少的空间,那么在不超过MaxMetaspaceSize时,适当提高该值。
  -XX:MaxMetaspaceSize,最大空间,默认是没有限制的。
  除了上面两个指定大小的选项以外,还有两个与 GC 相关的属性:
  -XX:MinMetaspaceFreeRatio,在GC之后,最小的Metaspace剩余空间容量的百分比,减少为分配空间所导致的垃圾收集
  -XX:MaxMetaspaceFreeRatio,在GC之后,最大的Metaspace剩余空间容量的百分比,减少为释放空间所导致的垃圾收集

简单理解就是:
在Java7之前,HotSpot虚拟机中将GC分代收集扩展到了方法区,使用永久代来实现了方法区。这个区域的内存回收目标主要是针对常量池的回收和对类型的卸载。而在Java8中,已经彻底没有了永久代,将方法区直接放在一个与堆不相连的本地内存区域,这个区域被叫做元空间。

1.7. Heap 堆

gc 补充
​​

2. 指令集

指令集的分类:

  1. 基于寄存器的指令集
  2. 基于栈的指令集
    Hotspot中的Local Variable Table = JVM中的寄存器

2.1 创建对象的指令

  1. 先来分析一个创建对象的指令集,仅分析main方法中MyTest01 myTest01 = new MyTest01();这一个指令
    源代码:MyTest01 myTest01 = new MyTest01();
package com.tzw.classMode;public class MyTest01 {public static void main(String[] args) {MyTest01 myTest01 = new MyTest01();myTest01.hello("hello");}public void hello(String str){System.out.println(str);}
}
  1. 这个类经过翻译的字节码指令集如下。
    前四行就是MyTest01 myTest01 = new MyTest01();操作。
 0 new #2 <com/tzw/classMode/MyTest01>3 dup4 invokespecial #3 <com/tzw/classMode/MyTest01.<init> : ()V>7 astore_18 aload_19 ldc #4 <hello>
11 invokevirtual #5 <com/tzw/classMode/MyTest01.hello : (Ljava/lang/String;)V>
14 return
  1. 分析:(查看jvm指令集文档https://docs.oracle.com/javase/specs/jvms/se16/html/jvms-6.html#jvms-6.5.dup)
    (1) new 。 new一个空间,将地址存入opeand stacks。类此时赋值为默认值。
    (2)dup 。文档意思:Duplicate the top operand stack value。 在opeand stacks中在复制一份地址。此时opeand中有两个地址。
    (3)invokespecial 调用构造方法,同时将复制的那个地址从operand stack中弹出用来使用,类此时赋值为初始化。
    (4)astore_1 。 将operand stack 中对象空间地址弹出,并赋值带变量值myTest01。这就是为什么我们打印一个对象时打印的是一个地址。
    上面4步完成了MyTest01 myTest01 = new MyTest01();操作。

2.2 继续深入

上述已经完成了对象的创建,但是这个方法还没有完成,我们继续来读指令。
(5)aload_1 ,再次将变量表中第1个位置的变量值那出来压栈。就是将myTest01拿出来压栈。
(6)ldc ,将参数值“hello” 推到常量池中
(7)invokeviirtual ,调用hello()方法。接下来的事就到了另一个方法或者栈帧中。
(8)return 返回。

分析一下hello()方法:hello方法的指令集为

0 getstatic #6 <java/lang/System.out : Ljava/io/PrintStream;>
3 aload_1
4 invokevirtual #7 <java/io/PrintStream.println : (Ljava/lang/String;)V>
7 return

(1)getstatic 调用静态方法System.out
(2) aload_1将变量s的值压栈
(3)invokevirtual,调用成员方法 println。
(4)返回。

2.3 常用指令集

  1. astore_x,将值存储到局部变量表第x个位置的变量名上
  2. aload_x,将第x个位置的变量的值取出压栈。
  3. pop 弹栈
  4. mul 乘
  5. sub 减
  6. invoke系列:
  7. InvokeStatic 调用静态方法
  8. InvokeVirtual 调用成员方法/实例方法

自带多态。什么意思呢?比如说一个类有多个子类。
在调用实例方法时,new的是哪个子类,就是调用这个子类的方法。
首先需要将对象实例化,并赋值给变量。
调用方法,将该变量压栈,然后调用栈里的对象的方法。

  1. InvokeInterface 接口调用方法
    eg:
List list = new ArrayList();
list.add();
  1. InovkeSpecial 构造方法,private 方法,不需要多态的方法等可以直接定位的方法
  2. InvokeDynamic
    JVM最难的指令,lambda表达式或者反射或者其他动态语言scala kotlin,或者CGLib ASM,动态产生的class,会用到的指令

这篇关于jvm(3)-运行时数据区、指令集的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/953899

相关文章

Java实现检查多个时间段是否有重合

《Java实现检查多个时间段是否有重合》这篇文章主要为大家详细介绍了如何使用Java实现检查多个时间段是否有重合,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录流程概述步骤详解China编程步骤1:定义时间段类步骤2:添加时间段步骤3:检查时间段是否有重合步骤4:输出结果示例代码结语作

Java中String字符串使用避坑指南

《Java中String字符串使用避坑指南》Java中的String字符串是我们日常编程中用得最多的类之一,看似简单的String使用,却隐藏着不少“坑”,如果不注意,可能会导致性能问题、意外的错误容... 目录8个避坑点如下:1. 字符串的不可变性:每次修改都创建新对象2. 使用 == 比较字符串,陷阱满

Java判断多个时间段是否重合的方法小结

《Java判断多个时间段是否重合的方法小结》这篇文章主要为大家详细介绍了Java中判断多个时间段是否重合的方法,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录判断多个时间段是否有间隔判断时间段集合是否与某时间段重合判断多个时间段是否有间隔实体类内容public class D

IDEA编译报错“java: 常量字符串过长”的原因及解决方法

《IDEA编译报错“java:常量字符串过长”的原因及解决方法》今天在开发过程中,由于尝试将一个文件的Base64字符串设置为常量,结果导致IDEA编译的时候出现了如下报错java:常量字符串过长,... 目录一、问题描述二、问题原因2.1 理论角度2.2 源码角度三、解决方案解决方案①:StringBui

Java覆盖第三方jar包中的某一个类的实现方法

《Java覆盖第三方jar包中的某一个类的实现方法》在我们日常的开发中,经常需要使用第三方的jar包,有时候我们会发现第三方的jar包中的某一个类有问题,或者我们需要定制化修改其中的逻辑,那么应该如何... 目录一、需求描述二、示例描述三、操作步骤四、验证结果五、实现原理一、需求描述需求描述如下:需要在

Java中ArrayList和LinkedList有什么区别举例详解

《Java中ArrayList和LinkedList有什么区别举例详解》:本文主要介绍Java中ArrayList和LinkedList区别的相关资料,包括数据结构特性、核心操作性能、内存与GC影... 目录一、底层数据结构二、核心操作性能对比三、内存与 GC 影响四、扩容机制五、线程安全与并发方案六、工程

JavaScript中的reduce方法执行过程、使用场景及进阶用法

《JavaScript中的reduce方法执行过程、使用场景及进阶用法》:本文主要介绍JavaScript中的reduce方法执行过程、使用场景及进阶用法的相关资料,reduce是JavaScri... 目录1. 什么是reduce2. reduce语法2.1 语法2.2 参数说明3. reduce执行过程

如何使用Java实现请求deepseek

《如何使用Java实现请求deepseek》这篇文章主要为大家详细介绍了如何使用Java实现请求deepseek功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1.deepseek的api创建2.Java实现请求deepseek2.1 pom文件2.2 json转化文件2.2

Java调用DeepSeek API的最佳实践及详细代码示例

《Java调用DeepSeekAPI的最佳实践及详细代码示例》:本文主要介绍如何使用Java调用DeepSeekAPI,包括获取API密钥、添加HTTP客户端依赖、创建HTTP请求、处理响应、... 目录1. 获取API密钥2. 添加HTTP客户端依赖3. 创建HTTP请求4. 处理响应5. 错误处理6.

Spring AI集成DeepSeek的详细步骤

《SpringAI集成DeepSeek的详细步骤》DeepSeek作为一款卓越的国产AI模型,越来越多的公司考虑在自己的应用中集成,对于Java应用来说,我们可以借助SpringAI集成DeepSe... 目录DeepSeek 介绍Spring AI 是什么?1、环境准备2、构建项目2.1、pom依赖2.2