资讯专栏INFORMATION COLUMN

JVM运行时数据区

Loong_T / 2420人阅读

摘要:运行时数据区域之所以要划分这么多区域出来是因为这些区域都有自己的用途,以及创建和销毁的时间。,运行时常量池它是方法区的一部分。直接内存直接内存并不是虚拟机运行时数据区的一部分,也不是虚拟机规范中定义的内存区域。

前言

说到JAVA内存区域,可能很多人第一反应是“堆栈”。
首先,堆栈不是一个概念,而是两个概念,堆和栈是两块不同的内存区域,简单理解的话,堆是用来存放对象而栈是用来运行程序的。
其次,堆内存和栈内存的这种划分方式比较粗糙,这种划分方式只能说明大多数程序员最关注的、与对象内存分配关系最密切的内存区域是这两块,Java内存区域划分实际上远比这复杂。
对于Java程序员来说,在虚拟机自动内存管理机制的帮助下,不再需要为每一个new操作去配对deleted/free代码,不容易出现内存泄漏和内存溢出问题。
但是,也正是因为Java把内存控制权交给了虚拟机,一旦出现内存泄漏和内存溢出的问题,就难以排查,因此一个好的Java程序员应该去了解虚拟机的内存区域以及会引起内存泄漏和内存溢出的场景。

运行时数据区域

之所以要划分这么多区域出来是因为这些区域都有自己的用途,以及创建和销毁的时间。有些区域随着虚拟机进程的启动而存在,有的区域则依赖用户线程的启动和结束而销毁和建立。

1.线程独有的内存区域
(1) PROGRAM COUNTER REGISTER,程序计数器
这块内存区域很小,它是当前线程所执行的字节码的行号指示器,字节码解释器通过改变这个计数器的值来选取下一条需要执行的字节码指令。Java方法这个计数器才有值,如果执行的是一个Native方法,那这个计数器是空的。

(2) JAVA STACK,虚拟机栈
生命周期和线程周期相同。每个方法执行的同时都会创建一个栈帧,用于存储局部变量表、操作数栈、动态链接、方法出口等信息,每一个方法从调用至执行完毕的过程,就对应一个栈帧在虚拟机栈中入栈到出栈的过程。栈的大小和具体JVM的实现有关,通常在256K~756Kz之间。

(3) NATIVE METHOD STACK,方法栈
和虚拟机栈起的作用一样,只不过方法栈为虚拟机使用到的Native方法服务。虚拟机规范并没有对这个区域有什么强制规定,因此我们使用的HotSpot虚拟机,就干脆没有这块区域了,它和虚拟机栈是一起的。

2.线程间共享的内存区域

(1) HEAP,堆
大多数应用,堆都是Java虚拟机所管理的内存中最大的一块,它在虚拟机启动时创建,此内存唯一目的就是存放对象实例。由于现在垃圾收集器采用的基本都是分代收集算法,所以堆还可以细分为新生代和老年代,再细致一点还有Eden区、From Survivor区、To Survivor区。

(2) METHOD AREA,方法区
这块区域用于存储虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据,虚拟机规范是把这块区域描述为堆的一个逻辑部分的,但实际它应该是要和堆区分开的。从上面提到的分代收集算法的角度来看,HotSpot中,方法区≈永久代。不过JDK7之后,我们使用的HotSpot应该就没有永久代这个概念了,会采用Native Memory来实现方法区的规划了。

(3) RUNTIME CONSTANT POOL,运行时常量池
它是方法区的一部分。Class文件中除了有类的版本信息、字段、方法、接口等描述信息外,还有一项信息就是常量池,用于存放编译期间生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中,另外翻译出来的直接引用也会存储在这个区域中。

(在JVM中,类从被加载到虚拟机内存中开始,到卸载出内存为止,它的整个生命周期包括:加载、验证、准备、解析、初始化、使用和卸载7个阶段。而解析阶段即是虚拟机将常量池内的符号引用替换为直接引用的过程。

在Java中,一个java类将会编译成一个class文件。在编译时,java类并不知道所引用的类的实际地址,因此只能使用符号引用来代替。而解析阶段即是虚拟机将常量池内的符号引用替换为直接引用的过程,翻译出来的直接引用也是存储在方法区的运行时常量池中。)

3.直接内存
直接内存并不是虚拟机运行时数据区的一部分,也不是Java虚拟机规范中定义的内存区域。但是这部分内存也被频繁地使用,而且也可能导致内存溢出的问题。JDK1.4中新增加了NIO,引入了一种基于通道与缓冲区的I/O方式,它可以使用Native函数库直接分配堆外内存,然后通过一个存储在Java堆中的DirectByteBuffer对象作为这块内存的引用进行操作。这样能在一些场景中显著提高性能,因为避免了在Java堆和Native堆中来回复制数据。显然本机直接内存的分配不会受到Java堆大小的限制,但是,既然是内存,肯定还是会受到本机总内存大小及处理器寻址空间的限制。

对象创建

我们来看一下在虚拟机层面上创建对象的步骤:
1.虚拟机遇到一条new指令,首先去检查这个指令的参数能否在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已经被加载、解析和初始化。如果没有,那么必须执行类的初始化过程。

2.类加载检查通过后,虚拟机为新生对象分配内存。对象所需内存大小在类加载完成后便可以完全确定,为对象分配空间无非是从Java堆中划分出一个确定大小的内存而已。这个地方会有两个问题:
(1) 如果内存是规整的,那么虚拟机将采用的是指针碰撞法来为对象分配内存。意思是所有用过的内存在一边,空闲的内存在另一边,中间放着一个指针作为分界点指示器,分配内存就仅仅是把指针向空闲那边挪动一段与对象大小相等的距离罢了。如果垃圾收集器选择的是Serial、ParNew这种基于压缩算法的,虚拟机采用这种分配方式。
(2) 如果内存不是规整的,已使用的内存和未使用的内存相互交错,那么虚拟机将采用的是空闲列表法来为对象分配内存。意思是虚拟机维护了一个列表记录了哪些内存是可用的,再分配的时候从列表中找到一块足够大的空间划分给实例,并更新列表上的内容。如果垃圾收集器选择是CMS这种基于标记-清除(Mark-Sweep)算法的,虚拟机采用这种分配方式。
简言之,
垃圾收集器选择的是Serial、ParNew这种基于Compact(压缩)算法的,虚拟机采用指针碰撞法为对象分配内存;
垃圾收集器选择是CMS这种基于Mark-Sweep(标记-清除)算法的,虚拟机采用空闲列表法为对象分配内存。
另外一个问题即是保证new对象时候的线程安全。因为可能出现虚拟机正在给对象A分配内存,指针还没有来得及修改,对象B又同时使用了原来的指针来分配内存的情况。虚拟机采用了CAS配上失败重试和TLAB两种方式保证更新操作的原子性来解决这个问题。
(每个线程在Java堆中预先分配一小块内存,成为本地线程分配缓冲区——TLAB,线程内部需要分配内存时直接在TLAB上分配就行,避免了线程冲突。只有当缓冲区的内存用光需要重新分配内存的时候才会进行CAS操作分配更大的内存空间。虚拟机是否使用TLAB,可以通过-XX:+/-UseTLAB参数来进行配置,但是JDK5及以后的版本默认是启用TLAB的)

3.内存分配结束,虚拟机讲分配到的内存空间都初始化为零值(不包括对象头)。这一步保证了对象的实例字段在Java代码中可以不用赋初始值就可以直接使用,程序能访问到这些字段的数据类型所对应的零值。

4.对对象进行必要的配置,例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希吗、对象的GC分代年龄等信息,这些信息存放在对象的对象头中。

5.执行方法,把对象按照程序员的意愿进行初始化,这样一个真正可用的对象才算完全产生出来。

对象定位方式

建立对象是为了使用对象,我们的Java程序需要通过栈上的reference数据来操作对上的具体对象。
比如,Object obj = new Object();而new Object()之后其实有两部分内容:一部分是类数据(方法区)、一部分是实例数据(堆)。
由于reference类型在Java虚拟机规范里面只规定了是一个指向对象的引用,并没有定义这个引用应该通过什么方式去定位、访问到堆中的对象的具体位置,对象访问方式也是取决于虚拟机实现而定的。主流的访问方式有使用句柄和直接指针两种。

1.使用句柄

在Java堆中将会划分出一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象实例与类型数据的具体各自的地址信息,

2.使用直接指针

使用直接指针访问的话,Java堆对象的布局中就必须考虑如何放置访问类型数据的相关信息,reference中存储的直接就是对象地址,

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/69081.html

相关文章

  • 对于JVM,你就只知道堆和栈吗?

    摘要:下面的截图内容来自从规范我们可以看到,规范要求的运行时数据区域有程序计数器虚拟机栈堆方法区本地方法栈运行时常量池这及部分。查了一下,还是没有查到官方对于运行时数据区域的说明,但是许多博客都指出将字符串常量池移动到了堆中。 不少java程序员一提JVM运行时数据区域,就会说堆和栈,当然也有java程序员给出方法区、虚拟机栈、本地方法栈、堆、程序计数器这个答案,但是还有人给出永久代、虚拟机...

    王笑朝 评论0 收藏0
  • 【译】JVM框架说明

    摘要:框架说明开发者都知道会执行字节码。但是可能大多数人都不知道一个事实是的实现,它分析字节码,解释并执行代码。执行引擎字节码加载到运行时数据区后,会被执行引擎执行。解释器更快的解释字节码,但是执行非常慢。垃圾收集收集并移除不再被使用的对象。 JVM框架说明 java开发者都知道JRE(Java Runtime Environment)会执行字节码。但是可能大多数人都不知道一个事实:JRE是...

    tracymac7 评论0 收藏0
  • 一文了解JVM

    摘要:而使用虚拟机是实现这一特点的关键。每个字节码指令都由一个字节的操作码和附加的操作数组成。字节码可以通过以下两种方式转换成合适的语言解释器一条一条地读取,解释并执行字节码执行,所以它可以很快地解释字节码,但是执行起来会比较慢。 一、什么是JVM JVM是Java Virtual Machine(Java 虚拟机)的缩写,JVM是一种用于计算设备的规范,它是一个虚构出来的计算机,是通过在实...

    whatsns 评论0 收藏0
  • Java GC

    摘要:对字节码文件进行解释执行,把字节码翻译成相关平台上的机器指令。使用命令可对字节码文件以及配置文件进行打包可对一个由多个字节码文件和配置文件等资源文件构成的项目进行打包。和不存在永久代这种说法。 Java技术体系 从广义上讲,Clojure、JRuby、Groovy等运行于Java虚拟机上的语言及其相关的程序都属于Java技术体系中的一员。如果仅从传统意义上来看,Sun官方所定义的Jav...

    justCoding 评论0 收藏0
  • 万万没想到,JVM内存结构的面试题可以问的这么难?

    摘要:方法区在实际内存空间站可以是不连续的。这一规定,可以说是给了虚拟机厂商很大的自由。但是值得注意的是,堆其实还未每一个线程单独分配了一块空间,这部分空间在分配时是线程独享的,在使用时是线程共享的。 在我的博客中,之前有很多文章介绍过JVM内存结构,相信很多看多我文章的朋友对这部分知识都有一定的了解了。 那么,请大家尝试着回答一下以下问题: 1、JVM管理的内存结构是怎样的? 2、不同的...

    CloudwiseAPM 评论0 收藏0
  • Java程序员:不识Jvm真面目,只缘身在增删查改中

    摘要:编译器只需面向,生成能理解的代码或字节码文件。源文件经编译器,编译成字节码程序,通过将每一条指令翻译成不同平台机器码,通过特定平台运行。涨见识,字节码执行过程分析。解决办法减少默认栈的容量来换取更多的线程支持。 前言 JVM是java的核心和基础,在java编译器和os平台之间的虚拟处理器。它是一种基于下层的操作系统和硬件平台并利用软件方法来实现的抽象的计算机,可以在上面执行java的...

    or0fun 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<