Java記憶體區域有哪些構成?

2023-01-09 15:00:37

作者:小牛呼嚕嚕 | https://xiaoniuhululu.com
計算機內功、JAVA底層、面試相關資料等更多精彩文章在公眾號「小牛呼嚕嚕

大家好,我是呼嚕嚕,這次我們一起來看看Java記憶體區域,本文 基於HotSpot 虛擬機器器,JDK8, 乾貨滿滿

前言

Java 記憶體區域, 也叫執行時資料區域、記憶體區域、JVM記憶體模型,和 Java 虛擬機器器(JVM)的執行時區域相關,是指 JVM執行時將資料分割區域儲存,強調對記憶體空間的劃分。
經常與Java記憶體模型(JMM)混淆,其定義了程式中各個變數的存取規則,即在虛擬機器器中將變數儲存到記憶體和從記憶體中取出變數這樣的底層細節。
JVM並不是只有唯一版本的,在Java發展歷史中,有許多優秀的Java虛擬機器器,其中目前大家最熟悉的就是HotSpot虛擬機器器,什麼你不知道?

我們去Oracle官網,下載JDK,其自帶的虛擬機器器,就是HotSpot。

HotSpot VM的最大特色:熱點程式碼探測,其可以通過執行計數器,找出最具有編譯價值的程式碼,然後通知JIT編譯器進行編譯,通過編譯器和直譯器的協同合作,在最優程式響應時間和最佳執行效能中取得平衡。

簡單介紹一下,上圖的主要組成部分:

  • 類載入器系統:主要用於子系統將編譯好的.class檔案載入到JVM中,瞭解見:類載入器
  • 執行引擎:包括即時編譯器和垃圾回收器,即時編譯器將Java位元組碼編譯成具體的機器碼,垃圾回收器用於回收在執行過程中不再使用的物件
  • 本地庫介面:用於呼叫作業系統的本地方法庫,完成具體的指令操作
  • 執行時資料區:用於儲存在JVM執行過程中產生的資料,不同的虛擬機器器在記憶體分配上也略有差異,但總體來說都遵循《Java虛擬機器器規範》。在《Java虛擬機器器規範》中規定了五種虛擬機器器執行時資料區,他們分別為:程式計數器、Java虛擬機器器棧、本地方法棧、本地方法區、堆 以及方法區。下文我們以此圖為基準,詳細地分析各個部分,慢慢道來

Java 記憶體區域

程式計數器

程式計數器(Program Counter Register)是用於存放下一條指令所在單元地址的一塊記憶體,在虛擬機器器的規範裡,位元組碼解析器的工作是通過改變這個計數器的值來選取下一條需要執行的位元組碼指令,分支、迴圈、跳轉、例外處理、執行緒恢復等基礎功能都需要依賴這個計數器來完成。

我們來對Java中class檔案反編譯:

在JVM邏輯上規定,程式計數器是一塊較小的記憶體空間,可以看作是當前執行緒所執行位元組碼的行號指示器,PC暫存器,也叫"程式計數器",其是CPU中暫存器的一種,偏硬體概念

由於程式計數器儲存了 下一條指令要執行地址,所以在JVM中,執行指令的一般過程:執行引擎會從 程式計數器中獲得下一條指令的地址,拿到其對應的操作指令,對其進行執行,當該指令結束,位元組碼直譯器根據pc暫存器裡的值選取下一條指令並修改pc暫存器裡面的值,達到執行下一條指令的目的,周而復始直至程式結束。

位元組碼直譯器可以拿到所有的位元組碼指令執行順序,而程式計數器只是為了記錄當前執行的位元組碼指令地址,防止執行緒切換找不到下一條指令地址

我們知道作業系統中執行緒是由CPU排程來執行指令的,JVM的多執行緒是通過CPU時間片輪轉來實現的,某個執行緒在執行的過程中可能會因為時間片耗盡而掛起。當它再次獲取時間片時,需要從掛起的地方繼續執行。在JVM中,通過程式計數器來記錄程式的位元組碼執行位置。

執行程式在單執行緒情況下還好,但在多執行緒的情況下:執行緒在執行的指令時,CPU可能切換執行緒,去另一個更緊急的指令,執行完再繼續執行先前的指令。特別是單核CPU的情況下,CPU會頻繁的切換執行緒,"同時"執行多個任務。為了CPU切換執行緒後,依舊能恢復到先前指令執行的位置,這就需要每個執行緒有自己獨立的程式計數器,互不影響。我們可以發現程式計數器是執行緒私有的,每條執行緒都有一個程式計數器。

程式計數器是java虛擬機器器規範中唯一一個沒有規定任何OutofMemeryError(記憶體漏失)的區域,它的生命週期隨著執行緒的建立而建立,隨著執行緒的結束而死亡。因為當前執行緒正在執行Java中的方法,程式計數器記錄的就是正在執行虛擬機器器位元組碼指令的地址,如果是Native方法,這個計數器就為空(undefined)

PC暫存器(程式計數器)與JVM中的程式計數器還是有所區別的:

  1. PC暫存器永遠指向下一條待執行指令的記憶體地址(永遠不會為undefined),並且在程式開始執行前,將程式指令序列的起始地址,即程式的第一條指令所在的記憶體單元地址送入PC, CPU按照PC的指示從記憶體讀取第一條指令(取指)
  2. 當執行指令時,CPU會自動地修改PC的內容,即每執行一條指令PC增加一個量,這個量等於指令所含的位元組數(指令位元組數),使PC總是指向下一條將要取指的指令地址。
  3. 由於大多數指令都是按順序來執行的,所以修改PC的過程通常只是簡單的對PC 加「指令位元組數」。當程式轉移時,轉移指令執行的最終結果就是要改變PC的值,此PC值就是轉去的目標地址。處理器總是按照PC指向,取指、譯碼、執行,以此實現了程式轉移。

虛擬機器器棧

虛擬機器器棧(JVM Stacks),和資料結構上的棧類似,先進後出。其與程式計數器一樣,也是執行緒私有的,其生命週期和執行緒相同,隨著執行緒的建立而建立,隨著執行緒的死亡而死亡。

虛擬機器器棧描述的是Java方法執行的記憶體模型:每個方法在執行的同時都會建立一個棧幀,用於儲存區域性變數表、運算元棧、動態連線、方法出口等資訊。棧幀在虛擬機器器棧中入棧到出棧(順序: 先進後出)的過程,其實就對應Java中方法的呼叫至執行完成的過程

棧幀是用於支援虛擬機器器進行方法呼叫和方法執行的資料結構,它是虛擬機器器執行時資料區中的虛擬機器器棧的棧元素,每個棧幀儲存了方法的變數表、運算元棧、動態連線和方法返回等資訊。

其中:

  1. 在當前活動執行緒中,只有位於棧頂的幀才是有效的,稱為當前棧幀。正在執行的方法稱為當前方法,棧幀是方法執行的基本結構。在執行引擎執行時,所有指令都只能針對當前棧幀進行操作。
  2. 方法呼叫的資料需要通過棧進行傳遞,每一次方法呼叫都會有一個對應的棧幀被壓入棧中,每一個方法呼叫結束後,都會有一個棧幀被彈出。
  3. 每個棧幀包含四個區域:區域性變數表、運算元棧、動態連線、返回地址
  4. 在《Java虛擬機器器規範》中,對這個記憶體區域規定了兩類異常狀況:
  • 如果執行緒請求的棧深度大於虛擬機器器所允許的深度,將丟擲StackOverflowError異常
  • 如果Java虛擬機器器棧容量可以動態擴充套件,當棧嘗試擴充套件時無法申請到足夠的記憶體或為一個新執行緒初始化JVM棧時沒有足夠的記憶體時會丟擲OutOfMemoryError異常。《Java虛擬機器器規範》明確允許Java虛擬機器器實現自行選擇是否支援棧的動態擴充套件HotSpot虛擬機器器是選擇不支援擴充套件,所以HotSpot虛擬機器器線上程執行時是不會因為擴充套件而導致OutOfMemoryError(記憶體溢位)的異常

我們下面主要介紹一下棧幀的結構:

  1. 區域性變數表

區域性變數表:是存放方法引數和區域性變數的區域,主要存放了編譯期可知的各種資料型別(boolean、byte、char、short、int、float、long、double)、物件參照(reference 型別,它不同於物件本身,可能是一個指向物件起始地址的參照指標,也可能是指向一個代表物件的控制程式碼或其他與此物件相關的位置)

我們知道區域性變數沒有賦初始值是不能使用的,而全域性變數是放在堆的,有兩次賦值的階段,一次在類載入的準備階段,賦予系統初始值;另外一次在類載入的初始化階段,賦予程式碼定義的初始值。拓展見:類載入器

區域性變數表的容量以 Variable Slot(變數槽)為最小單位,每個變數槽都可以儲存 32 位長度的記憶體空間.基本型別資料以及參照和 returnAddress(返回地址)佔用一個變數槽,long 和 double 需要兩個

在方法執行時,虛擬機器器使用區域性變數表完成引數值到引數變數列表的傳遞過程的,如果執行的是實體方法,那區域性變數表中第 0 位索引的 Slot 預設是用於傳遞方法所屬物件範例的參照(在方法中可以通過關鍵字 this 來存取到這個隱含的引數)其餘引數則按照參數列順序排列,佔用從 1 開始的區域性變數 Slot。關鍵字this詳解
我們可以寫個例子驗證一下

public class Test {
    void fun(){
    }
}

javac -g:vars Test.java生成Test.class檔案,一定要加引數-g:vars,不然反編譯時,無法顯示區域性變數表LocalVariableTable
我們接著反編譯一下:

javap -v Test


Classfile /D:/GiteeProjects/study-java/study/src/com/company/test3/Test.class
  Last modified 2022-11-20; size 261 bytes
  MD5 checksum 72c7d1fcc5d83dd6fc82c43ae55f2b34
public class com.company.test3.Test
  minor version: 0
  major version: 52
  flags: ACC_PUBLIC, ACC_SUPER
Constant pool:
   #1 = Methodref          #3.#11         // java/lang/Object."<init>":()V
   #2 = Class              #12            // com/company/test3/Test
   #3 = Class              #13            // java/lang/Object
   #4 = Utf8               <init>
   #5 = Utf8               ()V
   #6 = Utf8               Code
   #7 = Utf8               LocalVariableTable
   #8 = Utf8               this
   #9 = Utf8               Lcom/company/test3/Test;
  #10 = Utf8               fun
  #11 = NameAndType        #4:#5          // "<init>":()V
  #12 = Utf8               com/company/test3/Test
  #13 = Utf8               java/lang/Object
{
  public com.company.test3.Test();
    descriptor: ()V
    flags: ACC_PUBLIC
    Code:
      stack=1, locals=1, args_size=1
         0: aload_0
         1: invokespecial #1                  // Method java/lang/Object."<init>":()V
         4: return
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
            0       5     0  this   Lcom/company/test3/Test;

  void fun();
    descriptor: ()V
    flags:
    Code:
      stack=0, locals=1, args_size=1
         0: return
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
            0       1     0  this   Lcom/company/test3/Test; //!!!可以看出this在Slot的第0位!!!
}
  1. 運算元棧

運算元棧 主要用於存放方法執行過程中產生的中間計算結果或者臨時變數,通過變數的入棧、出棧等操作來執行計算。
在方法執行的過程中,會有各種位元組碼指令往運算元棧中寫入和提取內容,也就是出棧和入棧操作。我們前文說的JVM執行引擎,是基於棧的執行引擎, 其中的棧指的就是運算元棧

  1. 動態連結

每個棧幀都儲存了 一個 可以指向當前方法所在類的 執行時常數池, 目的是: 當前方法中如果需要呼叫其他方法的時候, 能夠從執行時常數池中找到對應的符號參照, 然後將符號參照轉換為直接參照,然後就能直接呼叫對應方法, 這就是動態連結。本質就是,在方法執行時將符號參照轉為呼叫方法的直接參照,這種參照轉換的過程具備動態性
不是所有方法呼叫都需要動態連結的, 有一部分符號參照會在 類載入階段, 將符號參照轉換為直接參照, 這部分操作稱之為: 靜態解析. 就是編譯期間就能確定呼叫的版本, 包括: 呼叫靜態方法, 呼叫範例的私有構造器, 私有方法, 父類別方法

  1. 返回地址

Java 方法有兩種返回方式:

  • 正常退出,即正常執行到任何方法的返回位元組碼指令,如 return等;
  • 異常退出

無論何種退出情況,都將返回至方法當前被呼叫的位置。方法退出的過程相當於彈出當前棧幀
我們可以發現:棧幀隨著方法呼叫而建立,隨著方法結束而銷燬。無論方法正常完成還是異常完成都算作方法結束.

本地方法棧

本地方法棧(Native Method Stack):是執行緒私有的,其與虛擬機器器棧的作用基本是一樣的,有點區別的是:虛擬機器器棧是服務Java方法的,而本地方法棧是為虛擬機器器呼叫Native方法服務的,通過 JNI (Java Native Interface) 直接呼叫本地 C/C++ 庫,不再受JVM控制。

JNI 類本地方法最著名的應該是 System.currentTimeMillis() ,JNI使 Java 深度使用作業系統的特性功能,複用非 Java 程式碼。 當大量本地方法出現時,勢必會削弱 JVM 對系統的控制力

本地方法被執行的時候,在本地方法棧也會建立一個棧幀,用於存放該本地方法的區域性變數表、運算元棧、動態連結、出口資訊。方法執行完畢後相應的棧幀也會出棧並釋放記憶體空間。與虛擬機器器棧一樣,本地方法棧區域也會丟擲StackOverflowErrorOutOfMemoryError

另外在Java虛擬機器器規範中對於本地方法棧沒有特殊的要求,虛擬機器器可以自由的實現它,因此在HotSpot虛擬機器器直接把本地方法棧和虛擬機器器棧合二為一了。因此對於HotSpot來說,-Xoss引數(設定 本地方法棧大小)雖然存在,但實際上是沒有任何效果的,棧容量只能由-Xss引數來設定。

堆(Heap)是Java虛擬機器器所管理的最大的一塊記憶體區域,是被所有執行緒共用的,Java堆唯一的目的就是存放物件範例幾乎所有的物件範例都在堆上分配記憶體,但是隨著JIT編譯器的發展和逃逸分析技術的逐漸成熟,棧上分配、執行緒本地分配快取(TLAB)也可以存放物件範例

Java虛擬機器器規範規定,Java堆可以處在物理上不連續的記憶體空間中,只要邏輯上連續即可,當前主流的虛擬機器器都是按照可延伸來實現的(通過 -Xmx 和 -Xms 控制)。如果在堆中沒有記憶體完成範例分配,並且堆也無法再擴充套件時,將會丟擲 OutOfMemoryError 異常。

方法區

方法區(Methed Area)用於儲存已被虛擬機器器載入的類資訊、常數、靜態變數、即時編譯後的程式碼等資料。其是所有執行緒共用的記憶體區域。

在Java 虛擬機器器規範把方法區描述為堆的一個邏輯部分,但是它卻有一個別名叫做 Non-Heap(非堆),與 Java 堆區分開來。

方法區是JVM規範的一個概念定義,並不是一個具體的實現,由於Java虛擬機器器對於方法區的限制是非常寬鬆的,因此也就導致了不同的虛擬機器器上方法區有不同的表現,我們還是以HotSpot虛擬機器器為例:

  • 在JDK8前,HotSpot 虛擬機器器對Java虛擬機器器規範中方法區的實現方式是永久代
  • 在JDK8及其以後,HotSpot 虛擬機器器對Java虛擬機器器規範中方法區的實現方式變成了元空間

網上許多文章喜歡拿"永久代"或者"元空間" 來代替方法區,但本質上兩者並不等價。方法區是Java虛擬機器器規範的概念,"永久代"或者"元空間"是方法區的2中實現方式

方法區在JDK7之前是一塊單獨的區域,HotSpot虛擬機器器的設計團隊把GC分代收集擴充套件到了方法區。這樣HotSpot的垃圾收集器就可以向管理Java堆一樣管理這部分記憶體。但是對於其它虛擬機器器(如BEA JRockit、IBM J9等)來說其實是不存在永久代的概念的。

HotSpot的團隊顯然也意識到了,用永久代來實現方法區並不是一個好主意:

  1. 字串存在永久代中,容易出現效能問題和記憶體溢位
  2. 類及方法的資訊等比較難確定其大小,因此對於永久代的大小指定比較困難,太小容易出現永久代溢位,太大則容易導致老年代溢位。
  3. 永久代會為 GC 帶來不必要的複雜度,並且回收效率偏低。

因此,在JDK1.8中完全廢除了「永久代」,使用元空間替代了永久代,其他內容移至元空間,元空間直接在本地記憶體分配。

當方法區無法滿足記憶體分配需求時,將丟擲OutOfMemoryError異常。元空間是使用直接記憶體實現的,我們下文再詳細說。

Java記憶體區域大致就這些了,下面我們再補充幾個比較讓人迷惑的概念

字串常數池

字串屬於參照資料型別,但是可以說字串是Java中使用頻繁的一種資料型別。因此,為了節省程式記憶體,提高效能,Java的設計者開闢了一塊叫字串常數池的區域,用來儲存這些字串,避免字串的重複建立。字串常數池是所有類公用的一塊空間,在一個虛擬機器器中只有一塊常數池區域。

在類載入完成,經過驗證,準備階段之後在堆中生成字串物件範例,然後將該字串物件範例的參照值存到字串常數池中(這裡描述指的是JDK7及以後的HotSpot虛擬機器器)。 在HotSpot虛擬機器器中字串常數池是通過一個StringTable類來實現的。它是一個雜湊表,裡面存的是字串參照

在JDK7以前,字串常數池在方法區(永久代)中,此時常數池中存放的是字串物件。而在JDK7及其以後中,字串常數池從方法區遷移到了堆記憶體,同時將字串物件存到了堆記憶體,只在字串常數池中存入了字串物件的參照。

在JDK7 就已經開始了HotSpot 的永久代的移除工作,主要由於永久代的 GC 回收效率太低。等到JDK 8 的時候,永久代被徹底移除了
Java 程式中通常會有大量的被建立的字串等待回收,將字串常數池放到堆中,能夠更高效及時地回收字串記憶體。

執行時常數池

執行時常數池(Runtime Constant Pool)是方法區的一部分。我們知道Class 檔案中除了有類的版本、欄位、方法、介面等常見描述資訊外,但還有一項資訊是常數池(Constant Pool Table),用於存放編譯期生成的各種字面量,符號參照還有翻譯出來的直接參照,這部分內容將在類載入後進入方法區的執行時常數池中存放。因此,每一個類都會有一個執行時常數池

因為Java語言並不要求常數一定在編譯期間才能生成。也就是並非預置入Class檔案常數池中的內容才能進入執行時常數池,執行期間也可以將新的常數放入常數池中,執行時常數池另外一個重要特徵是具備動態性

既然執行時常數池是方法區的一部分,自然受到方法區記憶體的限制,當常數池無法再申請到記憶體時會丟擲 OutOfMemoryError 異常。

直接記憶體

JDK 8 版本之後 永久代已被元空間取代,元空間使用的就是直接記憶體。直接記憶體(Direct Memory)並不是Java虛擬機器器執行時資料區的一部分,也不是 Java 虛擬機器器規範中定義的記憶體區域。

在 JDK 1.4 中新加入了 NIO,引入了一種基於通道(Channel)與緩衝區(Buffer)的 I/O 方式,它可以使用 Native 函數庫直接分配堆外記憶體,然後通過一個儲存在 Java 堆中的 DirectByteBuffer 物件作為這塊記憶體的參照進行操作。這樣能在一些場景中顯著提高效能,因為避免了在 Java 堆和 Native 堆中來回複製資料。

顯然,本機直接記憶體的分配不會受到 Java 堆大小的限制,但是,既然是記憶體,肯定還是會受到本機總記憶體(包括 RAM 以及 SWAP 區或者分頁檔案)大小以及處理器定址空間的限制。伺服器管理員在設定虛擬機器器引數時,會根據實際記憶體設定 -Xmx 等引數資訊,但經常忽略直接記憶體,使得各個記憶體區域總和大於實體記憶體限制(包括物理的和作業系統級的限制),從而導致動態擴充套件時出現 OutOfMemoryError 異常。

小結

  1. 執行緒私有區域(包括 程式計數器, 虛擬機器器棧, 本地方法棧),生命週期跟隨執行緒的啟動而建立,隨執行緒的結束而銷燬
  2. 執行緒共用區域(包括 方法區 和 堆 ),生命週期跟隨虛擬機器器的啟動而建立,隨虛擬機器器的關閉而銷燬

參考資料:
《深入理解 Java 虛擬機器器:JVM 高階特性與最佳實踐》
《On Java 8》
https://www.cnblogs.com/newAndHui/p/11168791.html
https://blog.csdn.net/qq_20394285/article/details/104673913
https://www.cnblogs.com/czwbig/p/11127124.html


本篇文章到這裡就結束啦,很感謝你能看到最後,如果覺得文章對你有幫助,別忘記關注我!更多精彩的文章
計算機內功、JAVA底層、面試相關資料等更多精彩文章在公眾號「小牛呼嚕嚕