php7垃圾回收機制詳解

2020-07-16 10:06:13

php7 垃圾回收機制詳解

筆者前幾天對這個話題感興趣,於是到網上一搜,幾乎都是 php 5的垃圾回收機制,雖然 php5 到 php7 GC部分做出的改動較小,但我覺得還是有必要單獨做一遍博文出來。 不特意說明的話 php 版本為 7.2

在php中的變數占用的空間,是不需要我們手動回收的。核心幫我們處理了這一部分的工作。相比C,這大大方便了我們的操作。

本篇主要講解 變數的 GC機制

在了解我們 php GC 時,我覺得我有必要介紹一下們的 php 的變數在底層的實現。

zval 的結構

// php 變數對於的c結構體
struct _zval_struct {
    zend_value value;
    union {
       ……
    } u1;
    union {
        ……
    } u2;
};

由於主要講垃圾回收,所以在這裡簡單介紹下 u1 u2 聯合體的功能

u1 結構比較複雜,我認為主要是用於識別變數型別

u2 這裡面大多都是輔助欄位,變數內部功能的實現、提升快取友好性等等

接下來是我們的主角

zend_value 它也是結構體中內嵌的一個聯合體

typedef union _zend_value {
    zend_long         lval;//整形
    double            dval;//浮點型
    zend_refcounted  *counted;//獲取不同型別的gc頭部
    zend_string      *str;//string字串
    zend_array       *arr;//陣列
    zend_object      *obj;//物件
    zend_resource    *res;//資源
    zend_reference   *ref;//是否是參照型別
  
    // 忽略下面的結構,與我們討論無關
    zend_ast_ref     *ast;
    zval             *zv;
    void             *ptr;
    zend_class_entry *ce;
    zend_function    *func;
    struct {
        ZEND_ENDIAN_LOHI(
            uint32_t w1,
            uint32_t w2)
    } ww;
} zend_value;

在 zval的 value中就記錄了參照計數zend_refcounted *counted這個型別,我們的垃圾回收機制也是基於此的。

typedef struct _zend_refcounted_h {
    uint32_t         refcount;          /* reference counter 32-bit */
    union {
        struct {
            ZEND_ENDIAN_LOHI_3(
                zend_uchar    type,
                zend_uchar    flags,    /* used for strings & objects */
                uint16_t      gc_info)  /* keeps GC root number (or 0) and color */
        } v;
        uint32_t type_info;
    } u;
} zend_refcounted_h;

所有的複雜型別的定義, 開始的時候都是zend_refcounted_h結構, 這個結構裡除了參照計數以外, 還有GC相關的結構. 從而在做GC回收的時候, GC不需要關心具體型別是什麼, 所有的它都可以當做zend_refcounted*結構來處理.

變數的自動回收

在php中 除了 array和object型別的變數,其餘大部分是自動回收

php 普通變數的回收和 該變數的參照次數有關。

官方的例子

$a = 1;
$b = $a;
xdebug_debug_zval('a');
$a =10;
xdebug_debug_zval('a');
unset($a);
xdebug_debug_zval('a');

結果

a:
(refcount=2, is_ref=0),int 1
a:
(refcount=1, is_ref=0),int 10
a: no such symbol

可以看到 當$a =10 的時候 涉及到 php的COW(copy-on-write)機制,$b 會複製一份原先的 $a ,解除了他們之間的參照關係,所以a的參照次數(refcount)減少為1。

然後我們uset($a)之後 a的參照次數變為0。這就會被認為是垃圾變數,釋放空間。

在舉一個例子

$a = [1];
$a[1] = &$a;
unset($a);

在 unset($a) 之前 $a 的型別為參照型別

a:
(refcount=2, is_ref=1),
array (size=2)
  0 => (refcount=1, is_ref=0),int 1
  1 => (refcount=2, is_ref=1),
    &array<

7e7c8a99109a88cd2f0316bbbb9f10a.png

unset($a) 之後,就變成這樣

0250d54d3e5bc38329d6684f2cd76a6.png

這時候,我們unset操作時refcount 由2變為1,因為有內部參照指向 $a,所以在外部 其所佔用的空間並不會被銷毀。

然後我們的外部參照已經被中斷了,我們也不能使用它。它就成了一個「孤兒」,在c語言中叫做野指標。在php中叫做迴圈參照。記憶體漏失。想要銷毀變數的話,只能等 php指令碼結束。

迴圈參照造成的記憶體漏失

為了清理這些垃圾,引入了兩個準則

● 如果參照計數減少到零,所在變數容器將被清除(free),不屬於垃圾

● 如果一個zval 的參照計數減少後還大於0,那麼它會進入垃圾週期。其次,在一個垃圾週期中,通過檢查參照計數是否減1,並且檢查哪些變數容器的參照次數是零,來發現哪部分是垃圾。

迴圈參照基本上只會出現在 陣列和物件中,物件是因為它的本身就是參照

object和array的回收過程

php7的垃圾回收包含兩個部分,一個是垃圾收集器,一個是垃圾回收演算法。

垃圾收集器,把剛剛提到的,可能是垃圾的元素收集到回收池中 也就是把變數的 zend_refcount的資訊 放在回收池中。 當回收池的值達到一定額度了,會進行統一處理。

處理的過程呢,就比較簡單。

遍歷回收池中的每一個變數,根據每一個變數,再遍歷每一個成員,如果成員還有巢狀的話繼續遍歷。然後把所有成員的 做模擬的 refcount -1。如果此時外部的變數的 參照次數為 0 。那麼可以視為垃圾,清楚。如果大於0,那麼恢復參照次數,並從垃圾回收池中取出。

垃圾回收的原理

如果你這個變數不是垃圾,那麼它的所有成員變數的參照減一之後,必然不會是總變數的參照為0。

例子

說的比較死,不如舉個例子。剛刷 sf.gg 的時候看到一道關於 GC 的題,我回答了一波。關於GC垃圾回收機制

題目如下

55f71787c38c41eea266f177c769ca0.png

//我的回答
1、只要zval.value的refcount減一,然後缺其refcount的值不為0那麼它就可能是垃圾,進入垃圾週期。
2、進入垃圾池遍歷所有成員,包括其巢狀的成員,都對其做 refcount-1的操作,看外部的參照是否為0。
那麼對於 題主的問題來說,
首先,你要想$a為垃圾,一定要先對 unset($a)操作,那麼此時 $a的 refcount = 2
對於$a[0] refcount-1 不影響外部的$a,
$a[1] refcount-1 ,此時 $a的 refount=1
$a[2] refcount-1 ,此時 $a 的 refount=0 
模擬減結束,那麼此變數被當成垃圾回收。

以上就是php7垃圾回收機制詳解的詳細內容,更多請關注TW511.COM其它相關文章!