php7 垃圾回收機制詳解
筆者前幾天對這個話題感興趣,於是到網上一搜,幾乎都是 php 5的垃圾回收機制,雖然 php5 到 php7 GC部分做出的改動較小,但我覺得還是有必要單獨做一遍博文出來。 不特意說明的話 php 版本為 7.2
在php中的變數占用的空間,是不需要我們手動回收的。核心幫我們處理了這一部分的工作。相比C,這大大方便了我們的操作。
本篇主要講解 變數的 GC機制
在了解我們 php GC 時,我覺得我有必要介紹一下們的 php 的變數在底層的實現。
zval 的結構
// php 變數對於的c結構體 struct _zval_struct { zend_value value; union { …… } u1; union { …… } u2; };
由於主要講垃圾回收,所以在這裡簡單介紹下 u1 u2 聯合體的功能
u1 結構比較複雜,我認為主要是用於識別變數型別
u2 這裡面大多都是輔助欄位,變數內部功能的實現、提升快取友好性等等
接下來是我們的主角
zend_value 它也是結構體中內嵌的一個聯合體
typedef union _zend_value { zend_long lval;//整形 double dval;//浮點型 zend_refcounted *counted;//獲取不同型別的gc頭部 zend_string *str;//string字串 zend_array *arr;//陣列 zend_object *obj;//物件 zend_resource *res;//資源 zend_reference *ref;//是否是參照型別 // 忽略下面的結構,與我們討論無關 zend_ast_ref *ast; zval *zv; void *ptr; zend_class_entry *ce; zend_function *func; struct { ZEND_ENDIAN_LOHI( uint32_t w1, uint32_t w2) } ww; } zend_value;
在 zval的 value中就記錄了參照計數zend_refcounted *counted這個型別,我們的垃圾回收機制也是基於此的。
typedef struct _zend_refcounted_h { uint32_t refcount; /* reference counter 32-bit */ union { struct { ZEND_ENDIAN_LOHI_3( zend_uchar type, zend_uchar flags, /* used for strings & objects */ uint16_t gc_info) /* keeps GC root number (or 0) and color */ } v; uint32_t type_info; } u; } zend_refcounted_h;
所有的複雜型別的定義, 開始的時候都是zend_refcounted_h結構, 這個結構裡除了參照計數以外, 還有GC相關的結構. 從而在做GC回收的時候, GC不需要關心具體型別是什麼, 所有的它都可以當做zend_refcounted*結構來處理.
變數的自動回收
在php中 除了 array和object型別的變數,其餘大部分是自動回收
php 普通變數的回收和 該變數的參照次數有關。
官方的例子
$a = 1; $b = $a; xdebug_debug_zval('a'); $a =10; xdebug_debug_zval('a'); unset($a); xdebug_debug_zval('a');
結果
a: (refcount=2, is_ref=0),int 1 a: (refcount=1, is_ref=0),int 10 a: no such symbol
可以看到 當$a =10 的時候 涉及到 php的COW(copy-on-write)機制,$b 會複製一份原先的 $a ,解除了他們之間的參照關係,所以a的參照次數(refcount)減少為1。
然後我們uset($a)之後 a的參照次數變為0。這就會被認為是垃圾變數,釋放空間。
在舉一個例子
$a = [1]; $a[1] = &$a; unset($a);
在 unset($a) 之前 $a 的型別為參照型別
a: (refcount=2, is_ref=1), array (size=2) 0 => (refcount=1, is_ref=0),int 1 1 => (refcount=2, is_ref=1), &array<
unset($a) 之後,就變成這樣
這時候,我們unset操作時refcount 由2變為1,因為有內部參照指向 $a,所以在外部 其所佔用的空間並不會被銷毀。
然後我們的外部參照已經被中斷了,我們也不能使用它。它就成了一個「孤兒」,在c語言中叫做野指標。在php中叫做迴圈參照。記憶體漏失。想要銷毀變數的話,只能等 php指令碼結束。
迴圈參照造成的記憶體漏失
為了清理這些垃圾,引入了兩個準則
● 如果參照計數減少到零,所在變數容器將被清除(free),不屬於垃圾
● 如果一個zval 的參照計數減少後還大於0,那麼它會進入垃圾週期。其次,在一個垃圾週期中,通過檢查參照計數是否減1,並且檢查哪些變數容器的參照次數是零,來發現哪部分是垃圾。
迴圈參照基本上只會出現在 陣列和物件中,物件是因為它的本身就是參照
object和array的回收過程
php7的垃圾回收包含兩個部分,一個是垃圾收集器,一個是垃圾回收演算法。
垃圾收集器,把剛剛提到的,可能是垃圾的元素收集到回收池中 也就是把變數的 zend_refcount的資訊 放在回收池中。 當回收池的值達到一定額度了,會進行統一處理。
處理的過程呢,就比較簡單。
遍歷回收池中的每一個變數,根據每一個變數,再遍歷每一個成員,如果成員還有巢狀的話繼續遍歷。然後把所有成員的 做模擬的 refcount -1。如果此時外部的變數的 參照次數為 0 。那麼可以視為垃圾,清楚。如果大於0,那麼恢復參照次數,並從垃圾回收池中取出。
垃圾回收的原理
如果你這個變數不是垃圾,那麼它的所有成員變數的參照減一之後,必然不會是總變數的參照為0。
例子
說的比較死,不如舉個例子。剛刷 sf.gg 的時候看到一道關於 GC 的題,我回答了一波。關於GC垃圾回收機制
題目如下
//我的回答 1、只要zval.value的refcount減一,然後缺其refcount的值不為0那麼它就可能是垃圾,進入垃圾週期。 2、進入垃圾池遍歷所有成員,包括其巢狀的成員,都對其做 refcount-1的操作,看外部的參照是否為0。 那麼對於 題主的問題來說, 首先,你要想$a為垃圾,一定要先對 unset($a)操作,那麼此時 $a的 refcount = 2 對於$a[0] refcount-1 不影響外部的$a, $a[1] refcount-1 ,此時 $a的 refount=1 $a[2] refcount-1 ,此時 $a 的 refount=0 模擬減結束,那麼此變數被當成垃圾回收。
以上就是php7垃圾回收機制詳解的詳細內容,更多請關注TW511.COM其它相關文章!