PHP 陣列佔用記憶體分析

2020-07-16 10:06:06
下面的做法會佔用多大的記憶體?

list($appid,$openid) = ["testcontent","test"];

測試

$m0 = memory_get_usage();
$k = range(1,200000);
$m1 = memory_get_usage();
echo round(($m1-$m0)/pow(1024,2),4) ."MBn";
foreach ($k as $i){
    $n1 = "kk$i";
    $n2 = "tt$i";
    list($$n1,$$n2) = [$i,$i*3];
}
$m2 = memory_get_usage();
echo round(($m2-$m1)/pow(1024,2),4) ."MBn";
$m1 = memory_get_usage();
foreach ($k as $i){
    $n1 = "kk$i";
    $n2 = "tt$i";
    $$n1 = $i+time();
    $$n2 = 2*time();
}
$m2 = memory_get_usage();
echo round(($m2-$m1)/pow(1024,2),4) ."MBn";

上面執行輸出的結果如下:

27.9404MB
51.3041MB
9.1553MB

可見陣列佔用的記憶體遠大於正常分配的內容

原理

在PHP中都使用long型別來代表數位,沒有使用int型別。大家都明白PHP是一種弱型別的語言,它不會去區分變數的型別,沒有int float char *之類的概念。我們看看php在zend裡面儲存的變數,PHP中每個變數都有對應的 zval,Zval結構體定義在Zend/zend.h裡面,其結構:

typedef struct _zval_struct zval;  
struct _zval_struct {  
    /* Variable information */  
    zvalue_value value;     /* The value 1 12位元組(32位元機是12,64位元機需要8+4+4=16) */  
    zend_uint refcount__gc; /* The number of references to this value (for GC) 4位元組 */  
    zend_uchar type;        /* The active type 1位元組*/  
    zend_uchar is_ref__gc;  /* Whether this value is a reference (&) 1位元組*/  
};

PHP使用一種UNION結構來儲存變數的值,即zvalue_value 是一個union,UNION變數所佔用的記憶體是由最大成員資料空間決定。

typedef union _zvalue_value {  
    long lval;                  /* long value */  
    double dval;                /* double value */  
    struct {                    /* string value */  
        char *val;  
        int len;  
    } str;   
    HashTable *ht;              /* hash table value */  
    zend_object_value obj;      /*object value */  
} zvalue_value;

最大成員資料空間是struct str,指標占*val用4位元組,INT占用4位元組,共8位元組。

struct zval占用的空間為8+4+1+1 = 14位元組,其實呢,在zval中陣列,字串和物件還需要另外的儲存結構,陣列則是一個 HashTable:

HashTable結構體定義在Zend/zend_hash.h.

typedef struct _hashtable {  
    uint nTableSize;//4  
    uint nTableMask;//4  
    uint nNumOfElements;//4  
    ulong nNextFreeElement;//4  
    Bucket *pInternalPointer;   /* Used for element traversal 4*/  
    Bucket *pListHead;//4  
    Bucket *pListTail;//4  
    Bucket **arBuckets;//4  
    dtor_func_t pDestructor;//4  
    zend_bool persistent;//1  
    unsigned char nApplyCount;//1  
    zend_bool bApplyProtection;//1  
#if ZEND_DEBUG  
    int inconsistent;//4  
#endif  
} HashTable;

HashTable 結構需要 39 個位元組,每個陣列元素儲存在 Bucket 結構中:

typedef struct bucket {  
    ulong h;    /* Used for numeric indexing                4位元組 */  
    uint nKeyLength;    /* The length of the key (for string keys)  4位元組 */  
    void *pData;        /* 4位元組*/  
    void *pDataPtr;         /* 4位元組*/  
    struct bucket *pListNext;  /* PHP arrays are ordered. This gives the next element in that order4位元組*/  
    struct bucket *pListLast;  /* and this gives the previous element           4位元組 */  
    struct bucket *pNext;      /* The next element in this (doubly) linked list     4位元組*/  
    struct bucket *pLast;      /* The previous element in this (doubly) linked list     4位元組*/  
    char arKey[1];            /* Must be last element   1位元組*/  
} Bucket;

Bucket 結構需要 33 個位元組,鍵長超過四個位元組的部分附加在 Bucket 後面,而元素值很可能是一個 zval 結構,另外每個陣列會分配一個由 arBuckets 指向的 Bucket 指標陣列, 雖然不能說每增加一個元素就需要一個指標,但是實際情況可能更糟。這麼算來一個陣列元素就會佔用 54 個位元組,與上面的估算幾乎一樣。

一個空陣列至少會佔用 14(zval) + 39(HashTable) + 33(arBuckets) = 86 個位元組,作為一個變數應該在符號表中有個位置,也是一個陣列元素,因此一個空陣列變數需要 118 個位元組來描述和儲存。從空間的角度來看,小型陣列平均代價較大,當然一個指令碼中不會充斥數量很大的小型陣列,可以以較小的空間代價來獲取程式設計上的快捷。但如果將陣列當作容器來使用就是另一番景象了,實際應用經常會遇到多維陣列,而且元素居多。比如10k個元素的一維陣列大概消耗540k記憶體,而10k x 10 的二維陣列理論上只需要 6M 左右的空間,但是按照 memory_get_usage 的結果則兩倍於此,[10k,5,2]的三維陣列居然消耗了23M,小型陣列果然是划不來的。

以上就是PHP 陣列佔用記憶體分析的詳細內容,更多請關注TW511.COM其它相關文章!