關於PHP浮點數你應該知道的事情

2020-07-16 10:05:51
關於PHP浮點數你應該知道的(All 'bogus' about the float in PHP)

PHP是一種弱型別語言, 這樣的特性, 必然要求有無縫透明的隱式型別轉換, PHP內部使用zval來儲存任意型別的數值, zval的結構如下(5.2為例):

struct _zval_struct {
    /* Variable information */
    zvalue_value value;     /* value */
    zend_uint refcount;
    zend_uchar type;    /* active type */
    zend_uchar is_ref;
};

上面的結構中, 實際儲存數值本身的是zvalue_value聯合體:

typedef union _zvalue_value {
    long lval;                  /* long value */
    double dval;                /* double value */
    struct {
        char *val;
        int len;
    } str;
    HashTable *ht;              /* hash table value */
    zend_object_value obj;
} zvalue_value;

今天的話題, 我們只關注其中的倆個成員, lval和dval, 我們要意識到, long lval是隨著編譯器, OS的字長不同而不定長的, 它有可能是32bits或者64bits, 而double dval(雙精度)由IEEE 754規定, 是定長的, 一定是64bits.

請記住這一點, 造就了PHP的一些程式碼的」非平台無關性」. 我們接下來的討論, 除了特別指明, 都是假設long為64bits

IEEE 754的浮點計數法, 我這裡就不參照了, 大家有興趣的可以自己檢視, 關鍵的一點是, double的尾數採用52位bit來儲存, 算上隱藏的1位有效位, 一共是53bits.

在這裡, 引出一個很有意思的問題, 我們用c程式碼舉例(假設long為64bits):

  long a = x;
    assert(a == (long)(double)a);

請問, a的取值在什麼範圍內的時候, 上面的程式碼可以斷言成功?(留在文章最後解答)

現在我們回歸正題, PHP在執行一個指令碼之前, 首先需要讀入指令碼, 分析指令碼, 這個過程中也包含著, 對指令碼中的字面量進行zval化, 比如對於如下指令碼:

<?php
$a = 9223372036854775807; //64位元有符號數最大值
$b = 9223372036854775808; //最大值+1
var_dump($a);
var_dump($b);

輸出:

int(9223372036854775807)
float(9.22337203685E+18)

也就說, PHP在詞法分析階段, 對於一個字面量的數值, 會去判斷, 是否超出了當前系統的long的表值範圍, 如果不是, 則用lval來儲存, zval為IS_LONG, 否則就用dval表示, zval IS_FLOAT.

凡是大於最大的整數值的數值, 我們都要小心, 因為它可能會有精度損失:

<?php
$a = 9223372036854775807;
$b = 9223372036854775808;
 
var_dump($a === ($b - 1));

輸出是false.

現在接上開頭的討論, 之前說過, PHP的整數, 可能是32位元, 也可能是64位元, 那麼就決定了, 一些在64位元上可以執行正常的程式碼, 可能會因為隱形的型別轉換, 發生精度丟失, 從而造成程式碼不能正常的執行在32位元系統上.

所以, 我們一定要警惕這個臨界值, 好在PHP中已經定義了這個臨界值:

<?php
    echo PHP_INT_MAX;
 ?>

當然, 為了保險起見, 我們應該使用字串來儲存大整數, 並且採用比如bcmath這樣的數學函數庫來進行計算.

另外, 還有一個關鍵的設定, 會讓我們產生迷惑, 這個設定就是php.precision, 這設定決定了PHP再輸出一個float值的時候, 輸出多少有效位.

最後, 我們再來回頭看上面提出的問題, 也就是一個long的整數, 最大的值是多少, 才能保證轉到float以後再轉回long不會發生精度丟失?

比如, 對於整數, 我們知道它的二進位制表示是, 101, 現在, 讓我們右移倆位, 變成1.01, 捨去高位的隱含有效位1, 我們得到在double中儲存5的二進位制數值為:

0/*符號位*/ 10000000001/*指數位*/ 0100000000000000000000000000000000000000000000000000

5的二進位制表示, 絲毫未損的儲存在了尾數部分, 這個情況下, 從double轉會回long, 不會發生精度丟失.

我們知道double用52位表示尾數, 算上隱含的首位1, 一共是53位精度.. 那麼也就可以得出, 如果一個long的整數, 值小於:

2^53 - 1 == 9007199254740991; //牢記, 我們現在假設是64bits的long

那麼, 這個整數, 在發生long->double->long的數值轉換時, 不會發生精度丟失.

推薦:《PHP教學

以上就是關於PHP浮點數你應該知道的事情的詳細內容,更多請關注TW511.COM其它相關文章!