新抽象語法樹(AST)給 PHP7 帶來的變化

2020-07-16 10:06:15

本文大部分內容參照 AST 的 RFC 文件而成:https://wiki.php.net/rfc/abstract_syntax_tree,為了易於理解從源文件中節選部分進行介紹。

本文並不會告訴你抽象語法樹是什麼,這需要你自己去了解,這裡只是描述 AST 給 PHP 帶來的一些變化。

新的執行過程

PHP7 的核心中有一個重要的變化是加入了 AST。在 PHP5中,從 php 指令碼到 opcodes 的執行的過程是:

1、Lexing:詞法掃描分析,將原始檔轉換成 token 流;

2、Parsing:語法分析,在此階段生成 op arrays。

3、PHP7 中在語法分析階段不再直接生成 op arrays,而是先生成 AST,所以過程多了一步:

4、Lexing:詞法掃描分析,將原始檔轉換成 token 流;

5、Parsing:語法分析,從 token 流生成抽象語法樹;

6、Compilation:從抽象語法樹生成 op arrays。

執行時間和記憶體消耗

從以上的步驟來看,這比之前的過程還多了一步,所以按常理來說這反而會增加程式的執行時間和記憶體的使用。但事實上記憶體的使用確實增加了,但是執行時間上卻有所降低。

以下結果是使用小(程式碼大約 100 行)、中(大約 700 行)、大(大約 2800 行)三個指令碼分別進行測試得到的,測試指令碼: https://gist.github.com/nikic/289b0c7538b46c2220bc

每個檔案編譯 100 次的執行時間(注意文章的測試結果時間是 14 年,PHP7 還叫 PHP-NG 的時候):


php-ngphp-astdiff
SMALL0.180s0.160s-12.5%
MEDIUM1.492s1.268s-17.7%
LARGE6.703s5.736s-16.9%


單次編譯中的記憶體峰值:


php-ngphp-astdiff
SMALL378kB414kB+9.5%
MEDIUM507kB643kB+26.8%
LARGE1084kB1857kB+71.3%

單次編譯的測試結果可能並不能代表實際使用的情況,以下是使用 PhpParser 進行完整專案測試得到的結果:


php-ngphp-astdiff
TIME25.5ms22.8ms-11.8%
MEMORY2360kB2482kB+5.1%

測試表明,使用 AST 之後程式的執行時間整體上大概有 10% 到 15% 的提升,但是記憶體消耗也有增加,在大檔案單次編譯中增加明顯,但是在整個專案執行過程中並不是很嚴重的問題。

還有注意的是以上的結果都是在沒有 Opcache 的情況下,生產環境中開啟 Opcache 的情況下,記憶體的消耗增加也不是很大的問題。

語意上的改變

如果僅僅是時間上的優化,似乎也不是使用 AST 的充足理由。其實實現 AST 並不是基於時間優化上的考慮,而是為了解決語法上的問題。下面來看一下語意上的一些變化。

yield 不需要括號

在 PHP5 的實現中,如果在一個表示式上下文(例如在一個賦值表示式的右側)中使用 yield,你必須在 yield 申明兩邊使用括號:

<?php
$result = yield fn();   // 不合法的
$result = (yield fn()); // 合法的

這種行為僅僅是因為 PHP5 的實現方式的限制,在 PHP7 中,括號不再是必須的了。所以下面這些寫法也都是合法的:

<?php
$result = yield;
$result = yield $v;
$result = yield $k => $v;

當然了,還得遵循 yield 的應用場景才行。

括號不影響行為

在 PHP5 中,($foo)['bar'] = 'baz' 和 $foo['bar'] = 'baz' 兩個語句的含義不一樣。事實上前一種寫法是不合法的,你會得到下面這樣的錯誤:

<?php
($foo)['bar'] = 'baz';
# PHP Parse error: Syntax error, unexpected '[' on line 1

但是在 PHP7 中,兩種寫法表示同樣的意思。

同樣,如果函數的引數被括號包裹,型別檢查存在問題,在 PHP7 中這個問題也得到了解決:

<?php
function func() {
    return [];
}

function byRef(array &$a) {
}

byRef((func()));

以上程式碼在 PHP5 中不會告警,除非使用 byRef(func()) 的方式呼叫,但是在 PHP7 中,不管 func() 兩邊有沒有括號都會產生以下錯誤:

PHP Strict standards: Only variables should be passed by reference ...

list() 的變化

list 關鍵字的行為改變了很多。list 給變數賦值的順序(等號左右同時的順序)以前是從右至左,現在是從左到右:

<?php
list($array[], $array[], $array[]) = [1, 2, 3];
var_dump($array);

// PHP5: $array = [3, 2, 1]
// PHP7: $array = [1, 2, 3]

# 注意這裡的左右的順序指的是等號左右同時的順序,
# list($a, $b) = [1, 2] 這種使用中 $a == 1, $b == 2 是沒有疑問的。

產生上面變化的原因正是因為在 PHP5 的賦值過程中,3 會最先被填入陣列,1 最後,但是現在順序改變了。

同樣的變化還有:

<?php
$a = [1, 2];
list($a, $b) = $a;

// PHP5: $a = 1, $b = 2
// PHP7: $a = 1, $b = null + "Undefined index 1"

這是因為在以前的賦值過程中 $b 先得到 2,然後 $a 的值才變成 1,但是現在 $a 先變成了 1,不再是陣列,所以 $b 就成了 null。

list 現在只會存取每個偏移量一次:

<?php
list(list($a, $b)) = $array;

// PHP5:
$b = $array[0][1];
$a = $array[0][0];

// PHP7:
// 會產生一個中間變數,得到 $array[0] 的值
$_tmp = $array[0];
$a = $_tmp[0];
$b = $_tmp[1];

空的 list 成員現在是全部禁止的,以前只是在某些情況下:

<?php
list() = $a;           // 不合法
list($b, list()) = $a; // 不合法
foreach ($a as list()) // 不合法 (PHP5 中也不合法)

參照賦值的順序

參照賦值的順序在 PHP5 中是從右到左的,現在時從左到右:

<?php
$obj = new stdClass;
$obj->a = &$obj->b;
$obj->b = 1;
var_dump($obj);

// PHP5:
object(stdClass)#1 (2) {
  ["b"] => &int(1)
  ["a"] => &int(1)
}

// PHP7:
object(stdClass)#1 (2) {
  ["a"] => &int(1)
  ["b"] => &int(1)
}

__clone 方法可以直接呼叫

現在可以直接使用 $obj->__clone() 的寫法去呼叫 __clone 方法。__clone 是之前唯一一個被禁止直接呼叫的魔術方法,之前你會得到一個這樣的錯誤:

Fatal error: Cannot call __clone() method on objects - use 'clone $obj' instead in ...

變數語法一致性

AST 也解決了一些語法一致性的問題,這些問題是在另外一個 RFC 中被提出的:https://wiki.php.net/rfc/uniform_variable_syntax.

在新的實現上,以前的一些語法表達的含義和現在有些不同,具體的可以參照下面的表格:

ExpressionPHP5PHP7
$$foo['bar']['baz']${$foo['bar']['baz']}($$foo)['bar']['baz']
$foo->$bar['baz']$foo->{$bar['baz']}($foo->$bar)['baz']
$foo->$bar['baz']()$foo->{$bar['baz']}()($foo->$bar)['baz']()
Foo::$bar['baz']()Foo::{$bar['baz']}()(Foo::$bar)['baz']()

整體上還是以前的順序是從右到左,現在從左到右,同時也遵循括號不影響行為的原則。這些複雜的變數寫法是在實際開發中需要注意的。

以上就是新抽象語法樹(AST)給 PHP7 帶來的變化的詳細內容,更多請關注TW511.COM其它相關文章!