如何編譯php檔案

2020-07-16 10:05:33
PHP是解析型高階語言,事實上從Zend核心的角度來看PHP就是一個普通的C程式,它有main函數,我們寫的PHP程式碼是這個程式的輸入,然後經過核心的處理輸出結果,核心將PHP程式碼"翻譯"為C程式可識別的過程就是PHP的編譯。

推薦課程:PHP教學

C程式在編譯時將一行行程式碼編譯為機器碼,每一個操作都認為是一條機器指令,這些指令寫入到編譯後的二進位制程式中,執行的時候將二進位制程式load進相應的記憶體區域(常數區、資料區、程式碼區)、分配執行棧,然後從程式碼區起始位置開始執行,這是C程式編譯、執行的簡單過程。

同樣,PHP的編譯與普通的C程式類似,只是PHP程式碼沒有編譯成機器碼,而是解析成了若干條opcode陣列,每條opcode就是C裡面普通的struct,含義對應C程式的機器指令,執行的過程就是引擎依次執行opcode,比如我們在PHP裡定義一個變數:$a = 123;,最終到核心裡執行就是malloc一塊記憶體,然後把值寫進去。

在zend_compile.h檔案中,opcode結構:


struct _zend_op {
    const void *handler; //對應執行的C語言function,即每條opcode都有一個C function處理
    znode_op op1; //運算元1
    znode_op op2; //運算元2
    znode_op result; //返回值
    uint32_t extended_value; 
    uint32_t lineno;
    zend_uchar opcode;  //opcode指令
    zend_uchar op1_type; //運算元1型別
    zend_uchar op2_type; //運算元2型別
    zend_uchar result_type; //返回值型別
};


所以PHP的解析過程任務就是將PHP程式碼(通過詞法分析re2c,語法分析bison)轉化為opcode陣列,程式碼裡的所有資訊都儲存在opcode中,然後將opcode陣列交給zend引擎執行,opcode就是核心具體執行的命令,比如賦值、加減操作、函數呼叫等,每一條opcode都對應一個處理handle,這些handler是提前定義好的C函數。


struct _zend_op_array {
    //common是普通函數或類成員方法對應的opcodes快速存取時使用的欄位
    /* Common elements */
    zend_uchar type;
    zend_uchar arg_flags[3]; /* bitset of arg_info.pass_by_reference */
    uint32_t fn_flags;
    zend_string *function_name;
    zend_class_entry *scope;
    zend_function *prototype;
    uint32_t num_args;
    uint32_t required_num_args;
    zend_arg_info *arg_info;
    /* END of common elements */

    uint32_t *refcount;

    uint32_t last;
     //opcode指令陣列
    zend_op *opcodes;

    //PHP程式碼裡定義的變數數:op_type為IS_CV的變數,不含IS_TMP_VAR、IS_VAR的
    //編譯前此值為0,然後發現一個新變數這個值就加1
    int last_var;
    //臨時變數數:op_type為IS_TMP_VAR、IS_VAR的變數
    uint32_t T;
    //PHP變數名陣列
    zend_string **vars;//這個陣列在ast編譯期間配合last_var用來確定各個變數的編號,非常重要的一步操作

    int last_live_range;
    int last_try_catch;
    zend_live_range *live_range;
    zend_try_catch_element *try_catch_array;

    //靜態變數符號表:通過static宣告的
    /* static variables support */
    HashTable *static_variables;

    zend_string *filename;
    uint32_t line_start;
    uint32_t line_end;
    zend_string *doc_comment;
    uint32_t early_binding; /* the linked list of delayed declarations */

    //字面量數量
    int last_literal;
    //字面量(常數)陣列,這些都是在PHP程式碼定義的一些值
    zval *literals;

    //執行時快取陣列大小
    int  cache_size;
    //執行時快取,主要用於快取一些znode_op以便於快速獲取資料,後面單獨介紹這個機制
    void **run_time_cache;

    void *reserved[ZEND_MAX_RESERVED_RESOURCES];
};

opcode指令:即PHP程式碼具體對應的處理動作,與二進位制程式中的程式碼段對應
字面量儲存:PHP程式碼中定義的一些變數初始值、呼叫的函數名稱、類名稱、常數名稱等等稱之為字面量,這些值用於執行時初始化變數、函數呼叫等等
變數分配情況:與字面量類似,這裡指的是當前opcodes定義了多少變數、臨時變數,每個變數都有一個對應的編號,執行初始化按照總的數目一次性分配zval,使用時也完全按照編號索引,而不是根據變數名索引

從PHP程式碼到opcode是怎麼實現的?

最容易想到的方式就是正則匹配,當然過程沒有這麼簡單。PHP編譯過程包括詞法分析、語法分析,使用re2c、bison完成,舊的PHP版本直接生成了opcode,PHP7新增了抽象語法樹(AST),在語法分析階段生成AST,然後再生成opcode陣列

以上就是如何編譯php檔案的詳細內容,更多請關注TW511.COM其它相關文章!