PHP7實現daemon守護行程詳解

2020-07-16 10:05:30
本篇文章主要講述的是用PHP7實現daemon守護行程,具有一定的參考價值,感興趣的朋友可以了解一下。

在一個多工的計算機作業系統中,守護行程是一種在後台執行的計算機程式。此類程式會被以進程的形式初始化。守護行程程式的名稱通常以字母「d」結尾:例如,syslogd就是指管理系統紀錄檔的守護行程。

daemon 程式是一直執行的伺服器端程式,又稱為守護行程。通常在系統後台執行,沒有控制終端不與前台互動,daemon 程式一般作為系統服務使用。daemon 是長時間執行的進程,通常在系統啟動後就執行,在系統關閉時才結束。一般說Daemon程式在後台執行,是因為它沒有控制終端,無法和前台的使用者互動。daemon程式一般都作為服務程式使用,等待用戶端程式與它通訊。我們也把執行的daemon程式稱作守護行程。

通常,守護行程沒有任何存在的父進程(即PPID=1),且在UNIX系統進程層級中直接位於init之下。守護行程程式通常通過如下方法使自己成為守護行程:對一個子進程執行fork,然後使其父進程立即終止,使得這個子進程能在init下執行。這種方法通常被稱為「脫殼」。

系統通常在啟動時一同起動守護行程。守護行程為對網路請求,硬體活動等進行響應,或其他通過某些任務對其他應用程式的請求進行回應提供支援。守護行程也能夠對硬體進行設定(如在某些Linux系統上的devfsd),執行計劃任務(例如cron),以及執行其他任務。每個進程都有一個父進程,子進程退出,父進程能得到子進程退出的狀態。

守護行程簡單地說就是可以脫離終端而在後台執行的進程 . 這在Linux中是非常常見的一種進程 , 比如apache或者mysql等服務啟動後 , 就會以守護行程的方式進駐在記憶體中 。守護程式是在後台執行的應用程式,而不是由使用者直接操作。守護行程的例子是Cron和MySQL。 使用PHP守護行程非常簡單,並且需要使用PHP 4.1或更高版本編譯引數:--enable-pcntl

假如有個耗時間的任務需要跑在後台 : 將所有mysql中user表中的2000萬使用者全部匯入到redis中做預熱快取 , 那麼這個任務估計一時半會是不會結束的 , 這個時候就需要編寫一個php指令碼以daemon形式執行在系統中 , 結束後自動推出。

在Linux中 , 有三種方式實現指令碼後台化 :

1 . 在命令後新增一個&符號

比如 php task.php & . 這個方法的缺點在於 如果terminal終端關閉 , 無論是正常關閉還是非正常關閉 , 這個php進程都會隨著終端關閉而關閉 , 其次是程式碼中如果有echo或者print_r之類的輸出文字 , 會被輸出到當前的終端視窗中 。

2 . 使用nohup命令

比如 nohup php task.php & . 預設情況下 , 程式碼中echo或者print_r之類輸出的文字會被輸出到php程式碼同級目錄的nohup.out檔案中 . 如果你用exit命令或者關閉按鈕等正常手段關閉終端 , 該進程不會被關閉 , 依然會在後台持續執行 . 但是如果終端遇到異常退出或者終止 , 該php進程也會隨即退出 . 本質上 , 也並非穩定可靠的daemon方案 。

3 . 通過 pcntlposix 擴充套件實現

程式設計中需要注意的地方有:

  • 通過二次 pcntl_fork() 以及 posix_setsid 讓主進程脫離終端
  • 通過 pcntl_signal() 忽略或者處理 SIGHUP 信號
  • 多進程程式需要通過二次 pcntl_fork() 或者 pcntl_signal() 忽略 SIGCHLD 信號防止子進程變成 Zombie 進程
  • 通過 umask() 設定檔案許可權掩碼,防止繼承檔案許可權而來的許可權影響功能
  • 將執行進程的 STDIN/STDOUT/STDERR 重定向到 /dev/null 或者其他流上

daemon有如下特徵:

  • 沒有終端
  • 後台執行
  • 父進程 pid 為1

想要檢視執行中的守護行程可以通過 ps -ax 或者 ps -ef 檢視,其中 -x 表示會列出沒有控制終端的進程。

fork 系統呼叫

fork 系統呼叫用於複製一個與父進程幾乎完全相同的進程,新生成的子進程不同的地方在於與父進程有著不同的 pid 以及有不同的記憶體空間,根據程式碼邏輯實現,父子進程可以完成一樣的工作,也可以不同。子進程會從父進程中繼承比如檔案描述符一類的資源。

PHP 中的 pcntl 擴充套件中實現了 pcntl_fork() 函數,用於在 PHP 中 fork 新的進程。

setsid 系統呼叫

setsid 系統呼叫則用於建立一個新的對談並設定行程群組 id。這裡有幾個概念:對談行程群組

  在 Linux 中,使用者登入產生一個對談(Session),一個對談中包含一個或者多個行程群組,一個行程群組又包含多個進程。每個行程群組有一個組長(Session Leader),它的 pid 就是行程群組的組 id。行程群組長一旦開啟一個終端,這一個終端就被稱為控制終端。一旦控制終端發生異常(斷開、硬體錯誤等),會發出信號到行程群組組長。

  後台執行程式(如 shell 中以&結尾執行指令)在終端關閉之後也會被殺死,就是沒有處理好控制終端斷開時發出的SIGHUP信號,而SIGHUP信號對於進程的預設行為則是退出進程。

呼叫 setsid 系統呼叫之後,會讓當前的進程新建一個行程群組,如果在當前進程中不開啟終端的話,那麼這一個行程群組就不會存在控制終端,也就不會出現因為關閉終端而殺死進程的問題。

PHP 中的 posix 擴充套件中實現了 posix_setsid() 函數,用於在 PHP 中設定新的行程群組。

二次 fork 的作用

首先,setsid 系統呼叫不能由行程群組組長呼叫,會返回-1。

二次 fork 操作的樣例程式碼如下:

$pid1 = pcntl_fork();

if ($pid1 > 0) {
// 父進程會得到子進程號,所以這裡是父進程執行的邏輯 exit('parent process. 1'."n"); } else if ($pid1 < 0) { exit("Failed to fork 1n"); } if (-1 == posix_setsid()) { exit("Failed to setsidn"); } $pid2 = pcntl_fork(); if ($pid2 > 0) { exit('parent process. 2'."n"); } else if ($pid2 < 0) { exit("Failed to fork 2n"); }

pcntl_fork() 函數建立一個子進程,這個子進程僅PID(進程號) 和PPID(父進程號)與其父進程不同。

返回值

  成功時,在父進程執行執行緒內返回產生的子進程的PID,在子進程執行執行緒內返回 0,失敗時,在 父進程上下文返回 -1,不會建立子進程,並且會引發一個PHP錯誤。

假定我們在終端中執行應用程式,進程為 a,第一次 fork 會生成子進程 b,如果 fork 成功,父進程 a 退出。b 作為孤兒進程,被 init 進程託管。

此時,進程 b 處於行程群組 a 中,進程 b 呼叫 posix_setsid 要求生成新的行程群組,呼叫成功後當前行程群組變為 b。


php fork2.php 
parent process. 1
parent process. 2

此時進程 b 事實上已經脫離任何的控制終端,例程:


cli_set_process_title('process_a');

$pidA = pcntl_fork();

if ($pidA > 0) {
    exit(0);
} else if ($pidA < 0) {
    exit(1);
}

cli_set_process_title('process_b');

if (-1 === posix_setsid()) {
    exit(2);
}

while(true) {
    sleep(1);
}

執行程式之後:  


$ php cli-title.php 
$ ps ax | grep -v grep | grep -E 'process_|PID'
  PID TTY      STAT   TIME COMMAND
15725 ?        Ss     0:00 process_b

重新開啟一個shell視窗,效果一樣,都在呢

從 ps 的結果來看,process_b 的 TTY 已經變成了 ,即沒有對應的控制終端。

程式碼走到這裡,似乎已經完成了功能,關閉終端之後 process_b 也沒有被殺死,但是為什麼還要進行第二次 fork 操作呢?

StackOverflow 上的一個回答寫的很好:

The second fork(2) is there to ensure that the new process is not a session leader, so it won’t be able to (accidentally) allocate a controlling terminal, since daemons are not supposed to ever have a controlling terminal.

這是為了防止實際的工作的進程主動關聯或者意外關聯控制終端,再次 fork 之後生成的新進程由於不是行程群組組長,是不能申請關聯控制終端的。

綜上,二次 fork 與 setsid 的作用是生成新的行程群組,防止工作進程關聯控制終端。 

寫一個demo測試下


<?php
// 第一次fork系統呼叫
$pid_A = pcntl_fork();

// 父進程 和 子進程 都會執行下面程式碼
if ($pid_A < 0) {
    // 錯誤處理: 建立子進程失敗時返回-1.
    exit('A fork error ');
} else if ($pid_A > 0) {
     // 父進程會得到子進程號,所以這裡是父進程執行的邏輯
    exit("A parent process exit n");
}

// B 作為孤兒進程,被 init 進程託管,此時,進程 B 處於行程群組 A 中

// 子進程得到的$pid為0, 所以以下是子進程執行的邏輯,受控制終端的影響,控制終端關閉則這裡也會退出

// [子進程] 控制終端未關閉前,將當前子進程提升會對談組組長,及行程群組的leader
// 進程 B 呼叫 posix_setsid 要求生成新的行程群組,呼叫成功後當前行程群組變為 B
if (-1 == posix_setsid()) {
    exit("Failed to setsidn");
}

// 此時進程 B 已經脫離任何的控制終端

// [子進程]  這時候在【行程群組B】中,重新fork系統呼叫(二次fork)
$pid_B = pcntl_fork();
if ($pid_B < 0) {
    exit('B fork error ');
} else if ($pid_B > 0) {
    exit("B parent process exit n");
}

// [新子進程] 這裡是新生成的行程群組,不受控制終端的影響,寫寫自己的業務邏輯程式碼
for ($i = 1; $i <= 100; $i++) {
    sleep(1);
    file_put_contents('daemon.log',$i . "--" . date("Y-m-d H:i:s", time()) . "n",FILE_APPEND);
}

Window 下跑回直接丟擲異常


php runtimedaemon.php
PHP Fatal error:  Uncaught Error: Call to undefined function pcntl_fork() in D:phpStudyPHPTutorialWWWnotesruntimedaemon.php:13
Stack trace:
#0 {main}
  thrown in D:phpStudyPHPTutorialWWWnotesruntimedaemon.php on line 13

Linux 下執行,輸出結果


php daemon.php
... 97--2018-09-07 03:50:09 98--2018-09-07 03:50:10 99--2018-09-07 03:50:11 100--2018-09-07 03:50:12

所以,現在即使關閉了終端,改指令碼任然在後台守護行程執行

相關教學:PHP視訊教學

以上就是PHP7實現daemon守護行程詳解的詳細內容,更多請關注TW511.COM其它相關文章!