PHP使用swoole實現多執行緒爬蟲

2020-07-16 10:06:07
在swoole中,php可以借助其啟動子進程的方式,實現php的多進程:

<?php
$s_time = time();
echo '開始時間:'.date('H:i:s',$s_time).PHP_EOL;
//進程數
$work_number=6;
 
//
$worker=[];
 
//模擬地址
$curl=[
    'https://blog.csdn.net/feiwutudou',
    'https://wiki.swoole.com/wiki/page/215.html',
    'http://fanyi.baidu.com/?aldtype=16047#en/zh/manager',
    'http://wanguo.net/Salecar/index.html',
    'http://o.ngking.com/themes/mskin/login/login.jsp',
    'https://blog.csdn.net/marksinoberg/article/details/77816991'
];
 
//單執行緒模式
// foreach ($curl as $v) {
// echo curldeta($v);
// }
 
//建立進程
for ($i=0; $i < $work_number; $i++) {
    //建立多執行緒
    $pro=new swoole_process(function(swoole_process $work) use($i,$curl){
        //獲取html檔案
        $content=curldeta($curl[$i]);
        //寫入管道
        $work->write($content.PHP_EOL);
    },true);
    $pro_id=$pro->start();
    $worker[$pro_id]=$pro;
}
//讀取管道內容
foreach ($worker as $v) {
    echo $v->read().PHP_EOL;
}
 
//模擬爬蟲
function curldeta($curl_arr)
{//file_get_contents
    echo $curl_arr.PHP_EOL;
    file_get_contents($curl_arr);
}
 
//進程回收
swoole_process::wait();
 
$e_time = time();
echo '結束時間:'.date('H:i:s',$e_time).PHP_EOL;
 
echo '所用時間:'.($e_time-$s_time).'秒'.PHP_EOL;
?>

多執行緒執行結果:

4d8084991537fd94f8576f37ac80f21.png

作為對比,單執行緒結果:

a3d1d04d9063f5c55fc958a0e72162b.png

提升十分明顯!

以上就是PHP使用swoole實現多執行緒爬蟲的詳細內容,更多請關注TW511.COM其它相關文章!