兩種方法:1、用preg_match_all()配合正則過濾字串,語法「preg_match_all("/[\x{4e00}-\x{9fff}]+/u","$str",$arr);」;2、用preg_replace()配合正則搜尋字串中的非中文字母,並將其替換成空字元,語法「preg_replace("/[^\x{4E00}-\x{9FFF}]+/u",'',$str)」。
php零基礎到就業直播視訊課:進入學習
API 檔案、設計、偵錯、自動化測試一體化共同作業工具:
本教學操作環境:windows7系統、PHP8.1版、DELL G3電腦
在php中,可以利用以下兩種函數來只提取字串的中文字元
preg_replace()函數
preg_match_all()函數
方法1:使用preg_match_all()函數
preg_match_all()函數配合正規表示式「/[\x{4e00}-\x{9fff}]+/u
」可以過濾字串,只獲取中文字元。
會將匹配的中文字元一個個存入陣列中(該陣列由第三個引數指定)。
<?php header("Content-type:text/html;charset=utf-8"); $str = "歡迎4546來到php這裡。zblog,我的?#$%^天呀&())*(&^"; echo $str; preg_match_all("/[\x{4e00}-\x{9fff}]+/u","$str",$arr); var_dump($arr); ?>
然後可以使用join()函數將結果值拼接成一個字串。
join('',$arr[0])
說明:
1)preg_match_all()函數
preg_match_all()函數會搜尋字串中所有可以和正規表示式匹配的結果
preg_match_all(pattern,subject,matches,flags,offset)
引數說明如下:
preg_match_all() 函數可以返回 pattern 的匹配次數(可能是 0),如果發生錯誤則返回 FALSE。
2)join()函數
join() 函數返回一個由陣列元素組合成的字串。
join() 函數是 implode() 函數的別名。
join(separator,array)
separator:可選。規定陣列元素之間放置的內容。預設是 ""(空字串)。
array:必需。要組合為字串的陣列。
返回值:返回一個由陣列元素組合成的字串。
方法2:使用preg_replace()函數
preg_match_all()函數配合正規表示式「/[^\x{4E00}-\x{9FFF}]+/u
」搜尋字串中的非中文字母,並將其替換成空字元''
即可。
<?php header("Content-type:text/html;charset=utf-8"); $str= 'TW511.COM!-=1548'; echo $str."<br>"; $pattern = "/[^\x{4E00}-\x{9FFF}]+/u"; $newstr=preg_replace($pattern,'', $str);preg_match_all("/[\x{4e00}-\x{9fff}]+/u","$str",$arr); var_dump($newstr); ?>
說明:preg_replace()
preg_replace() 函數可以執行正規表示式的搜尋和替換,是一個強大的字串替換處理常式,該函數的語法格式如下:
preg_replace($pattern, $replacement, $subject [, $limit = -1 [, &$count]])
引數說明如下:
如果 $subject 是一個陣列,preg_replace() 函數會返回一個陣列,其他情況下返回一個字串。
如果函數 preg_replace() 搜尋到匹配項,則會返回被替換後的 $subject,否則返回沒有改變的 $subject。preg_replace() 函數的每個引數(除了引數 $limit)都可以是一個陣列。如果引數 $pattern 和引數 $replacement 都是陣列,那麼該函數將以其鍵名在陣列中出現的順序來進行處理。如果發生錯誤,則返回 NULL。
引數 $replacement 中可以包含後向參照 \\n 或 $n,語法上首選後者。每個這樣的參照將被匹配到的第 n 個捕獲子組捕獲到的文字替換。n 可以是 0-99,\\0 和 $0 代表完整的模式匹配文字。
推薦學習:《》
以上就是php字串怎麼只提取中文字元的詳細內容,更多請關注TW511.COM其它相關文章!