正規表示式詳細基礎範例解析

2020-07-16 10:05:46
正規表示式是我們驗證是經常見到的!下面我和大家一起分享一下如何更簡單的理解正規表示式。
首先,說一下正則名字的命名:

這個單詞我想大家都會眼熟吧!「Regular Expression」。 Regular Expression的「Regular」一般被譯為「正則」、「正規」、「常規」。此處的「Regular」即是「規則」、「規律」的意思,Regular Expression即「描述某種規則的表示式」之意,也就是我們所說的正規表示式。其實正規表示式說白了就是用來規範某種行為的!或者說是一種約束,就好比我們必須遵守交通規則是的。
我個人感覺如果想把正則搞懂、搞明白也不難!只要把其中的一些必須記住的東西外,再加上靈活的運用,這樣就可以了!
好的! 接下來我就來深入到正則的主體,
我們來先看看正則關鍵的東西,如果把這些東西都搞明白了!一般在專案中就沒有問題了!

第一個「」
這個是俗稱跳脫字元,就是把一個字元標記為一個特殊字元或者原義字元。如:「n」 就是匹配「n」 。如果是「n」 則是換行符。
有人該問了如果我就是想寫「」這個斜槓呢? 這個也很簡單啊!就直接是這樣寫「」就可以了!為什麼寫兩個「」呢!就是為了區分。

第二個「^」
這個是俗稱開始字元,就是說準備寫正則了!如果設定了RegExp物件的Multiline屬性,^也匹配「n」或者「r」之後的位置。

第三個「$」
這個是俗稱結束字元,也可以說成收尾(很不專業的解釋)!如果設定了RegExp物件的Multiline屬性,$也匹配「n」或「r」之前的位置

第四個「*」
這個是匹配前面的子表示式零次或者多次。如:zo*能匹配「z」以及「zo」或者「zoo」。這個「*」也就是相當於{0,}

第五個「+」
這個是匹配前面的子表示式一次或者多次。如:「zo+」能匹配「zo」以及「zoo」或者「zooo」。這個「*」和「+」差不多一個是開始零次一個是一次。這個「+」相當於{1,}。

第六個「?」
這個是匹配前面的子表示式零次或者一次。如:「do(es)?」可以匹配「do」或者「does」。這個問號的意思就是要麼匹配零次要麼匹配一次!

第七個「{}」
這個符號是匹配多少次的,
1,{n}匹配確定的n次,n是一個非負整數,如:「o{2}」這個的意思就是匹配兩個「oo」, 如: good,food等!不過不能匹配body,因為就一個o!
2,{n,}匹配至少n次,n是個非負整數,如:「o{2,}」 這個的意思就是匹配兩個以上的「oo」,如:good,goood,gooood等。「o{1,}」等價於「o+」。「o{0,}」這個等價於「o*」。
3,{n,m}這個是最少匹配n次最多匹配m次,n和m都是非負整數,其中n<=m。例如:「o{1,3}」匹配body,food,foood。不過不匹配fooood。「o{0,1}」等價於「o?」。這裡寫的時候要注意一下,就是逗號和兩個數之間不能有空格。

第八個「?」特殊用法
當該字元緊跟在任何一個其他限制符(*,+,?,{n},{n,},{n,m})後面時,匹配模式是非貪婪的。所謂非貪婪就是以最少為好,非貪婪模式盡可能少的匹配所搜尋的字串,而預設的貪婪模式則盡可能多的匹配所搜尋的字串。例如,對於字串「oooo」,「o+?」將匹配單個「o」,而「o+」將匹配所有「o」。

第九個「.」
匹配除換行符「n」之外的任何單個字元。如果想匹配換行符「n」再內的任何字元,就使用「(.|n)」的模式。

第十個「pattern」
這個「pattern」不是很好理解,剛一看比較暈!不過我對這個的理解如下希望對大家有用:
1. ?:pattern 匹配pattern但不獲取匹配結果, 例如:k(?:1|2|3) k在123中任意匹配一個,例子:k1|k2
2. ?=pattern 正向肯定預查 例如:K(?=1|2|3) 當K匹配123中任意一個時 選擇K 例子:k1中的k或者k2中的k
3. ?!pattern 正向否定預查 例如:k(?!1|2|3) 當K不匹配123中的任意一個時 選擇K 例子:不匹配k1中的k,不過可以是k4,k5
4. ?<=pattern 反向肯定預查 例如:(?<=1|2|3)k 當K匹配123中任意一個時 選擇K 例子:1k中的k或者2k中的K
5. ?<!pattern 反向否定預查 例如:(?<!1|2|3)k 當k不匹配123中任意一個時 例子:不匹配1k中的K可以是4k,5k

第十一個「|」
這個符號就是或的意思,比如:「f|good」能匹配「f」或「good」,如果這樣呢「(f|g)ood」則匹配「food」或「good」。

第十二個「[]」
這個符號是字元集和的意思,和「{}」看上去差不多,不過意義可就差多了。

第十三個「()」
這個符號式陣列或者是集合

1、[xyz] 匹配所包含的任意一個字元。就是說三個之中選擇一個。例子:「[abc]」可以匹配「company」中的「a」不過不可以匹配「beautiful」因為用到了裡面的兩個字母。
2、[^xyz] 這個是負值字元集合,也可以說成是「非」。例子:「[^abc]」可以匹配「drop」等!只要單詞裡沒有「abc」這三個字母就可以。
3、[a-z] 字元的範圍。匹配指定範圍內的任意字元。例如,「[a-z]」可以匹配「a」到「z」範圍內的任意小寫字母字元。也可以寫成「[0-9]」這個是匹配0到9直接打數位。
4、[^a-z] 這個我想不用說大家就應該想到是什麼意思了,對了!就是你想的那個意思:不在「a」到「z」範圍內的任意字元,一開始我看到這個的時候以為是不在a到z之間的字母呢!我說如果不在a到z之間的字母那只有漢語中的「ü」 了!這個好像讀「喻」!呵呵! 大家看清楚了啊!是字元,不是字母。

下面大家和我一起看看「」和字母所匹配的特殊含義,
「b」 這個是匹配一個單詞的邊界,也就是指單詞和空格間的位置。例如,「erb」可以匹配「never」中的「er」,但不能匹配「verb」中的「er」。這個我感覺比較好記大家可以這樣記:邊界的邊是b開頭的!
「B」這個是和「b」是相反的,匹配非單詞邊界。「erB」能匹配「verb」中的「er」,但不能匹配「never」中的「er」。
「d」這個是用的比較多!我建議大家對這個多記記,這個是匹配數位字元,相當於[0-9]。
「D」這個也很好理解,也是相反的意思就是說不是數位的,相當於[^0-9]。
「f」這個是匹配一個換頁符。這個不做過多解釋了!下面的四個也就過多不做過多解釋了。只要記住就可以了!在專案中會用就可以了!
「n」這個是匹配一個換行符。
「r」這個是匹配一個回車符。
「t」這個是匹配一個製表符。
「v」這個是匹配一個垂直製表符。
「s」這個匹配任何空字元,匹配任何空白字元,包括空格、製表符、換頁符等等。等價於[ fnrtv]。也就是這個把上面的五個都包括了!
「S」這個是非空白字元等價於[^ fnrtv]。
說到這裡大家都可能感覺到正則其實就是這些字元嘛!而且有些是可以靠我們的邏輯思維推理出來的,而且有些是重複的,只要大家能夠靈活的運用就可以了。

「w」這個是匹配包括下劃線的任何單詞字元。等價於「[A-Za-z0-9_]」。這個在實際中用的也挺多的也建議大家多記記這個。

「W」這個是匹配非單詞數位字元。等價於「[^A-Za-z0-9_]」。

好的!基本上要記得就是這麼多了!這些可能有些正則高手該說了「你這個根本不全啊?」 我先提前解釋一下吧,我所寫的只是一些基礎的,在專案中常見的,比較實用的,基本上這些在專案中就可以運用自如了。
接下來呢,和大家做一些實質性的東西,和大家一起解析一些正規表示式。
比如這個正則:^([0-1]?[0-9]|2[0-3]):([0-5][0-9]):([0-5][0-9])$
這個正則我想對正則高手來說一看就知道是什麼了。當然一些邏輯思維比較強的看兩眼也就知道這個是什麼了,沒錯就是時間正則。

OK 我們來解析一下這個正則從這個「^」開始,「([0-1]?[0-9]|2[0-3])」是個組,「[0-1]?」這個問號的作用是0或1最多有零個或者一個,「[0-9]」0至9之間任意一個數,「|」這個是「或」的意思,就是說不是「[0-1]?[0-9]」就是「2[0-3]」,「2[0-3]」 這個是前面的2就是代表2,後面0至3是0到3之間任意一個數,「:」就是代表「:」,「([0-5][0-9])」也是個組,「[0-5]」是0到5之間任意一個數,「[0-9]」是0到9之間任意一個數,「:」也是本意,「([0-5][0-9])」也是個組,「[0-5]」是0到5之間任意一個數,「[0-9]」是0到9之間任意一個數,「$」這個是結束符。
再和大家解析一個小數

比如:^[1-9]+d*(.[0-9]{1,2})?|0(.[0-9]{1,2})?$
「^」是開始符,「[1-9]+」其中「+」的意思是1到9之間最少有一個或者多個,「d*」這個「d」是數位,這個「*」是最少有零個數位或者有多個數位,「(.[0-9]{1,2})?」這個組裡面「.」是原意點,「[0-9]{1,2}」 0到9之間有一個或者有兩個數位,後面這個問號「?」意思是有零個或者一個它「(.[0-9]{1,2})」。「|」 是要麼是「[1-9]+d*(.[0-9]{1,2})?」要麼是「0(.[0-9]{1,2})?」。「0(.[0-9]{1,2})?」這個裡面的0是原意,「(.[0-9]{1,2})?」這個組裡面「.」是原意點,「[0-9]{1,2}」 0到9之間有一個或者有兩個數位,後面這個問號「?」意思是有零個或者一個它「(.[0-9]{1,2})」。

下面我例舉出一些常見的正規表示式來給大家說說:

^[1-9]d*$ //匹配正整數   
^-[1-9]d*$ //匹配負整數   
^-?[1-9]d*$ //匹配整數   
^[1-9]d*|0$ //匹配非負整數(正整數 + 0)   
^-[1-9]d*|0$ //匹配非正整數(負整數 + 0)   
^[1-9]d*.d*|0.d*[1-9]d*$ //匹配正浮點數   
^-([1-9]d*.d*|0.d*[1-9]d*)$ //匹配負浮點數   
^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$ //匹配浮點數   
^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$ //匹配非負浮點數(正浮點數 + 0)   
^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$ //匹配非正浮點數(負浮點數 + 0)
^[a-zA-Z][a-zA-Z0-9_]{4,15}$ //匹配帳號是否合法(字母開頭,允許5-16位元組,允許字母數位下劃線)
^s*|s*$ //匹配首尾空白字元的正規表示式
ns*r //匹配空白行的正規表示式
[^x00-xff] //匹配雙位元組字元(包括漢字在內)
[u4e00-u9fa5] //匹配中文字元的正規表示式

使用者名稱
^[a-z0-9_-]{3,16}$

密碼
^[a-z0-9_-]{6,18}$

十六進位制值
^#?([a-f0-9]{6}|[a-f0-9]{3})$

電子郵箱
^([a-z0-9_.-]+)@([da-z.-]+).([a-z.]{2,6})$
^[a-zd]+(.[a-zd]+)*@([da-z](-[da-z])?)+(.{1,2}[a-z]+)+$

URL
^(https?://)?([da-z.-]+).([a-z.]{2,6})([/w .-]*)*/?$

IP 地址
((2[0-4]d|25[0-5]|[01]?dd?).){3}(2[0-4]d|25[0-5]|[01]?dd?)


^(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?).){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)$

HTML 標籤
^<([a-z]+)([^<]+)*(?:>(.*)</1>|s+/>)$

以上便是關於正規表示式的一些基礎知識配合實際例子的講解,希望可以幫助到對正規表示式感到迷惑的同學,如有錯誤請指出。

更多相關問題請存取PHP中文網:PHP視訊教學

以上就是正規表示式詳細基礎範例解析的詳細內容,更多請關注TW511.COM其它相關文章!