正規表示式詳細基礎範例解析

正規表示式是我們驗證是經常見到的！下面我和大家一起分享一下如何更簡單的理解正規表示式。
首先，說一下正則名字的命名：

這個單詞我想大家都會眼熟吧！「Regular Expression」。 Regular Expression的「Regular」一般被譯為「正則」、「正規」、「常規」。此處的「Regular」即是「規則」、「規律」的意思，Regular Expression即「描述某種規則的表示式」之意，也就是我們所說的正規表示式。其實正規表示式說白了就是用來規範某種行為的！或者說是一種約束，就好比我們必須遵守交通規則是的。
我個人感覺如果想把正則搞懂、搞明白也不難！只要把其中的一些必須記住的東西外，再加上靈活的運用，這樣就可以了！
好的！接下來我就來深入到正則的主體，
我們來先看看正則關鍵的東西，如果把這些東西都搞明白了！一般在專案中就沒有問題了！

第一個「」
這個是俗稱跳脫字元，就是把一個字元標記為一個特殊字元或者原義字元。如：「n」就是匹配「n」。如果是「n」則是換行符。
有人該問了如果我就是想寫「」這個斜槓呢？這個也很簡單啊！就直接是這樣寫「」就可以了！為什麼寫兩個「」呢！就是為了區分。

第二個「^」
這個是俗稱開始字元，就是說準備寫正則了！如果設定了RegExp物件的Multiline屬性，^也匹配「n」或者「r」之後的位置。

第三個「$」
這個是俗稱結束字元，也可以說成收尾（很不專業的解釋）！如果設定了RegExp物件的Multiline屬性，$也匹配「n」或「r」之前的位置

第四個「*」
這個是匹配前面的子表示式零次或者多次。如：zo*能匹配「z」以及「zo」或者「zoo」。這個「*」也就是相當於{0，}

第五個「+」
這個是匹配前面的子表示式一次或者多次。如：「zo+」能匹配「zo」以及「zoo」或者「zooo」。這個「*」和「+」差不多一個是開始零次一個是一次。這個「+」相當於{1，}。

第六個「?」
這個是匹配前面的子表示式零次或者一次。如：「do(es)?」可以匹配「do」或者「does」。這個問號的意思就是要麼匹配零次要麼匹配一次！

第七個「{}」
這個符號是匹配多少次的，
1,{n}匹配確定的n次,n是一個非負整數，如：「o{2}」這個的意思就是匹配兩個「oo」, 如： good,food等！不過不能匹配body,因為就一個o！
2,{n,}匹配至少n次,n是個非負整數,如：「o{2,}」這個的意思就是匹配兩個以上的「oo」，如：good,goood,gooood等。「o{1,}」等價於「o+」。「o{0，}」這個等價於「o*」。
3,{n,m}這個是最少匹配n次最多匹配m次，n和m都是非負整數，其中n<=m。例如：「o{1,3}」匹配body,food,foood。不過不匹配fooood。「o{0,1}」等價於「o?」。這裡寫的時候要注意一下，就是逗號和兩個數之間不能有空格。

第八個「?」特殊用法
當該字元緊跟在任何一個其他限制符（*,+,?，{n}，{n,}，{n,m}）後面時，匹配模式是非貪婪的。所謂非貪婪就是以最少為好，非貪婪模式盡可能少的匹配所搜尋的字串，而預設的貪婪模式則盡可能多的匹配所搜尋的字串。例如，對於字串「oooo」，「o+?」將匹配單個「o」，而「o+」將匹配所有「o」。

第九個「.」
匹配除換行符「n」之外的任何單個字元。如果想匹配換行符「n」再內的任何字元，就使用「(.|n)」的模式。

第十個「pattern」
這個「pattern」不是很好理解，剛一看比較暈！不過我對這個的理解如下希望對大家有用：
1. ?:pattern 匹配pattern但不獲取匹配結果, 例如：k(?:1|2|3) k在123中任意匹配一個，例子：k1|k2
2. ?=pattern 正向肯定預查例如：K(?=1|2|3) 當K匹配123中任意一個時選擇K 例子：k1中的k或者k2中的k
3. ?!pattern 正向否定預查例如：k(?!1|2|3) 當K不匹配123中的任意一個時選擇K 例子：不匹配k1中的k，不過可以是k4,k5
4. ?<=pattern 反向肯定預查例如：(?<=1|2|3)k 當K匹配123中任意一個時選擇K 例子：1k中的k或者2k中的K
5. ?<!pattern 反向否定預查例如：(?<!1|2|3)k 當k不匹配123中任意一個時例子：不匹配1k中的K可以是4k,5k

第十一個「|」
這個符號就是或的意思，比如：「f|good」能匹配「f」或「good」,如果這樣呢「(f|g)ood」則匹配「food」或「good」。

第十二個「[]」
這個符號是字元集和的意思，和「{}」看上去差不多，不過意義可就差多了。

第十三個「()」
這個符號式陣列或者是集合

1、[xyz] 匹配所包含的任意一個字元。就是說三個之中選擇一個。例子：「[abc]」可以匹配「company」中的「a」不過不可以匹配「beautiful」因為用到了裡面的兩個字母。
2、[^xyz] 這個是負值字元集合，也可以說成是「非」。例子：「[^abc]」可以匹配「drop」等！只要單詞裡沒有「abc」這三個字母就可以。
3、[a-z] 字元的範圍。匹配指定範圍內的任意字元。例如，「[a-z]」可以匹配「a」到「z」範圍內的任意小寫字母字元。也可以寫成「[0-9]」這個是匹配0到9直接打數位。
4、[^a-z] 這個我想不用說大家就應該想到是什麼意思了，對了!就是你想的那個意思：不在「a」到「z」範圍內的任意字元，一開始我看到這個的時候以為是不在a到z之間的字母呢！我說如果不在a到z之間的字母那只有漢語中的「ü」了！這個好像讀「喻」！呵呵！大家看清楚了啊！是字元，不是字母。

下面大家和我一起看看「」和字母所匹配的特殊含義，
「b」這個是匹配一個單詞的邊界，也就是指單詞和空格間的位置。例如，「erb」可以匹配「never」中的「er」，但不能匹配「verb」中的「er」。這個我感覺比較好記大家可以這樣記：邊界的邊是b開頭的！
「B」這個是和「b」是相反的,匹配非單詞邊界。「erB」能匹配「verb」中的「er」，但不能匹配「never」中的「er」。
「d」這個是用的比較多！我建議大家對這個多記記，這個是匹配數位字元，相當於[0-9]。
「D」這個也很好理解，也是相反的意思就是說不是數位的，相當於[^0-9]。
「f」這個是匹配一個換頁符。這個不做過多解釋了！下面的四個也就過多不做過多解釋了。只要記住就可以了！在專案中會用就可以了！
「n」這個是匹配一個換行符。
「r」這個是匹配一個回車符。
「t」這個是匹配一個製表符。
「v」這個是匹配一個垂直製表符。
「s」這個匹配任何空字元，匹配任何空白字元，包括空格、製表符、換頁符等等。等價於[ fnrtv]。也就是這個把上面的五個都包括了！
「S」這個是非空白字元等價於[^ fnrtv]。
說到這裡大家都可能感覺到正則其實就是這些字元嘛！而且有些是可以靠我們的邏輯思維推理出來的，而且有些是重複的，只要大家能夠靈活的運用就可以了。

「w」這個是匹配包括下劃線的任何單詞字元。等價於「[A-Za-z0-9_]」。這個在實際中用的也挺多的也建議大家多記記這個。

「W」這個是匹配非單詞數位字元。等價於「[^A-Za-z0-9_]」。

好的！基本上要記得就是這麼多了！這些可能有些正則高手該說了「你這個根本不全啊？」我先提前解釋一下吧，我所寫的只是一些基礎的，在專案中常見的，比較實用的，基本上這些在專案中就可以運用自如了。
接下來呢，和大家做一些實質性的東西，和大家一起解析一些正規表示式。
比如這個正則：^([0-1]?[0-9]|2[0-3]):([0-5][0-9]):([0-5][0-9])$
這個正則我想對正則高手來說一看就知道是什麼了。當然一些邏輯思維比較強的看兩眼也就知道這個是什麼了，沒錯就是時間正則。

OK 我們來解析一下這個正則從這個「^」開始，「([0-1]?[0-9]|2[0-3])」是個組，「[0-1]?」這個問號的作用是0或1最多有零個或者一個，「[0-9]」0至9之間任意一個數，「|」這個是「或」的意思，就是說不是「[0-1]?[0-9]」就是「2[0-3]」，「2[0-3]」這個是前面的2就是代表2，後面0至3是0到3之間任意一個數，「:」就是代表「:」,「([0-5][0-9])」也是個組，「[0-5]」是0到5之間任意一個數，「[0-9]」是0到9之間任意一個數，「:」也是本意，「([0-5][0-9])」也是個組，「[0-5]」是0到5之間任意一個數，「[0-9]」是0到9之間任意一個數，「$」這個是結束符。
再和大家解析一個小數

比如：^[1-9]+d*(.[0-9]{1,2})?|0(.[0-9]{1,2})?$
「^」是開始符，「[1-9]+」其中「+」的意思是1到9之間最少有一個或者多個，「d*」這個「d」是數位，這個「*」是最少有零個數位或者有多個數位，「(.[0-9]{1,2})?」這個組裡面「.」是原意點，「[0-9]{1,2}」 0到9之間有一個或者有兩個數位，後面這個問號「?」意思是有零個或者一個它「(.[0-9]{1,2})」。「|」是要麼是「[1-9]+d*(.[0-9]{1,2})?」要麼是「0(.[0-9]{1,2})?」。「0(.[0-9]{1,2})?」這個裡面的0是原意，「(.[0-9]{1,2})?」這個組裡面「.」是原意點，「[0-9]{1,2}」 0到9之間有一個或者有兩個數位，後面這個問號「?」意思是有零個或者一個它「(.[0-9]{1,2})」。

下面我例舉出一些常見的正規表示式來給大家說說：

^[1-9]d*$　//匹配正整數　　
^-[1-9]d*$ //匹配負整數　　
^-?[1-9]d*$　//匹配整數　　
^[1-9]d*|0$　//匹配非負整數（正整數 + 0）　　
^-[1-9]d*|0$　//匹配非正整數（負整數 + 0）　　
^[1-9]d*.d*|0.d*[1-9]d*$　//匹配正浮點數　　
^-([1-9]d*.d*|0.d*[1-9]d*)$　//匹配負浮點數　　
^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$　//匹配浮點數　　
^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$　//匹配非負浮點數（正浮點數 + 0）　　
^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$　//匹配非正浮點數（負浮點數 + 0）
^[a-zA-Z][a-zA-Z0-9_]{4,15}$ //匹配帳號是否合法(字母開頭，允許5-16位元組，允許字母數位下劃線)
^s*|s*$ //匹配首尾空白字元的正規表示式
ns*r //匹配空白行的正規表示式
[^x00-xff] //匹配雙位元組字元(包括漢字在內)
[u4e00-u9fa5] //匹配中文字元的正規表示式

使用者名稱
^[a-z0-9_-]{3,16}$

密碼
^[a-z0-9_-]{6,18}$

十六進位制值
^#?([a-f0-9]{6}|[a-f0-9]{3})$

電子郵箱
^([a-z0-9_.-]+)@([da-z.-]+).([a-z.]{2,6})$
^[a-zd]+(.[a-zd]+)*@([da-z](-[da-z])?)+(.{1,2}[a-z]+)+$

URL
^(https?://)?([da-z.-]+).([a-z.]{2,6})([/w .-]*)*/?$

IP 地址
((2[0-4]d|25[0-5]|[01]?dd?).){3}(2[0-4]d|25[0-5]|[01]?dd?)

或
^(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?).){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)$

HTML 標籤
^<([a-z]+)([^<]+)*(?:>(.*)</1>|s+/>)$

以上便是關於正規表示式的一些基礎知識配合實際例子的講解，希望可以幫助到對正規表示式感到迷惑的同學，如有錯誤請指出。

更多相關問題請存取PHP中文網：PHP視訊教學

以上就是正規表示式詳細基礎範例解析的詳細內容，更多請關注TW511.COM其它相關文章！