什麼是正規表示式？

正規表示式是一組由字母和符號組成的特殊文字，它可以用來從文字中找出滿足你想要的格式的句子。

一個正規表示式是一種從左到右匹配主體字串的模式。
「Regular expression」這個詞比較拗口，我們常使用縮寫的術語「regex」或「regexp」。
正規表示式可以從一個基礎字串中根據一定的匹配模式替換文字中的字串、驗證表單、提取字串等等。

想象你正在寫一個應用，然後你想設定一個使用者命名的規則，讓使用者名稱包含字元、數位、下劃線和連字元，以及限制字元的個數，好讓名字看起來沒那麼醜。
我們使用以下正規表示式來驗證一個使用者名稱：

以上的正規表示式可以接受 john_doe、jo-hn_doe、john12_as。
但不匹配Jo，因為它包含了大寫的字母而且太短了。

元字元	描述
.	句號匹配任意單個字元除了換行符。
[ ]	字元種類。匹配方括號內的任意字元。
[^ ]	否定的字元種類。匹配除了方括號裡的任意字元
*	匹配>=0個重複的在*號之前的字元。
+	匹配>=1個重複的+號前的字元。
?	標記?之前的字元為可選.
{n,m}	匹配num個大括號之前的字元或字元集 (n <= num <= m).
(xyz)	字元集，匹配與 xyz 完全相等的字串.
\|	或運運算元，匹配符號前或後的字元.
\	跳脫字元,用於匹配一些保留的字元 `[ ] ( ) { } . * + ? ^ $ \ \|`
^	從開始行開始匹配.
$	從末端開始匹配.

2.1 點運運算元 `.`

.是元字元中最簡單的例子。
.匹配任意單個字元，但不匹配換行符。
例如，表示式.ar匹配一個任意字元后面跟著是a和r的字串。

".ar" => The car parked in the garage.

".ar" => The car parked in the garage.

簡寫	描述
.	除換行符外的所有字元
\w	匹配所有字母數位，等同於 `[a-zA-Z0-9_]`
\W	匹配所有非字母數位，即符號，等同於： `[^\w]`
\d	匹配數位： `[0-9]`
\D	匹配非數位： `[^\d]`
\s	匹配所有空格字元，等同於： `[\t\n\f\r\p{Z}]`
\S	匹配所有非空格字元： `[^\s]`
\f	匹配一個換頁符
\n	匹配一個換行符
\r	匹配一個回車符
\t	匹配一個製表符
\v	匹配一個垂直製表符
\p	匹配 CR/LF（等同於 `\r\n`），用來匹配 DOS 行終止符

符號	描述
?=	正先行斷言-存在
?!	負先行斷言-排除
?<=	正後發斷言-存在
?<!	負後發斷言-排除

標誌	描述
i	忽略大小寫。
g	全域性搜尋。
m	多行修飾符：錨點元字元 `^` `$` 工作範圍在每行的起始。

正規表示式完整入門教學，含線上練習

什麼是正規表示式？

目錄

1. 基本匹配

2. 元字元

2.1 點運運算元 .

2.2 字元集

2.2.1 否定字元集

2.3 重複次數

2.3.1 * 號

2.3.2 + 號

2.3.3 ? 號

2.4 {} 號

2.5 (...) 特徵標群

2.6 | 或運運算元

2.7 轉碼特殊字元

2.8 錨點

2.8.1 ^ 號

2.8.2 $ 號

3. 簡寫字元集

4. 零寬度斷言（前後預查）

4.1 ?=... 正先行斷言

4.2 ?!... 負先行斷言

4.3 ?<= ... 正後發斷言

4.4 ?<!... 負後發斷言

5. 標誌

5.1 忽略大小寫 (Case Insensitive)

5.2 全域性搜尋 (Global search)

5.3 多行修飾符 (Multiline)

6. 貪婪匹配與惰性匹配 (Greedy vs lazy matching)

2.1 點運運算元 `.`

2.3.1 `*` 號

2.3.2 `+` 號

2.3.3 `?` 號

2.4 `{}` 號

2.5 `(...)` 特徵標群

2.6 `|` 或運運算元

2.8.1 `^` 號

2.8.2 `$` 號

4.1 `?=...` 正先行斷言

4.2 `?!...` 負先行斷言

4.3 `?<= ...` 正後發斷言

4.4 `?<!...` 負後發斷言