Ruby正規表示式 - tw511教學網

正規表示式也拼寫為 regexp，它用於儲存正規表示式，用於將模式與字串匹配。在Ruby中，一個模式寫在正斜槓字元之間。它們描述一個字串的內容。 Ruby正規表示式更類似於Perl正規表示式。

語法

/search string/

Ruby 1.9使用Oniguruma正規表示式庫，但Ruby 2.0使用Onigmo正規表示式庫。 Onigmo是Oniguruma的一個分支子庫，增加了一些新功能。

=~ 和 #match操作符

通過使用=~和#match操作符來實現模式匹配。

=~

這是基本的匹配模式，這裡使用兩個運算元。一個是正規表示式，另一個是字串。正規表示式與字串匹配。

如果找到匹配，則運算子返回第一個匹配索引，否則返回零(nil)。

範例：

F:\worksp\ruby>irb
irb(main):001:0> /yii/ =~ 'Hello, welcom to tw511.com.'
=> 17
irb(main):002:0> /to/ =~ 'Hello, welcom to tw511.com.'
=> 14
irb(main):003:0> /too/ =~ 'Hello, welcom to tw511.com.'
=> nil
irb(main):004:0>

#match

該運算子返回匹配資料物件，否則返回零(nil)。

F:\worksp\ruby>irb
irb(main):001:0> /yiibai/.match('Ruby tutorial at tw511.com')
=> #<MatchData "yiibai">
irb(main):002:0> /Ruby/.match('Ruby tutorial at tw511.com')
=> #<MatchData "Ruby">
irb(main):003:0> /Py/.match('Ruby tutorial at tw511.com')
=> nil
irb(main):004:0>

元字元和跳脫

元字元在模式中具有特定含義。要匹配一個字串，它們將被轉回(\)或跳脫。一些元字元是(，)，(.)，(？)，(+)，( - )，(*)，[，]，{，}。否則返回匹配的字串。

範例：

F:\worksp\ruby>irb
<elcome to our site\./.match('Does Hello, welcome to our site.')
=> #<MatchData "Hello, welcome to our site.">
irb(main):003:0> /2 \* 2 \+ 3 \- 1 = \?/.match('Does 2 * 2 + 3 - 1 = ?')
=> #<MatchData "2 * 2 + 3 - 1 = ?">
irb(main):004:0> /2 * 2 + 3 - 1 = ?/.match('Does 2 * 2 + 3 - 1 = ?')
=> nil
irb(main):005:0>

字元類

元字元在模式中具有特定含義。要匹配一個字串，它們將被轉回(\)或跳脫。

一個字元類被包圍在方括號內。

[ab]

這裡，[ab]表示a或b。與/ab/相反，它表示a和b。

範例

F:\worksp\ruby>irb
irb(main):001:0> /j[afdvs]av/.match('java')
=> nil
irb(main):002:0> /j[afdvs]va/.match('java')
=> #<MatchData "java">
irb(main):003:0> /j[afdvs]va/.match('jpva')
=> nil
irb(main):004:0>

[a-d]

這裡，[a-d]等同於[abcd]。連字元(- )字元類表示字元的範圍。

範例

F:\worksp\ruby>irb
irb(main):001:0> /[a-ge-p]/.match('go')
=> #<MatchData "g">
irb(main):002:0> /[a-fe-p]/.match('go')
=> #<MatchData "g">
irb(main):003:0>

[^a-d]

^符號表示範圍中不存在的任何其他字元。

範例

F:\worksp\ruby>irb
irb(main):001:0> /[^a-ge-p]/.match('go')
=> nil
irb(main):002:0> /[^a-ge-n]/.match('go')
=> #<MatchData "o">
irb(main):003:0> /[^a-fe-n]/.match('go')
=> #<MatchData "o">
irb(main):004:0> /[^a-fh-n]/.match('go')
=> #<MatchData "g">
irb(main):005:0>

重複

現在定義的字元與單個字元匹配。在重復元字元的幫助下，可以指定需要發生的次數。這些元字元稱為量詞。

* : 零次或多次
+ : 一次或多次
? : 零次或一次(可選)
{n} : 正好n次
{n, }: n次以上
{,m} : m次以下
{n,m} : 至少n和最多m次

範例

irb(main):006:0> "SSSIT".match(/S{3}+[[:upper:]]+[[:upper:]]/)
=> #<MatchData "SSSIT">
irb(main):007:0>
irb(main):008:0*
irb(main):009:0* "yiiBaicom".match(/[[:lower:]]+[[:upper:]]+com/)
=> nil
irb(main):010:0> "yiiBAIcom".match(/[[:lower:]]+[[:upper:]]+com/)
=> #<MatchData "yiiBAIcom">
irb(main):011:0>

分組

分組使用括號將專案組合在一起。將這些術語分組成一個。

範例：

F:\worksp\ruby>irb
irb(main):001:0> /[aeiou]\w{2}/.match('family')
=> #<MatchData "ami">
irb(main):003:0> /([aeiou]\w){2}/.match('family')
=> #<MatchData "amil" 1:"il">
irb(main):004:0>

在這個例子中，第一個模式匹配一個元音，後跟兩個字元。

在第二種模式中，它匹配一個元音後跟一個字元，兩次。

(?:..)

此表示式提供分組而不捕獲。它結合術語而不建立反向參照。

範例：

irb(main):006:0> /I(n)(de)pen\2\1tly/.match('independently')
=> nil
irb(main):007:0> /i(n)(de)pen\2\1tly/.match('independently')
=> #<MatchData "independently" 1:"n" 2:"de">
irb(main):009:0> /i(?:n)(de)pen\1ntly/.match('independently')
=> #<MatchData "independently" 1:"de">
irb(main):010:0>