【サルにもわかる正規表現入門】

その4

3.メタ文字の種類

(6)グループ化  ( )

今までのメタ文字は主に1文字を対象としていました。しかし、まとめて数文字単位で処理できると便利な場合があります。こんな時に便利なのが ( ) です。( )( ) の中をグループ化してくれます。この機能は非常に強力ですので、知っていて損はないと思います。
 
正  規  表  現
 が+ーん 
検索できる文字列の例
 ががーん   ががががーん   がががーん

この例では、+ は直前の文字の1個以上の繰り返しなので、「検索できる文字列の例」のような文字列に合致します。

ところが、
 

正  規  表  現
 (じゃ)+ーん 
検索できる文字列の例
 じゃーん   じゃじゃーん   じゃじゃじゃーん

この例では、( ) が使用されていますが、 + の直前の文字というのは、従来の1文字ではなく、( )に囲まれた部分の文字列になります。

つまり、「じゃ」の1回以上の繰り返しということになる訳です。

また、
 

正  規  表  現
 明日ぼく|わたしは帰宅します 
検索できる文字列の例
 明日ぼく     わたしは帰宅します

この例では、「明日ぼく」「わたしは家に帰ります。」の文字列のいずれかが検索されますが、
 

正  規  表  現
 明日(ぼく|わたし)は帰宅します
 
検索できる文字列の例
 明日ぼくは帰宅します   明日わたしは帰宅します

この例では、まず、( ) の中を先に処理します。つまり、「ぼく」か「わたし」のいずれかの文字列を選びます。そして、( ) の外の文字列をそのまま連結します。すると「検索できる文字列の例」のように、2通りの文字列が検索できるのです。