正規表現を使った日本語検索式の例
■ 係り受け表現を検索:※ 記号類はすべて半角文字であることに注意
/全く.*?ない/
(「全く」と「ない」の間に「.*?」を挟む.「.*?」は何らかの0個以上の文字に最短一致の意.)
/全く[^(、|。)]*?ない/
(「全く」と「ない」の間に [^(、|。)]*? を挟む.[クラス]内先頭のキャレット(^)は否定を表す.「全く」と「ない」の間に句読点がこないよう指定している.)
■ OR検索(表記にゆれがあるときなどに便利):
/(全く|まったく)/
/(総理|首相|宰相)/
/(原発|原子力発電所)/
/総理(は|が|の|に|を)/
(「|」は「または (OR)」を表す.)
組み合わせると、
/(全く|まったく).*?(ない|なかった|ありません)/
■ あってもなくてもよい要素を指定:
/鳩山(由起夫)?(前|元)?総理/
(文字類に続く「?」は直前の要素があってもなくてもよいことを表している.)
以上を組み合わせると、
/(鳩山|菅)[^(、|。)]*?(前|元)?(総理|首相|総裁)/
などと表現できる.
(「鳩山」または「菅」が最初にくる.続いて句読点以外の文字が0回以上最短一致で続く.それに続き「前」「元」のいずれかがあってもなくてもよい.続いて「総理」「首相」「総裁」いずれかの文字列が続く,の意.)
■ 先読み・後読みの指定:
不要なデータ(ノイズ)が検索されてしまう場合に指定するとよい。
/相応(?!じ|ず|ぜ)/
(後に「じ」「ず」「ぜ」が来ない「相応」という文字列、の意。)