皆さま、こんにちは。ホンヤク社の成田です。
先週末は全国的に大寒波でしたが、その後今週は比較的穏やかな天候でした。インフルエンザなども引き続き流行していますが、皆さまの周辺は大丈夫でしょうか。
本日は、前回に引き続き「[ ]」と「-」を組み合わせた正規表現についてお話ししたいと思います。さまざまな範囲指定の例をご紹介いたします。
<使用例>
[ぁ-んァ-ーヲ-゚]
⇒ ひらがな、全角カタカナ、半角カタカナ1文字がヒットします。前回ご紹介した範囲指定を [ ] の中に続けて記述するとこのような検索が可能です。
[0-90-9]
⇒ 全角・半角を問わず数字1文字がヒットします。「\d」と同じものと理解してくださって結構です。なお、[^0-90-9]とすると「\D」と同じです。
[\!-~]
⇒ 半角記号あるいは半角英数字1文字がヒットします。この範囲指定で含まれる記号は「!”#$%&'()*+,-./:;<=>?@[\]^_`{|}~」で、よく使われるものは網羅されていますが、比較的マイナーな記号でここに含まれていないものもあるためご注意ください。「!」の前の「\」はエスケープのためのものです。
[\!-~°©»]
⇒ 範囲指定に単独の文字を付け足すようなことも可能です。たとえば、上記の [\!-~] に含まれない「°」「©」「»」の3文字も一緒に検索したいときに、この例のように任意で付け足した上でまとめて検索できます。
[、-鶴] ※「鶴」は、「つる」で変換してすぐに出てくる「鶴」とは少し違う字です。
⇒ 漢字を検索することも可能です。上記は、ひらがな、全角カタカナ、漢字、全角記号のうち1文字がヒットします。[ -鶴0-9a-zA-Z](最初の文字は全角スペース)のようにすると、スペースや英数字を含むほぼすべての全角文字を検索できます。
いかがでしたでしょうか? 英訳の訳文中に全角文字が混在していないかチェックしたり、記号をまとめて検索したりなど、上記のような正規表現を利用してさまざまな確認や修正作業を行えることがおわかりになったかと思います。
次回は、「指定文字列のいずれか1つ」を表す「( | )」についてお話しします。
