正規表現 組み合わせ例その9 文字種を指定した表現

原文ファイルのトリセツ

皆さま、こんにちは。ホンヤク社の成田です。
大型連休が迫っています。皆さまはいかがお過ごしでしょうか。

 

今回は、文字の種類を指定した表現についてご紹介します。これまでに紹介した組み合わせ例と多少似ているものもありますが、特に翻訳のチェックの際に使えるものを中心にお話ししていきたいと思います。

 

<組み合わせ例>
[0-90-9]+
⇒ 1文字以上の数字がヒットします。数字のエラーをチェックしたいときに数字を検索したり、フィルタで数字が含まれるセグメントを絞り込んだりしたいときに使えます。ただし、この例では全角も半角もまとめられているため、分けて検索したい場合は注意が必要です。

 

[ -鶴0-9a-zA-Z]+ ※※最初は全角スペースです
⇒ スペースや英数字を含むほぼすべての全角文字を文字列(まとまり)単位で検索できます。たとえば、和文英訳した訳文に全角文字が残っていないかチェックしたり、あるいは検出した全角文字をまとめて置換したりするときに使えるかと思います。さらに半角カタカナも含めたい場合は「ヲ-゚」を追記してください。

 

[\!”#$%&’\(\)\*\+,\-\./:;<=>\?@\[\\\]\^_`\{\|\}~°©»]+
⇒ 半角記号「!”#$%&'()*+,-./:;<=>?@[\]^_`{|}~°©»」1文字以上がヒットします。英文和訳で、訳文に半角記号が残っていないか、または全角と半角が混在していないかチェックするときに使えるかと思います。比較的マイナーな記号は含まれていないため必要に応じて追記してください。また、エスケープの「\」が非常に多いですのでその点もご注意ください。

 

いかがでしたでしょうか? 文字の種類を指定した表現にが翻訳のチェックに役立つことがおわかりいただけたら幸いです。特に、人が目でチェックするよりも機械的な検索のほうが速度的にも精度的にも良い場合もありますので、ぜひこれらご活用くださればと思います。

次回は、特定の英単語を検索する表現についてご紹介したいと思います。