正規表現「\d」(全角・半角数字1文字)編

原文ファイルのトリセツ

皆さま、こんにちは。ホンヤク社の成田です。
あっという間に11月も半分が過ぎようとしており、年末の足音が聞こえてきています。皆さまはいかがお過ごしでしょうか。

 

今回は「\d」という正規表現を扱います。Trados上では、任意の全角・半角数字1文字として使える正規表現です。

 

\d
「全角・半角数字1文字」を表す正規表現です。また、「\D」(大文字のD)とすると、全角・半角数字以外の1文字という正規表現になります。

 

<使用例>
〒\s\d\d\d\s\d\d\d\d
⇒ 前回お話しした「〒 105 0022」のように「〒」と郵便番号の上3桁と下4桁がタブで仕切られている文字列がヒットします(「\s」はスペースや改行も含まれる点にご注意ください)。「\d」を使えば、あらゆる郵便番号を対象にした検索が可能になります。

 

\d\d\d\d年
⇒ 「1972年」「2017年」のように「数字4桁」と「年」の組み合わせがヒットします。「\d\d\d\d/\d\d/\d\d」とすれば「1972/02/20」「2017/12/31」のような文字列の検索ができます。ただし、「\d」1つにつき1文字ですので、「1972/2/20」(2月が「02」ではなく「2」のみ)はヒットしません。同様に、「\d\d:\d\d:\d\d」とすれば「10:35:49」「23:56:11」のような文字列を検索できます。

 

\w\w\w\.\s\d\d
⇒ 「Feb. 13」「Aug. 25」のような「全角文字、半角カナ、半角英数字またはアンダースコア1文字3つ」と「.」と「数字2桁」の組み合わせを検索できます。「.」の前に「\」がついているのはエスケープです。つけないと、任意のあらゆる1文字を表す正規表現「.」として扱われます。

 

いかがでしたでしょうか? もう1つこの「\d」の注意点ですが、半角と全角の数字が一緒に扱われてしまうため、たとえば1つの文書に「24」「24」「24」「24」が混在していたとしても、それらを区別することはできません。英数字の全角半角チェックなどを行いたい場合の正規表現は、また別の回にあらためてご紹介したいと思います。

 

次回は、「直前文字の0回以上繰り返し」を表す「*」についてお話しします。