正規表現「\s」(全角・半角スペース、タブ、改行1つ)編

原文ファイルのトリセツ

皆さま、こんにちは。ホンヤク社の成田です。
だんだんと寒くなってきました。皆さまはいかがお過ごしでしょうか。

 

本日は、「\s」という正規表現についてお話しします。Trados上では、全角・半角スペース、タブ、改行1つとして使える正規表現です。日本語テキスト、英数字、記号などはヒットしません。

 

\s
「全角・半角スペース、タブ、改行1つ」を表す正規表現です。また、前回の「\w」と同様に、「\S」(大文字のS)とすると、全角・半角スペース、タブ、改行以外の1文字という正規表現になります。

 

<使用例>
\s\s
⇒ ダブルスペースを検索できます。置換を使って機械的にダブルスペースをシングルスペースに置き換えることも可能です。ただし、連なっているスペースとタブの組み合わせのようなケースもヒットしてしまうため、やや注意が必要です。また、同様に「\s\s\s」とすればトリプルスペースを検索できます。

 

〒\s105\s0022
⇒ 「〒 105 0022」のように「〒」と郵便番号の上3桁と下4桁がタブやスペース等で仕切られている文字列がヒットします。次回にご紹介する「任意の数字1文字」を表す「\d」を使えば、あらゆる郵便番号を対象にした検索が可能になります。

 

\S\S\s\S\S
⇒ 「翻訳 太郎」のように「全角・半角スペース、タブ、改行以外の1文字が2つ」と「全角・半角スペース、タブ、改行1つ」と「全角・半角スペース、タブ、改行以外の1文字が2つ」の組み合わせがヒットします。前回の「\w」を使用して「\w\w\s\w\w」のようにしても、(厳密には違いはありますが)同じような検索結果を出せます。

 

いかがでしたでしょうか? この「\s」はワイルドカードにはないものですので、正規表現ならではの検索や置換に使えます。スペース、タブ、改行が一緒になってしまうのが注意しなければならない点ですが、翻訳後のチェックなどでも活用できるかと思います。

 

次回は、「全角・半角数字1文字」を表す「\d」についてお話しします。