皆さま、こんにちは。ホンヤク社の成田です。
東京は、運動会日和の好天が続いた一週間でした。皆さまはいかがお過ごしでしたでしょうか。
本日は、「\w」という正規表現についてお話しします。Trados上では、全角文字、半角カナ、半角英数字またはアンダースコア1文字として使える正規表現です。
\w
「全角文字、半角カナ、半角英数字またはアンダースコア1文字」を表す正規表現です。全角/半角、ひらがな/カタカナ/漢字/英数字など、テキストの種類は問いませんが、記号やスペースは含まれません。
実際に「\w」を使った検索例をいくつかご紹介したいと思います。前回の「.」の使用例と比較すると、違いがわかりやすいかと思います。
<使用例>
c\wt
⇒ 「cat」「cut」など、「c」と「t」の間に1文字が入っているテキストのまとまりが検索結果として表示されます。「ctt」「cあt」など、スペルミスや入力ミスなどがあった場合でもヒットしますが、「c@t」「c t」など、間の1文字が記号やスペースの場合はヒットしません。
c\w\wt
⇒ 「coat」「chat」など、「c」と「t」の間に2文字が入っているテキストのまとまりが検索結果として表示されます。
第\w章
⇒ 「第1章」「第五章」など、「第」と「章」の間に1文字が入っているテキストのまとまりが検索結果として表示されます。「第10章」など2文字のものは「第\w\w章」というように2文字分入力しないとヒットしません。
また、この「\w」の逆を表す正規表現として、「\W」(大文字のW)があります。
\W
「全角文字、半角カナ、半角英数字またはアンダースコア以外の1文字」を表す正規表現です。主に記号やスペースが対象となります。たとえば、記号やスペースの使用が許されないセグメントなどがあった場合にこの「\W」を使用したチェックを行ったり、「\W\w\w\w\W」(「”ABC”」「!123!」「<XYZ>」のような文字列がヒットします)のように組み合わせて、一定の法則がある文字列を検出するのに活用したりできます。
いかがでしたでしょうか? なお、この「\w」は「\」を外すと単に「w」という英文字として扱われてしまいますので、必ず「\」をつけてご使用ください。
次回は、「全角・半角スペース、タブ、改行1文字」を表す「\s」についてお話しします。
 
				 
				