サイトマップ お問い合わせ・お見積り English
ホンヤク社からのお知らせ | 翻訳サービス「ホンヤク社」
  1. HOME>
  2. 原文ファイルのトリセツ>
  3. 正規表現「¥b」(単語の境界)編
ご相談窓口
お問い合わせ:03-6841-1121
お問い合わせ・お見積もり
登録スタッフ応募フォーム
ホンヤク社からのお知らせ

新着/更新情報

世界翻訳ニュース

原文ファイルのトリセツ

ホンヤク社グループ
 ホンヤク社では語学に関する様々な
 ソリューションを行っています
通訳派遣事業部
SRT事業部
弊社は、北米での販売展開をより強力に推進するために、米国カリフォルニア州において現地法人を設立いたしました。
加盟団体
・一般社団法人 日本翻訳協会(JTA)
・一般社団法人 日本翻訳連盟(JTF)
・アメリカ翻訳者協会 (ATA)
・東京商工会議所
・東京都弁護士協同組合 特約店
・一般労働者派遣事業
 (派) 13-305172
・有料職業紹介事業
  13-ユ-305608
プライバシーマーク 株式会社ホンヤク社は
「プライバシーマーク」
使用の許諾事業者とし
て認定されております。
原文ファイルのトリセツ 翻訳のデータにおける注意点や役立つ知識などをご紹介いたします
No.141

正規表現「¥b」(単語の境界)編

公開日:2017年11月10日
皆さま、こんにちは。ホンヤク社の成田です。
秋が深まるのを感じる寒い一週間でした。いかがお過ごしでしょうか。

今回は、単語の境界を表す「¥b」についてお話しします。単語の境界、というのはイメージしづらいかもしれませんが、たとえば、検索する文字列を「hand」とした場合に、単語の「hand」は当然ヒットしますが、同時に「handle」「beforehand」や先方や後方一致のケース、あるいは「merchandise」といった部分一致のケースの「hand」という文字列を拾ってしまう可能性があります。限定して「hand」という単語のみを検索したいときに、この正規表現が使えます。

¥b

「単語の境界」を表す正規表現です。任意の文字列の前や後につけて、単語の区切り目を条件づける形で文字列を検索できます。なお、この単語の境界には、単語間のスペースをはじめ、行頭や行末や記号などが含まれ、より厳密にいえば「¥w」と「¥W」の境界のことを指します。

<使用例>
¥bhand¥b
⇒ 「hand」という文字列がヒットします。冒頭の例でいえば「handle」「beforehand」「merchandise」の中の「hand」はヒットしません。ただし、この場合は複数形の「hands」もヒットしませんので、単数と複数形両方をヒットさせたい場合は「¥bhands?¥b」(handの後にsが0個か1個ある)というような書き方にすればよいかと思います。

¥bhand
⇒ 「hand」の前だけに単語の境界があるので、冒頭の例でいえば「hand」と「handle」の中の「hand」がヒットします。なお、行頭などでの出現が想定される「Hand」もまとめてヒットさせたい場合は、「¥b[hH]and」と書いてください。※[ ] については次回から詳しくお話しします。

hand¥b
⇒ 「hand」の後だけに単語の境界があるので、冒頭の例でいえば「hand」と「beforehand」の中の「hand」がヒットします。

また、「単語の境界以外」を表す「¥B」という正規表現もあります。これはその名の通り、「¥b」と反対の機能を持ちます。


<使用例>
¥Bhand¥B
⇒ 「hand」の前後が単語の境界でないという意味ですので、冒頭の例の「merchandise」の中の「hand」がヒットします。

いかがでしたでしょうか? 検索や絞り込み対象をより厳密に仕分けたいときに、補助的にこれら「¥b」「¥B」を効果的に活用くださればと思います。

次回は、「指定文字のいずれか1文字」を表す「[ ]」についてお話しします。
< 前の記事 次の記事 >
最新の記事(10件)
2017.11.17 No.142 正規表現「[ ]」(指定文字のうちいずれか1文字)編(その1)
2017.11.10 No.141 正規表現「¥b」(単語の境界)編
2017.11.03 No.140 正規表現「$」(文字列の末尾)編
2017.10.27 No.139 正規表現「^」(文字列の先頭)編
2017.10.20 No.138 正規表現「{n}」(直前文字のn回繰り返し)編(その2)
2017.10.13 No.137 正規表現「{n}」(直前文字のn回繰り返し)編(その1)
2017.10.06 No.136 正規表現「?」(直前文字の0回か1回の出現)編
2017.09.29 No.135 正規表現「+」(直前文字の1回以上繰り返し)編
2017.09.22 No.134 正規表現「*」(直前文字の0回以上繰り返し)編
2017.09.15 No.133 正規表現「¥d」(全角・半角数字1文字)編
バックナンバーはこちら
通訳派遣事業部 | SRT事業部 | HONYAKU USA INC