Trados Studioのフィルタ機能で使う正規表現
Trados Studioのフィルタ機能は、検索条件にマッチする文節を絞り込んで表示します。フィルタした文節をアクティブにした状態でフィルタを解除するなど、操作の仕方によっては、普通の検索機能の代わりとしてもある程度使えます。
普通の検索機能とは異なり、フィルタ機能ではデフォルトで正規表現が有効になっています。そのため、正規表現について多少知っておいた方が使いやすくなります。かといって、この機能でややこしい正規表現を使うこともあまりないかなと思います。簡単な正規表現をいくつか覚える練習場所としては都合がいいのではないでしょうか。フィルタ機能でよく使う正規表現をいくつか紹介します。
1. エスケープ(\)
ピリオド.やカッコ( )など、一部の記号は正規表現では特別な意味を持っているので、検索語としてそのまま入力することはできません。ピリオドやカッコなどを検索したい場合は、その前にエスケープ文字(\)を入力します。たとえば、「(1.5)」と検索したい場合は、「\(1\.5\)」と入力します。とりあえずこれを知っておかないと、なんか変だな、と思う場面が出てきてしまいます。フィルタ結果に納得がいかない場合は、何かをエスケープし忘れていないか確認してみましょう。
2. 文節の最初(^)と最後($)
PowerPointを翻訳している場合などはとくに、単語1つだけの文節が大量に出てくることがあります。その文節だけに絞り込みたい場合は、「^単語$」のように、単で始まり語で終わる、と指定してやると便利です。このようにしないと、「単語を覚えきれない」「初めてみる単語」など、「単語」を含む他の文節もマッチしてきてしまいます。
3. 前後にあったりなかったり
以前、別の記事を書きました。この機能は、フィルタでも便利です。
たとえば、「コンピュータ」を「コンピューター」にしようかな、と考えている場合、「コンピュータ」と検索すると、すでに「コンピューター」となっているものにもヒットしてしまいます。
このようなときは、「コンピュータ(?!ー)」として、コンピュータのあとに長音がないやつ、と指定できます。置換する段階では、「コンピュータ」を「コンピューター」に置換してから「コンピューターー」を「コンピューター」に置換する、という方法もありますね。
4. 文字種の指定
アルファベットと数字の間にスペースを入れたい、漢字が6文字以上連続しないようにしたい、などのややこしい事情がある場合、文字の種類を指定できると便利です。
厳密にやろうとすると大変なので、多少うまくいかない場合があるのは仕方ないということでご容赦いただくと、たとえば、アルファベットと数字の間にスペースがないやつは「(\p{Lu}|\p{Ll})\p{Nd}|\p{Nd}(\p{Lu}|\p{Ll})」、漢字が6文字以上連続しているところは「\p{IsCJKUnifiedIdeographs}{6,}」などとすると検索できます。
こういう連中は何度も書きたくないので、どこかにメモをとっておくか、QA Checkerに登録していくとよさそうです。
人によってはまったく必要ないものもあると思います。気が向いたときに試してみてください。