バイナリファイルも検索できる grep ソフト: VxGrep

バイナリファイルも検索できる grep ソフト: VxGrep

最近話題の "heartbleed"。うまい表現だなあとしみじみ感心してしまいます(しみじみしている場合ではないのですが‥)。
今回は、VxGrep という名前の grep ソフトをご紹介します。

1. はじめに

grep 機能を持つソフトはいくつもありますし、頑張ればコマンドプロンプトでも実行できますが、このような手法の多くは、テキストファイルしか検索できません。

Office 2007 シリーズのファイルでは、ファイルを zip 形式に変換して xml ファイルを作り、テキストファイル用のツールで grep するという力技もありますが、あまり効率的ではありません。

2. VxGrep

VxGrep とは

VxGrep は、VxEditor というエディタソフトに付属している grep ソフトで、その名のとおり grep を行えます(余談ですが、grep は "Globally search for the Regular Expression and Print the lines containing matches to it" の略語だそうです。結構具体的な要件ですね)。

VxGrep の機能

VxGrep を使うと、pdf や word (doc、docx) などの、使用頻度が高い特定のバイナリファイルを、テキストファイルと一緒に grep できます。たとえば、参考資料用のフォルダを用意し、資料などのファイルをすべて放り込んで、VxGrep で検索すると、簡単に対象を抽出できます。

結果の一覧画面でダブルクリックすると、そのファイルを開くことができます。バイナリファイルの場合は対応したソフト、テキストファイルの場合は VxEditor で開かれます。

続いて、VxGrep の使用事例と使用方法についてご説明します。

3. 使用事例

  • 翻訳対象ファイルと、生成済みや DTP 済みのファイルが複数あり、グローバルに修正したいが、対象がどのファイルに含まれているかわからない‥
  • この案件であの用語って使って良いのかな?

       →複数ファイルを一括検索・置換できます


  • 資料としてさまざまな拡張子のファイルを複数いただいたが、1 つずつ検索している時間がない!


       →pdf も doc も xls ファイルもまとめて検索できます

4. 使用方法

試しに使ってみます。
サンプルとして、pdf ファイル、docx ファイル、sdlxliff ファイルを 1 つのフォルダに用意しました。



VxGrep を起動します。検索設定画面が表示されます。
設定項目には、前回使用時のパラメータが表示されます。


今回は、それぞれ内容が異なるファイルを対象に、「海面水温」という用語を検索してみます(この用語は単に自分の趣味です)。

pdf や docx ファイルを検索対象に含めるには、[PDF,WORD,EXCEL, 一太郎などからテキスト要素を取り出す] のチェックを選択する必要があります。
パラメータを指定して [OK] をクリックします。

結果が表示されました。


pdf ファイルも docx ファイルも、まとめて検索できています。
冒頭でも少し触れましたが、この画面上でファイル名をダブルクリックすると、それを開くことができます。

5. 終わりに

このソフトは日本の方が開発しているため、2 バイト文字の正規表現や UI で悩む必要がないことも嬉しいです。

ここでご紹介した以外にもさまざまな設定項目があり、場面に応じてうまく使いこなすと、とても便利なソフトだと思います。


----------お知らせ----------

株式会社シーブレインでは、フリーランス翻訳者を募集しています
リンク先のページに記載されている説明をお読みいただき、要項に従ってご応募ください。

みなさまからのチャレンジをお待ちしております。

この記事を読んだ人にオススメ