バイナリファイルも検索できる grep ソフト: VxGrep
最近話題の "heartbleed"。うまい表現だなあとしみじみ感心してしまいます(しみじみしている場合ではないのですが‥)。
今回は、VxGrep という名前の grep ソフトをご紹介します。
1. はじめに
grep 機能を持つソフトはいくつもありますし、頑張ればコマンドプロンプトでも実行できますが、このような手法の多くは、テキストファイルしか検索できません。
Office 2007 シリーズのファイルでは、ファイルを zip 形式に変換して xml ファイルを作り、テキストファイル用のツールで grep するという力技もありますが、あまり効率的ではありません。
2. VxGrep
VxGrep とは
VxGrep は、VxEditor というエディタソフトに付属している grep ソフトで、その名のとおり grep を行えます(余談ですが、grep は "Globally search for the Regular Expression and Print the lines containing matches to it" の略語だそうです。結構具体的な要件ですね)。
VxGrep の機能
VxGrep を使うと、pdf や word (doc、docx) などの、使用頻度が高い特定のバイナリファイルを、テキストファイルと一緒に grep できます。たとえば、参考資料用のフォルダを用意し、資料などのファイルをすべて放り込んで、VxGrep で検索すると、簡単に対象を抽出できます。
結果の一覧画面でダブルクリックすると、そのファイルを開くことができます。バイナリファイルの場合は対応したソフト、テキストファイルの場合は VxEditor で開かれます。
続いて、VxGrep の使用事例と使用方法についてご説明します。
3. 使用事例
- 翻訳対象ファイルと、生成済みや DTP 済みのファイルが複数あり、グローバルに修正したいが、対象がどのファイルに含まれているかわからない‥
- この案件であの用語って使って良いのかな?
→複数ファイルを一括検索・置換できます
- 資料としてさまざまな拡張子のファイルを複数いただいたが、1 つずつ検索している時間がない!
→pdf も doc も xls ファイルもまとめて検索できます
4. 使用方法
試しに使ってみます。
サンプルとして、pdf ファイル、docx ファイル、sdlxliff ファイルを 1 つのフォルダに用意しました。
VxGrep を起動します。検索設定画面が表示されます。
設定項目には、前回使用時のパラメータが表示されます。
今回は、それぞれ内容が異なるファイルを対象に、「海面水温」という用語を検索してみます(この用語は単に自分の趣味です)。
pdf や docx ファイルを検索対象に含めるには、[PDF,WORD,EXCEL, 一太郎などからテキスト要素を取り出す] のチェックを選択する必要があります。
パラメータを指定して [OK] をクリックします。
結果が表示されました。
pdf ファイルも docx ファイルも、まとめて検索できています。
冒頭でも少し触れましたが、この画面上でファイル名をダブルクリックすると、それを開くことができます。
5. 終わりに
このソフトは日本の方が開発しているため、2 バイト文字の正規表現や UI で悩む必要がないことも嬉しいです。
ここでご紹介した以外にもさまざまな設定項目があり、場面に応じてうまく使いこなすと、とても便利なソフトだと思います。
----------お知らせ----------
株式会社シーブレインでは、フリーランス翻訳者を募集しています。
リンク先のページに記載されている説明をお読みいただき、要項に従ってご応募ください。
みなさまからのチャレンジをお待ちしております。