Microsoft Office には標準で Multi-Page TIFF 対応の OCR ソフトがついている


以前から OCR ソフトがほしいと思っていたのですが,実は MS Office に付属していることを知りました。 Microsoft Office Document Imaging です。

Microsoft Office Document Imaging ではスキャナから読み込んだドキュメントはもちろん, TIFF 形式の画像を読むこともできます。昔の論文は HTML や PDF で提供されずに画像形式で提供されていたり自分で雑誌からスキャンする必要がありますので,コンピュータで文章を利用するためには OCR はほぼ必須です。最悪打ち込みという手もありますけどね。

ちなみにこのソフトは Multi-Page TIFF ファイルに対応しており,複数の画像ファイルを 1 つの TIFF ファイルにまとめることもできます。ただし読み取りは TIFF (もしくは MDI) でなければならないため,事前に画像ファイルを TIFF 形式に変換する必要があります。ビットマップ形式や JPEG 形式のファイルを TIFF 形式に変換するのは Windows に標準で付属しているペイントや他のソフトウェアでも可能です。