スキャナーで取り込んだPDFを、テキスト

スキャナーで取り込んだPDFを、テキスト検索可能なPDFに変換したい

スキャナーで取り込んだ書籍などのPDFを、

SkyPDF Converterを使って、テキスト検索可能なPDFに変換する際の

文字認識の精度をあげる方法をご紹介します。

※ただし、テキスト検索可能なPDF化機能に対応したスキャナもあります。

　ご利用のスキャナを確認してください。

■対策

【対策１】スキャンでPDFを作る際に画像の傾きをなくす

　本の見開きページをスキャンする場合は、
　本を強く押すなど、できる限り、左右の傾きが無い状態にします。
　または、片ページ単位でスキャンします。
　その場合、もう片方のページの文字部分がかからないようスキャンします。

【対策２】Converter で透明テキスト付PDFを作る

　スキャナで取り込んだPDFを、以下の手順で
　「テキストを含むPDFも画像PDF」に設定します。

　手順）
　［設定］-［認識］タブ-「テキストを含むPDFも画像PDFとして処理を行う」にチェックしてください。

＜補足＞

①テキストを含むPDFは、ConverterではOCRエンジンによる文字認識は実行されず、元の状態のまま出力されます。
　そのため、スキャナで取り込んだ時点のPDF（透明テキスト付PDFではない状態のPDF）を、Converterで変換してください。

②ConverterのOCRエンジンは、画像の傾きを補正する処理を行ってから、
　文字認識を実行しますが、傾き補正は、”ページ全体”でしか行えません。