SKYCOM

  • 文字サイズ変更
  • S
  • M
  • L
  • No : 1143
  • 公開日時 : 2021/06/30 16:26

スキャナーで取り込んだPDFを、テキスト検索可能なPDFに変換したい

スキャナーで取り込んだ書籍などのPDFを、
SkyPDF Converterを使って、テキスト検索可能なPDFに変換する際の
文字認識の精度をあげる方法をご紹介します。
 
※ただし、テキスト検索可能なPDF化機能に対応したスキャナもあります。
 ご利用のスキャナを確認してください。
 
 
■対策
 
【対策1】スキャンでPDFを作る際に画像の傾きをなくす
 
 本の見開きページをスキャンする場合は、
 本を強く押すなど、できる限り、左右の傾きが無い状態にします。
 または、片ページ単位でスキャンします。
 その場合、もう片方のページの文字部分がかからないようスキャンします。
 

【対策2】Converter で透明テキスト付PDFを作る
 
 スキャナで取り込んだPDFを、以下の手順で
 「テキストを含むPDFも画像PDF」に設定します。
 
 手順)
 [設定]-[認識]タブ-「テキストを含むPDFも画像PDFとして処理を行う」にチェックしてください。
 
 
 
<補足>
 
①テキストを含むPDFは、ConverterではOCRエンジンによる文字認識は実行されず、元の状態のまま出力されます。
 そのため、スキャナで取り込んだ時点のPDF(透明テキスト付PDFではない状態のPDF)を、Converterで変換してください。
 
②ConverterのOCRエンジンは、画像の傾きを補正する処理を行ってから、
 文字認識を実行しますが、傾き補正は、”ページ全体”でしか行えません。