取扱説明や使用上の注意などが印刷された紙・袋・容器などに対して、現時点でのPDF化の仕方が定まりました。
その過程で却下したものから。
手持ちのスタンドスキャナー(2万円くらいの安価なもの)の付属ソフトのOCR機能は、認識率が低いので使いません。
最近まで使っていたAdobe Scanは、切り抜きに自動検出機能があるのは便利ですが、OCRの認識率がよくありません。
OCR処理をしない場合も、できるPDFの容量が大きくなってしまいます。
また、Googleドライブに保存できるのも便利ですが、Googleドキュメントにしたときの認識率もイマイチなので、Adobe Scanを使うのはやめました。
以下に自分の環境で、楽でかつ認識率をもっとも高くすることができる方法を記します。
スタンドスキャナーで必要な部分を撮影したら、1つのPDFとして出力します。
それをGoogleドライブにアップロードしてGoogleドキュメントにします。
OCRの結果を見て問題なければ、抽出された文章をコピーして、メモ帳に貼り付けて保存します。
OCRの結果がイマイチならば、JPGで出力し直して、GoogleドライブにアップロードしてGoogleドキュメントにします。
OCRの結果を見て問題なければ、抽出された文章をコピーして、「書式なしで貼り付ける」で上書きします。
前者の場合は、pdfファイルとtxtファイルをEvernoteに保存します。
後者の場合は、Googleドキュメントで、ファイル→ダウンロード→PDFドキュメントを選択してEvernoteに保存します。
文字にすると面倒に感じますが、作業は楽です。
OCRが正確だと、スマホの読み上げ機能で聞いても理解できます。
ちょっとした待ち時間などに聞いておけます。
作業が楽になったので、スキャンできずにたまっていた袋などを処分できそうです。
↑の画像は箱をスキャンしてGoogleドキュメントでOCR処理した例です。
読み取っていない文字や空白が入ったりしていますが、白抜き文字でもかなり正確に認識できています。
手持ちのスタンドスキャナー↓
平面はA3まで、立体物もスキャンできます。
斜めでもOK、距離も気にせずサクサク スキャンできます。
コスパ◎