ブログ -30ページ目

ブログ

ブログの説明を入力します。

使用環境

パソコン
OS Windows Vista
CPU core2 duo 2.53Hz
メモリ 2M

スキャナ(複合機) Epson PX-602F
付属のソフト(EPSON Scan)で読み込んでPDF化 
設定 イメージタイプ モノクロ 
出力設定 取り込み装置 自動検知、
サイズ A4、
解像度 300dpi

・読み込みは1枚ずつにして、1枚で1つのPDFファイルにする。(複数ページを1枚のPDFにしたら、OCRでの読み取りがうまくいかなかった。うまくいく方法が別にあるのかは不明)
・隣のページが写らないようにする(紙を重ねた)。
・スキャナで読み込む時に、読み取り面にページがぴったりくっつくようにする。紙と読み取り面が離れると、OCRで読み込む時に認識が極端に悪くなる。
・解像度を上げるとOCRソフトで読み込む時に、かえって読み取り精度が下がる。(説明書だかヘルプファイルの推奨値にした。最初の頃、高い解像度にしたら、親切にもメッセージ画面で教えてくれた)

ORCソフト JUST PDF(一太郎2013スーパープレミアムに付属のもの、単体でも販売あり、自分が使用しているのは最新版ではないと思う。)
 設定 よくわからないからそのまま。
  原稿の言語 英語

評価というか感想、 テキストファイル変換後に確認するが、99%に近い読み取り精度で、ちょこっと訂正する感じで済む。訂正は、ワード上で、スペルチェック機能で赤線が引かれているところを右クリックで再変換で済むのがほとんど。ただ、Iと1の区別は間違えることもあって,Vitamin B1 が Vitamin BI になってた。それでも、プリンタ付属の無料OCRとは、精度が全然違うのでびっくりした。
 このソフトはジャストシステムから発売されているが、実際の開発は別会社らしい。ソースネクストのいきなりPDFがインストールされていると、JUST PDFは、インストールできないみたいなので、中身は、ほぼ一緒なのかな、、いきなりPDFに英語OCR機能があるかは不明だけど機能はほぼ同じだし。

ただ、1枚ずつ処理していくのは面倒。。OCRの読み取りモードは、英語と日本語に分かれていて、英語モードの時は、日本語は全く読まない。テキストファイル以外に、ワードと一太郎形式の出力も可能だが、ワード形式の方が元の書式に近い感じのことが多い。 

プリンタ付属の無料OCRソフトでは訂正する手間が大変なので、やっぱ買わなきゃかな、と思って英語 OCR で検索したら、広告にJUST PDFの広告が出てきて、え、自分これ持ってる、、と初めてJUST PDF(変換)に、OCR機能があることを知った。OCRソフトの比較サイトにも載ってなくて、パナソニックの読取革命を買ってしまうところだった。

ちなみに、無料にこだわるならGoogleが無難かとは思いますが、セキュリティとか気にしないのであれば、他にも無料のOCRサービスはある。
http://www.onlineocr.net/