ついにkindleを買ったが、思った程自炊データは綺麗に読めなかった | わんち通信

ついにkindleを買ったが、思った程自炊データは綺麗に読めなかった

何年も購入を迷っていたブックリーダーですが、ついに下のkindleを買いました。

 

 

 買った理由は自炊データを読む為が最も大きかったのですが、思ったより自炊データの表示状況が悪くて利用価値は微妙でした。それをここで解説します。

 

 まず、下図は自炊データをPC上で表示し、スクリーンショットで撮ったものです。

このデータは489ページ、PDFで95.6MBあります。

 

このデータをそのままkindle上で表示し、その状態をデジカメで撮影したものが下図です。

 

 

 デジカメで撮影したせいで、実際の表示よりも、もうちょっと画質が悪くなっていますが、それでもkindleの表示上の文字もこんな掠れ感が出ていて読みにくくなっています。

 

 これに対して、上記データを『読取革命Ver.15』体験版でOCRを掛けると下図のようになります(同じデジカメで撮影)。ちなみにデータ量は2.35MBまで圧縮されます。

 

 

 OCRで正確に読み取れれば、圧倒的に見やすく、データ量も削減できますが、誤認識が大きく問題になります。このページでも日付のところに誤認識がありますが、他にも下図の様な誤認識が出ています。

 

 まず、OCR前の状態が下図です。

 

 これに対して、OCR後が下図になります。

 

レイアウトが崩れたり、『ハゲタカ』が『(ゲタカ』になったりしています。

 

しかも、表紙はこんなになってしまっています。

(OCR前)

 

(OCR後)

 

 これは何も考えずにOCR化したもので、1ページずつきちんと修正を施せば、もっと見やすく、誤認識も減らせるでしょう。

 しかし、それでは自炊データひとつに時間が掛かり過ぎ、使い勝手が悪いです。