ocr-testApp

↑OpenCVとtesseract-ocrをテストするために作成したアプリです。
緑色は認識したエリア。赤色は認識した文字。


tesseract元図

↑この画像を・・・

tesseract英語

↑英語で認識
小さな領域で、「E」と認識したりしてます。
「~」は、未認識なのかな?


tesseract日本語

↑日本語で認識
全体的に、難しい漢字で変換されてる

tesseract数字のみ

↑数字のみで認識
う~ん、日本語の箇所も頑張って数字にしてますね。

そもそも、カメラからの画像を使うべきでなかったのかな
3つの認識方法とも、認識領域はほぼ同じなので、
これらの情報を使って認識精度を上げるのは、
tesseract-ocrを使う側の腕しだいってとこでしょうか。


OpenCVとtesseract-ocrを使って、
スキャナで読み取った図面の図面番号、名称等を
取得できたらいいな!
と、思ったのですが、自分の腕では敷居が高そうです
とりあえず、ここまで。


参考にしたサイト
カメラ、アルバムの機能は、
noraさんの
XCODEで作るカメラアプリ開発入門

tesseract-ocrのインポート、使い方については
クラスメソッドさんの
iOSで日本語OCR!サンプルアプリ構築編~iOS SDK 6.1 + tesseract-ocr 3.02~ iOS

OpenCvの使い方については、
qt6hyさんの
iOS で opencv を使う。

を、参考にさせて頂きました。
ありがとうございました。