きっかけは「PP-OCRv6」という新しいモデル

2026年6月11日に、PaddleOCRから PP-OCRv6 という新しいOCR(画像から文字を読むやつ)が出ました。出たばっかりで、界隈ではちょっと話題です。

スペックを並べると長くなるので一言でいうと、「速い・正確・50言語いける・しかも超軽い」。

この「軽い」が個人的にツボで——ブラウザの中だけで動いちゃうレベルで軽いんですよ。これ、地味にすごいことで。

何がうれしいって「画像が外に出ない」

doc2langの無料OCR、このPP-OCRv6を使ってブラウザの中だけで動くようにしました。

ちなみに今まではPP-OCRv4っていう一個前のモデルだったんですけど、今回v6が出たので、最近えいっと載せ替えました。これがけっこう効いて、読み取りが前より速く・正確になったんですよ。

つまり、アップロードした画像、サーバーに送られません。 文字の読み取りはぜんぶ手元で完結。

これ、開発しながら「あ、これ強いな」と思った瞬間でした。処方箋とか身分証とか、人に見られたくない画像ってあるじゃないですか。それが「そもそもどこにも送られない」って、いちばん安心なんですよね。送ってないんだから漏れようがない。

ただ正直に言うと、この無料OCRは読むだけなんです。出てくるのは日本語のまま。翻訳はしてくれない。読めない言語だと、ここで止まっちゃう。

▶ 無料の画像→テキストはこちら:https://doc2lang.com/ja/image-to-text

ちょっと実験:まっすぐにする前と後で全然ちがった

このPP-OCRv6、どれくらい読めるのか湿布の袋でちょっと試してみたんですよ。で、これが面白くて。

同じPP-OCRv6で読ませても、画像をまっすぐ直したかどうかで結果が全然ちがうんです。

斜めのまま読ませると…「Dネン7071ンNa于-7」みたいに製品名が崩れて、段落もぐちゃぐちゃ。縦書きを斜めから読ませると、さすがに無理があるみたい。

でも、まっすぐ向きを直してから読ませると——「注意」「保管上の注意」「はり方」がちゃんと区切られて、各項目もきれいに並ぶ。同じモデルとは思えないくらい読めました。

つまり、PP-OCRv6自体はかなり優秀。ただ、ちゃんと向きを直して渡してあげるのが大事ってこと。逆に言えば、向きさえ直せばブラウザの中だけでここまで読める。無料で。地味にすごい。

「翻訳まで一発」は画像翻訳機能のほう

じゃあ訳まで欲しいときは?というと、doc2langの画像翻訳機能を使います。

こっちはOCRも翻訳も、精度の高い商用モデルでやってます。だから訳が正確で、画像を上げたら一発で訳文まで出る。手間ゼロ。

無料OCRは「ブラウザの中で、プライバシー守って、文字だけ」。画像翻訳は「商用モデルで正確、訳までドン」。使い分けです。

▶ 画像翻訳はこちら:https://doc2lang.com/ja/image-translate

実際に湿布の袋でやってみた

家にあったロキソプロフェンの湿布、あのアルミの袋で試しました。

これがまあ難物で。アルミだから反射するし、しわしわだし、真ん中に「貼り方」のイラスト入ってるし、下のほうにちっちゃくロット番号(Y5062)。OCR泣かせの条件てんこ盛り。

↑ これがその湿布の袋。反射・しわ・イラスト混在で、OCRには厳しい一枚

 

※斜めに撮った写真は、先にまっすぐ向きを直してからアップします。ここだけは手動。

で、向き直してポイっと入れたら——2つ返ってきました。

 

ひとつは 翻訳された画像。読み取った文字を訳して、元のレイアウトにそのまま戻してくれる。「注意」「保管上の注意」「はり方」の緑の見出しも、真ん中のイラストも位置そのまま、文字だけ母語に。袋を見ながらそのまま読める。これは気持ちいい。

↑ 訳文が元のレイアウトに戻った画像。袋を見ながらそのまま読めるの、地味に感動

 

もうひとつは 翻訳されたテキスト。コピーできる文字版で、原文と並べて出る。どこかに貼りたいときはこっち。

↑ 画面はこんな感じ。画像でもテキストでも見比べられる

「見て読む」も「コピって使う」も両方そろうの、便利でしょ?

おわりに

新しいPP-OCRv6のおかげで、「画像を外に出さずに、手元でサッと文字起こし」ができるようになりました。で、訳まで欲しいときは画像翻訳機能が一発でやってくれる。

外国語のパッケージや説明書に困ったら、ぜひ試してみてください。まっすぐ撮って、ポイっと入れるだけ。それじゃ、また。