さて、昨日の記事でフラットヘッドスキャナーを購入したことを記した。その主な用途は電子化されていない文章を読むためである。
 パソコン向けにスキャンした画像から文字情報を読み取るソフト、いわゆるOCRアプリは視覚障碍者に向けて作られたものもある。わたしもAIネット社から販売されているらくらくリーダーというソフトを使用している。
 これは操作や設定が簡単で、パソコン二不慣れな視覚障碍者にも扱えるのではないかと思う。OCRの他に弱視者に向けた拡大読書機の機能も備えている。
 これらのソフトを使用するには、文面を画像に変換する必要がある。手っ取り早いのはデジタルカメラなどで撮影したものをパソコン二転送するのだが、綺麗な静止画像を撮るのであれば、スキャナーを利用した方が良いだろう。
 わたしの部屋には調剤薬局に処方箋を送るための複合機があるが、ADF機能を使用して連続の書類を読み取ることができるが、書籍を開いてスキャンすることができない。
 ここのところでいろいろと郵便物での確認事項が増えたために、わたし一人でもある程度の確認ができるようにとフラットヘッドスキャナーを購入したのである。
 ところで、タイトルが自炊なのに料理ではなくOCRの話が出てきたのは釣りなのかと思われるかもしれないが、これにはきちんと関係性がある。
 電子書籍が出始めのころ、指定した書籍を全ページ読み込み、OCRでテキスト化する業者が現れたことがあったのである。

 アマゾンが電子書籍端末Kindleを販売したタイミングだろうか。まだ日本では紙の書籍が大半を占めており、視覚障碍者は書籍が点字化されなければ読めなかった。もしくは図書館での読み上げサービスを利用するしかなかった。
 以前にも言っているが、視覚障碍者が点字を読み取れる人数の分布は3割程度と言われている。つまり半数以上の視覚障碍者は点字が読めないのだ。
 そのために図書館には職員による書籍の読み上げサービスをそなえているところもあるが、利用にある程度の制限がある。読み上げは活字を読むのに比べると時間がかかるし、職員の作業時間を取ることになる。
 そこで考えられたのが紙の書籍をOCRで解析し、テキスト化してあとは読み上げソフトで聞くというものだ。
 OCRソフトも高機能化しており、その判別性能も上がっている。さすがに手書き文字を読み取るのには難があるが、書籍の活字を変換するのであれば的中率は高い。
 問題は、数枚程度の書類を読み取るのであればさほど手間でもないが、章節など200ページを越えるような書籍の場合、視覚障碍者のみでそれらをテキスト化するのが難しいのである。ADFの付いたスキャナーを利用すればある程度は自動的に行えるが、途中でトラブルがあった場合などにページの抜けや入れ替えが発生しても判りづらい。
 わたしも何回か挑戦したことがあるが、書籍を1ページずつめくってスキャナーにかけて音声化しての作業はなかなか大変だった。書籍を読みたいという強い意志があれば貫徹できるが、わたしは飽きっぽいために全てのページをスキャンできた冊数は少ない。
 そんな時、指定した本を全ページスキャンし、テキスト化してPDFに変換して送るサービスを行うサイトが現れた。それらは自炊業者と呼ばれていた。
 何故に自炊かというと、本のデータを自ら吸い取るから来ているらしい。
 これらのサイトのシステムは以下の通り。
・お客様は自炊して欲しい書籍を、自炊業者に送る。
・自炊業者では本の背表紙を裁断しバラバラにしてからスキャナーで読み取り画像情報に変換する。
・希望であれば変換した画像データをOCRにかけてテキスト化する。
・画像、もしくはテキスト化したデータをお客様に返送するか、サイトのお客様ページからダウンロードする。裁断した書籍は要望があれば返却する。
 料金はスキャンする冊数と、テキスト変換するか、裁断した書籍を変換するかなどによって変わってくるが、そこまで高い料金では無かった。
 わたしが利用した業者は、アマゾンからの発送を受け付けており、アマゾンで書籍を購入した後発送先に自炊業者の受け取り住所を指定すれば、こちらから書籍を発送する手間を省けた。
 このように、視覚障碍者にとって新本をわりに手軽に読めるために良いサービスだと思っていたのだが、いろいろと問題があったようだ。
 問題なのは著作権で、書籍をスキャンして画像ファイルもしくはテキストファイルを作る段階で、劣化しない書籍の複製可能データが作られることになる。それらが自炊を依頼したのとは別のお客様に対して利用されないかと、出版社の一部が懸念を表示したのである。
 その後、アマゾンの電子書籍の種類が増え、iPhoneのKindleアプリが読み上げに対応したために、わたしは自炊業者を使わなくなった。

 ただ、既存の書籍が全て電子書籍に対応しているわけでも無かった。
 どの書籍が電子化されるかは、ベストセラー作家のものや、あまりに売れないものは電子化されていなかった。いわゆる中間層の書籍がされていたようである。
 あれから時間も過ぎて、電子化される書籍は増えている。ただ、php文庫やブルーバックスなどは書籍をスキャンして画像化したものを電子書籍としているようである。当然、図表だけのものはKindleアプリでも読み上げ腐対応になる。頼むからアマゾンの商品紹介で、読み上げに対応していないことを告知して欲しい。
 昨今の自炊業者がどうなったか判らないが、書籍の電子化をめぐってその時の狭間にできた産業だったのだと思う。

 次回は透析クリニックでのちょっとした出来事について語りたい。