最近、「自炊」って言葉が流行っている。 自炊と言っても、自分で食事を作ることじゃなくて、自分で本などをスキャニングしてデータを吸い上げること、一言で言えば、「紙データを電子化」することグッド!はてなマーク

自炊では、本を裁断機 で裁断・解体?して、ドキュメントスキャナー を使ってPDF化するのが一般的。
解説は、ここ を参考に。

ここでは、あけんじの家にもあるプリンター兼用のフラットベットのスキャナーで本を解体せずに読み込むやり方を紹介する。この方法は、裁断しドキュメントスキャナーで読み込む場合の100倍位手間暇が掛かるので、ビジネスには向かないガーン

自分の本を解体するのに気が引ける(あるいは借り物の本の場合はできなし)ショック!
フラットベットに本を広げてスキャニングする。あけんじの環境では1分以上掛かるしょぼん
会社でドキュメントスキャナーで書類を読み込む場合の2桁以上時間が掛かる。
この場合、本をピッタリ密着させるんだけど、どうしても中央に影ができる。
学生の時に本をコピーして、中央に黒い帯のような影ができた、そうあれダウン

これをどうにかできないかとずっと思っていた。
一つの解決法として、こんなこと を実践しているらしい。とってもアメリカ的にひひ

そこでも、紹介されているScan Tailorを使ってみたので、インストールから使用方法を簡単に紹介するチョキ

最初に知っておくべきことは、Scan Tailorはtiffファイルを扱う(PDFで入出力できれば素晴らしい音譜)。あけんじは、今回もう一度tiff形式でスキャンし直した。

(1)Scan Tailorのインストール
$ sudo apt-get install scantailor

(2)Scan Tailorで見開きページの分割
・New projectで既に読み込んだtiffファイルのあるディレクトリを指定。
・tiffファイルがFiles In Project入るので、Select Allする。
・後は、左上のメニューを順番にしていけば、ほぼ期待どおりの物が得られる。
・Fix Orientationで、ページの回転で向きを揃える(本を読み込んだの右に90度)
・Split Pagesでページ分割(本を読み込んだ場合、左右に2分割)
・Deskewで、角度の微調整(実施せず)
・Select Contentで、文字のある領域の位置決め(中央に合せた)
・1ページ毎見ていくと、見開きでスキャンしたページが2つに分割され、かつ、本の綴じ代にあたる中央部分の影も修正されている。

(3)修正されたファイル
 ・Scan Tailorで編集すると、
  tiff001.tif
  tiff002.tif
  ・・・
  tiff007.tif
 のように、見開きで7ページ分7つのtiffファイルが、14個のtiffファイルに分割。
  0001_tiff001.tiff
  0002_tiff001.tiff
  0003_tiff002.tiff
  0004_tiff002.tiff
  ・・・
  0013_tiff007.tiff
  0014_tiff007.tiff

(4)tiffファイルをPDFに変換
 ・tiffからPDFへの変換ツールのインストール
  $ sudo apt-get install libtiff-tools
 ・変換するには、次のコマンドで。
  $ tiff2pdf hoge.tif -o hogehoge.pdf
 ・tiff2pdfは一ファイル毎にしか変換できないので、次のようなシェルプロを作った。
--->8---8<---
#!/bin/sh
# We convert Every tiff file specified into pdf file.
#

for tiff_file in $*
do
pdf_file=`basename $tiff_file .tiff`
tiff2pdf $tiff_file -o $pdf_file.pdf
done
--->8---8<---

元の画像で、ページの綴じ代の影も補正されるけど、文字も一部欠けたりするしょぼん
少し、調整が必要だと思っていて、もう少しやってみます。

ぜひ、試してみてニコニコ