オープンソースの画像生成AIをセットアップから使い方まで解説する『Stable Diffusion AI画像生成ガイドブック』(ソシム刊)発売中(→本のサポートページ

ドキュメントスキャナと裁断機で書類や本をデータ化しようのまとめ

紙の書類をもりもりデータ化する環境について、自分の中で何度目かのブームがやってきた。いろいろ調べた結果をご報告。

裁断機で本をばらしてドキュメントスキャナでデータ化しよう

書類や本をスキャンして整理しよう、そう考えたことがある人は多いと思う。とはいえ、本を1ページずつめくりながらスキャナにかける手間を考えるとちょっと、とも思うかもしれない。でも今は、そのへんはかなり省力化できるようになっている。

裁断機で本をバラバラにした上で、複数枚の両面スキャンとOCR(画像として取り込んだ文字のテキストデータ化)を自動でできる機器を紹介する記事、を紹介するまとめ記事がこれ。

もう紙の本にはサヨナラ? 溜まった本はバラバラにしてPDF化 - はてなブックマークニュース
http://b.hatena.ne.jp/articles/201001/683

実際の手順や作業はこちらが詳しい。

橋本商会 » scansnapと裁断機を買って本を電子化しまくる
http://shokai.org/blog/archives/4999

3/8追記:こちらもがんばってます。

本の電子化を始めたのでまとめる。 - 機械
http://machine.livedoor.biz/archives/51436399.html

5/13追記:スキャン後のデータ軽量化について、Macの場合。

Desire for wealth : ScanSnap で作成した pdf を Mac OS X の標準機能で軽くする & zip に固める
http://desireforwealth.com/diary/201005_scansnap_pdf_trans.shtml

Windowsでの方法はブックマークコメントに。

TakamoriTarou これをWinでやるには、SpanSnapに一部を除いて付属しているAcrobatでやる。「文書」「ファイルサイズの縮小」でファイルサイズの縮小「ファイル」「書き出し」で各種型式で書き出し。Pro以上ならPDFの最適化でさらに細かく

はてなブックマーク - Desire for wealth : ScanSnap で作成した pdf を Mac OS X の標準機能で軽くする & zip に固める

ドキュメントスキャナは「ScanSnap」と「imageFORMULA」

複数枚の書類をセットして一度に両面スキャンとOCRができる製品というと、世の中の9割以上は「それScanSnapでできるよ」となるだろう。PFUScanSnapには大きいScanSnapと小さいScanSnapがある。大きいS1500(いまAmazonで37320円)は大きくて早くて、小さいS1300(同21530円)は小さくてゆっくりだ。S1500にはMac用モデル「S1500M」(同41025円)もある。S1300にも最低限のMac用ドライバはついているけれど、OCRなどはできない。

FUJITSU ScanSnap S1500 FI-S1500

FUJITSU ScanSnap S1500 FI-S1500

  • 発売日: 2009/02/07
  • メディア: Personal Computers

FUJITSU ScanSnap S1500M FI-S1500M (Macモデル)

FUJITSU ScanSnap S1500M FI-S1500M (Macモデル)

  • 発売日: 2009/02/07
  • メディア: Personal Computers

FUJITSU ScanSnap S1300 FI-S1300

FUJITSU ScanSnap S1300 FI-S1300

  • 発売日: 2009/11/21
  • メディア: Personal Computers

一方、ScanSnapと同じコンセプトの製品がキヤノンからも出ている。「imageFORMULA」といって、ScanSnapと比べるとかなりマイナーな印象。大きいimageFORMULAはDR-2510C(いまAmazonで37754円)とDR-2010C(同28740円)があり、小さいimageFORMULAはDR-150(同24219円)の一機種。

大きいimageFORMULAの2機種の違いは、紙を2枚以上送ってしまう重送を超音波で検知できることと、スキャン速度の違いだけのようだ。実売価格は1万円近く変わるけれど、超音波重送検知は優秀らしいので迷うところかも。ScanSnapでも、大きいS1500には超音波重送検知機能がある。

imageFORMULAは大きいほうの2機種にはMac用のドライバがダウンロード提供されている。「CaptureOnTouch」なるユーティリティも同梱なのだけれど、OCRができるかどうかがはっきりしない。「キヤノン:ドキュメントスキャナー DR-2510C/2010C 特長 ユーザビリティ」には「ファイルの検索に便利な『テキストOCR結果付きPDF』の作成も可能です」とあるけれど、Windows用ソフトとして「スキャナーで取り込んだ原稿を、テキストデータに変換するOCRソフトウエア『e.Typist エントリー2』も同梱しています」とあるので、CaptureOnTouchはPDFへのテキスト埋め込みができるだけで、OCR機能そのものはないのかもしれない。

一方、DR-150には現在Mac用のソフトはついていない。でも今後提供することになったそうだ。Evernote関連で昨日発表された。

キヤノンマーケティングジャパンキヤノンMJ)では、2009年10月に発売した小型ドキュメントスキャナー「imageFORMURA(原文ママ) DR-150」で、取り込んだ文書をEvernoteにアップロードできる連携機能を2010年4月をめどに提供する予定。合わせて、Mac OS X 10.4移行(原文ママ)で動作するMacintosh対応ソフトも公開する。

ソニーのVAIOやキヤノンの「DR-150」などが「Evernote」と連携 -INTERNET Watch(強調は引用者による)

ScanSnap対imageFORMULA、OCR機能はimageFORMULAのほうが優秀みたい

さて、ScanSnapとimageFORMULA、どっちがどういいんだ。比較記事があった。すばらしい。

誠 Biz.ID:ガチンコ対決!2009秋の陣:コンパクトドキュメントスキャナ、ScanSnapと“最強のライバル”を比べてみた(前編) (1/3)
http://bizmakoto.jp/bizid/articles/0911/20/news059.html

個人的に気になるのはOCRの性能で、これはimageFORMULAのほうがよいみたい。

OCRについても触れておこう。今回用意したダミーテキストにおいては、キヤノンimageFORMULA DR-150のほうが明らかに精度が高かった。特にキヤノンimageFORMULA DR-150については、OCRのオンオフがスキャンの所要時間にほとんど影響を及ぼさないこともあり、つねにオンにしておくといった使い方が現実味を帯びてくるだろう。

誠 Biz.ID:ガチンコ対決!2009秋の陣:コンパクトドキュメントスキャナ、ScanSnapと“最強のライバル”を比べてみた(中編) (3/3)

だそうですよ奥さん。

それからこちらにも比較記事があった。

槻ノ木隆のPC実験室:キヤノン「imageFORMULA DR-2510C」を試す
http://pc.watch.impress.co.jp/docs/2007/1227/pclabo43.htm

この記事でDR-2510Cと比較されているのは、ScanSnap S1500のひとつ前の機種であるS510。それでもDR-2510Cはレビュアーの印象はあまりよくなかったようで厳しめだ。

S510を強く意識したDR-2510Cだが、総評としては「まだ熟成不足」と感じる。

(…)

ソフト面でも、ScanSnapに比べて使い勝手の悪さが目立つ。もちろんバージョンアップを繰り返して使い勝手の向上を図ってきたScanSnapに一朝一夕で追いつくのは難しいのかもしれないが、改善の余地は少なくない。これはPDF出力に関しても同じで、もう少し改善してほしい。

槻ノ木隆のPC実験室

なお同じレビュアーによる、S1500とS510の比較記事もある。

槻ノ木隆のPC実験室:ドキュメントスキャナ「PFU ScanSnap S1500」を試す
http://pc.watch.impress.co.jp/docs/2009/0226/pclabo47.htm

ただし、imageFORMULAは細かいところでScanSnapにない良さも持っている。

たとえばTWAIN(というインターフェースの標準規格)に対応していて、PhotoshopなどTWAIN取り込みができるアプリケーションの側から直接スキャンできること。ScanSnapはなにかポリシーがあるのか、ScanSnapの付属ソフトでないとスキャンできないようになっている。そのため取り込んだデータをさらに加工したいときは、いったん取り込んだファイルを別のソフトで開くという手順になる。

またScanSnapは、A3の書類をスキャンするとき「キャリアシート」なるものに入れることになるけれど、DR-2510C/2010Cには単に半分に折ってスキャンすればつなげてくれる「半折りスキャン」機能があったりもする。A3の書類を一度にたくさん取り込むならimageFORMULAがいい感じ。そういうときScanSnapだと、キャリアシートを複数用意(別売)してそれぞれに入れてスキャン、という手順になる。

Fujitsu FI-511ES ScanSnap A3キャリアシート5枚セット

Fujitsu FI-511ES ScanSnap A3キャリアシート5枚セット

  • 発売日: 2004/07/22
  • メディア: Personal Computers

ScanSnap、大きいのと小さいのをどう選ぶか

これは、スキャンしたい本や書類がたくさんあるかどうかで判断するのがよいようだ。S1500をメインに使っているスタパ齋藤のS1300レビューによるとこんな感じ。

各種ショーなどに行くたびに多量のパンフ/カタログ/資料をもらうので机の周りが書類だらけ、捨てるには惜しい雑誌や書籍が多量にあって部屋圧迫、毎日なーんか書類が多々届いちゃう的業務など、たまりまくる紙書類をサクッと電子化したいというユーザーには“絶対S1500がオススメ”と言えよう。

てか、そういうユーザーがS1300を買っても、結局S1500に買い換える結果になると思う。S1300は、S1500のように多量の紙書類をサクサク電子化するというのには向かないからだ。

(…)

ぶっちゃけた話、S1500のスピードを知っている者にとって、S1300のスキャン速度はヤケに遅いのであり残念であり脱力モンと言える。ハッキリ言って、多量の紙書類をサササッと効率良く電子化したいという人には、全然オススメできないS1300である。

(…)

だが、一度のスキャンが10枚未満なら、まあ許せるって感じ。原稿をセットしてお茶を一服……的な時間を過ごせばスキャン完了。付属ソフト上で電子化されたドキュメントを手軽に扱えるようになっている。

というわけで、やはりS1300は、そーんなには多量にはスキャンしないユーザーに向く、と言えよう。イメージとしては、フラットベッドスキャナで行うにはカッタリイが、S1500で高速&多量にスキャンするほどではない、てなユーザー向けですな。

お手頃ドキュメントスキャナ「ScanSnap S1300」 - ケータイ Watch

ただしS1500とS1300は値段も大きさもかなり違うので、そのへんは各自の使い方次第であろうとも。記事ではMacへの対応についても軽くふれられている。前述の通り、S1300にはMac用のOCRソフトなどが入っておらず、Macの人にはちとつらい。

裁断機は重くて500枚か、軽くて40枚か

ドキュメントスキャナの話はこれくらいにして、やっと裁断機の話に。といってもこちらは選択肢はあまりない。

1万円台で買える中国製の裁断機で、一度に500枚くらいいけるのがある(枚数はショップによって400〜550枚と差がある)。Amazonではいま14700円。

asin:B000ZA6IHO

ただし重さ17キロ。またレビューを見ると、刃や本体が油まみれで届くらしく、最初のお掃除がちょっと手間かも。あっ待てよ、Amazonのは「3〜5週間以内に発送」になってるなー。

下のは、見たところすぐ発送されるようだ。これらでダメでも、検索語を「裁断機 大型」、値段を「10000円〜15000円」で絞れば見つかるだろう。

★値下げセール中!!★最大400枚カット!A3対応大型ペーパーカッター◇大型裁断機Yahoo! ショッピング:12800円+送料1260円=14060円※北海道などは追加送料あり)

1度に普通コピー用紙500枚カット!作業時間が10分の1以下に短縮できます!!★【送料・代引き手数料無料】楽天:送料込み13799円、ただしカード不可)

☆業務用・大型A4対応ペーパーカッター・本格的紙裁断機☆♪大量400枚の普通紙もラクラク一刀両断♪楽天:13800円+送料1200円=15000円、ポイント3倍414ポイント)

この大型裁断機ではちょっと大げさで尻込みしてしまうならば、ディスクカッターのこんな裁断機はいかが。カール事務機のDC-210N。いまAmazonで13000円。

これは「2往復で40枚(目安)」とある。一度に裁断できる枚数が少なくても、ディスクカッターだから何度も往復させていくとそのままたくさん切れていくのだと思う。

これもAmazonでは「3〜5週間以内に発送」になってる。ショッピングサイトでは:

裁断位置が光る!ディスクカッター(A4)DC-210N 手動裁断機 CARL(カール事務機)Yahoo! ショッピング:送料無料11999円)

ディスクカッター [DC-210N]楽天:送料無料12375円)

このメーカーのディスクカッターは、サイズ違いも含めていろいろある。波形などに切れる「クラフトブレイド」対応、という製品もあって、この記事の主旨から離れてしまうけど面白いのがあるものだねえ。

CARL:ディスクカッター
http://www.carl.co.jp/products_list_5.html

大きくても日本製で安心したい向きには「160〜180枚裁断」をうたうこちらなど。でもいまAmazonで44932円!

プラス 断裁機 PK-513L 裁断幅A4タテ 26-106

プラス 断裁機 PK-513L 裁断幅A4タテ 26-106

  • 発売日: 2009/09/01
  • メディア: オフィス用品

PK-513Lを使うときに気をつけることのまとめ記事
裁断機 PK-513L で本を 100冊裁断してみた - 経験した 9つの失敗とその回避方法 - 彼女からは、おいちゃんと呼ばれています(http://d.hatena.ne.jp/inouetakuya/20100512/1273624430

まとめ

いやー、まとめるの大変だった。まとめるので満足して、買うのはあと回しにしてしまいそうだ。と冗談めかして書いてみるものの、本当にそんな気分。

追記:コクヨのドキュメントスキャナ「Caminacs」

コメント欄によると、コクヨScanSnapやimageFORMULAと同趣向なドキュメントスキャナを出しているのね。

コクヨS&T NS-CA1W さくっとファイリング by Caminacs

コクヨS&T NS-CA1W さくっとファイリング by Caminacs

  • 発売日: 2007/06/01
  • メディア: Personal Computers

大きい「CaminacsW」が2機種、小さい「Caminacs」無印が1機種。大きいのの「ビジネスパック」(いまAmazonで69800円)と「ベーシック」(同64800円)の違いは、各種のユーティリティソフトが添付されているかどうか。小さいの(同14800円)は小さいけど、OCRもできるユーティリティソフト「さくっとファイリング」がついてくる。

「W」も無印もA3対応、「W」はA4を横にして読み込む大きさで、A3は折ったりせずそのままスキャンできる。無印でA3を読むにはScanSnapと同様、半分に折って両面スキャンさせるためのキャリアシートを使う。キャリアシートは1枚添付、複数使いたいときはやはり別売で。あ、いや「W」にもキャリアシートは用意されている。「W」用のA3判キャリアシートを使うと、A2までの書類をスキャンできる。つまり新聞紙1面全体をスキャンできるということで、それはすごいね(参照:「高機能コンパクトなスキャナCaminacs(キャミナックス):mina-blog)。

「W」にはMac用ドライバが用意されている。ただしスキャンするところまでで、OCRなどはできないみたい。

また「W」のベーシックモデルを10日間、無料貸し出しするキャンペーンが行われている。なかなか思い切ったことをするなあ。

無料貸出キャンペーン - Caminacs - コクヨS&T
http://www.kokuyo-st.co.jp/stationery/kws/rental_cp/

おまけ

こんなのもあると便利かもしれません。

サンスター文具 ノンキャラ はりトルPRO PS S4762860

サンスター文具 ノンキャラ はりトルPRO PS S4762860

  • 発売日: 2008/09/10
  • メディア: オフィス用品

コメント

http://www.kokuyo-st.co.jp/stationery/kws/caminacs.html
無料貸出キャンペーン中。』