2011-02-22

デジクリ連載04 ■イッキに数10万の既刊本をPDFにして販売したらいいのに

デジクリ連載です。今日2月22日(火)に配信されました。
3月1日の「続・2010年代の出版を考える 阿佐ヶ谷ロフト」のイベントでもネタにしたいことなので、
さっそく、転載・公開します。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
■電子書籍に前向きになろうと考える出版社[04]
イッキに数10万の既刊本をPDFにして販売したらいいのに

沢辺 均
< http://blog.dgcr.com/mt/dgcr/archives/20110221140100.html >
───────────────────────────────────
電子書籍普及のために、今、やれるといいなと思うことを夢想してみた。

●数10万の規模で、本をスキャニングして画像+OCRデータ(PDF)を、まずは無料で行う会社をつくる

このデータは──

・ブックスキャンなどにも委託するなどして、できるだけ低コストでつくる(スキャン100円+OCR100円?)
・コストを下げるためには出版社に本を一冊提供してもらい、ノドを裁断してスキャンする
・OCRの精度は向上するだろうから、定期的にOCRをかけなおして徐々に精度を向上させていく
・スキャンしておくだけなら、著者の了解はいらないだろう。だが、読者や販売者などに提供するには著者の了解が必要で、それも(最初の通知だけとか)代行ぐらいしたい。もちろん、了解の返信をもらえなかった著者には出版社がキチッと連絡

このデータの使い道は──

・出版社 自由に使えるようにデータそのものを渡す。書誌情報の整備とあわせてデータベース的に保存して、いつでも引っぱり出せるように管理、出版社が未管理でもバックアップとして利用できるようにする
・読者 著者・出版社の選択によって、紙の本を買った人には、少し料金をとってデータベースにアクセスさせるなどして、PDFを見えるようにする
・読者・販売者 著者・出版社の選択によって、アマゾン・グーグル・PDFも扱う書店(ネット書店が中心になるだろうがリアル書店も対象)での販売用に提供
・検索データベース 著者・出版社の選択によって、ネットワーク上で全文もしくは目次索引などの一部を検索させて一部を表示できるようにする

これらは多くの出版社の参加が見込めないと意味がうすい。多くの出版社が本を提供するような条件作りは工夫しないといけない。また、そもそもそんなカネをどうするのか? という問題も大きい、んだけれどもね。

●なぜPDFから始めるのか?

紙の本で既に出しているものの一定数を、デジタルで読めるようにしないと、そもそも電子書籍の普及は望めないと思う。せっかくデバイスなどの条件が少しずつ良くなっているのに、だ(もちろんアップルの課金問題が浮上したので、悪い方向へも進んでいるけど)。

たとえば、超大型書店として有名なジュンク堂にある本は、今月に発行されたものはごく一部のはずだ。あの膨大なタイトルのほとんどは、ここ何年か、何10年かのものがあって、あれだけの量=選択肢をお客に提供してる。

ポット出版の本でも、少なくとも10年前後のものも置いてもらっていたりする。ネットやデジタルのある種の特性=膨大な選択肢の存在、を考えると、電子書籍にも多くの選択肢がなければ、そもそも見向きもされないのではないだろうか?

とすると、すでに出版されている本の何10万点かは電子書籍として提供できるならば、電子書籍の普及が一気に進む可能性がでてくると思う。

現在、書店を通して返る本は80万点とか130万点とかいう説がある。ならば、数10万点が一気に電子書籍になるくらいのインパクトが必要ではないか?

一方、これまでに出版した紙の本を電子化するには、かなりのコストがかかるはずである。まず、校正などを経たテキストデータは、出版社にはほとんどない。印刷所にあると思われているけれどこれも不確か。実際に確認した報告を読んだことがない。

印刷所にテキストデータがあったとしても、それはInDesignであったりQuarkであったり、写研の電算写植システムのデータだったりするはずだ。するとOSのバージョン、アプリのバージョンなどもあって現在「開ける」ものがどれほどあるだろうか? あったとしても、それなりの手間が必要のはずだ。

さらには、そのデータの帰属は不明瞭で、出版社が無料で入手するのはかなりむずかしいと思われる。たぶん印刷所もその「所有権」を主張するだろうし、折り合うためには手間賃のほかに、なんらかの料金を印刷所が請求するのではないか、と思える。

そうした難しい課題をクリアしてテキストデータを出版社が入手しても、今度は電子書籍にするのにコストがかかる。XMDFにしろ、.bookにしろ、ePubにしろ、タグをつけ直して、点検したりしなくてはならない。

ポット出版の電子書籍づくりは社内でやっているのだけど、仮にこれを外注で制作を請け負うなら、10万円くらいはほしい(これでも安く言っている)。それも簡単な、文字がほとんどの単行本でもだ。

そこで、断裁→スキャン→OCR、なのだ。なんだか「自炊」みたいな話だ。そうなんだ。最近の自炊の評判(ほんとに流行っているのかどうかはわからないけど)をみて、自炊というアイデアをパクらせてもらった。

自炊をすべきなのは、むしろ出版社なのではないだろうか? と。
                     (この項、続くかもしれない)

◇2011.03.01 阿佐ヶ谷ロフトイベント
< http://www.loft-prj.co.jp/lofta/schedule/lofta.cgi?year=2011&month=3 >
続・2011年代の出版を考える 〜電子書籍ブームの先へ
日時:2011年3月1日(火)OPEN18:30/START19:30
会場:阿佐ヶ谷ロフト(東京都杉並区阿佐谷南1-36-16-B1)
前売り、当日共に1,500円(飲食代別)
【出演】
橋本大也(ブロガー・「情報考学」)
仲俣暁生(フリー編集者・「マガジン航」編集人)
高島利行(語研・出版営業/版元ドットコム)
沢辺均(ポット出版/版元ドットコム)
+ゲスト

【沢辺 均/ポット出版代表】twittreは @sawabekin
< http://www.pot.co.jp/ >(問合せフォームあります)
ポット出版(出版業)とスタジオ・ポット(デザイン/編集制作請負)をやってます。版元ドットコム(書籍データ発信の出版社団体)の一員。
NPOげんきな図書館(公共図書館運営受託)に参加。
おやじバンドでギター(年とってから始めた)。
日本語書籍の全文検索一部表示のジャパニーズ・ブックダムが当面の目標。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━