2011-02-22

デジクリ連載03 ■自炊と国立国会図書館の「全文テキスト化実証実験」

日刊「デジタルクリエーターズ」の連載、第三回目です。
2011年2月8日(火)掲載分。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
■電子書籍に前向きになろうと考える出版社[03]
自炊と国立国会図書館の「全文テキスト化実証実験」

沢辺 均
< http://blog.dgcr.com/mt/dgcr/archives/20110208140100.html >
───────────────────────────────────
国立国会図書館と有志で参加した出版社が、「全文テキスト化実証実験」をしている。

・国立国会図書館における全文テキスト化実証実験の出版社等との共同実施について
< http://www.ndl.go.jp/jp/aboutus/digitization_fulltext.html >

紙の本と、デジタルデータ(PDF TXT XMDF .book)の290タイトル・384冊から、構造化したテキストデータをつくって検索して、ページを表示する。検索・表時の実験は、2月28日(月)〜3月4日(金)のあいだ、国立国会図書館のなかでおこなう。

一言で言えば、さんざん話題になったあの「Googleブックス」を日本で実現しようという取組みだ。書協(日本書籍出版協会)などの業界団体でとりくむのではなく、意思のある出版社が手を挙げて参加しているのが特徴。
試しにGoogleブックスで、本の全文検索を試してほしい。
< http://books.google.co.jp/books?source=gbs_hp_logo >

ところで、最近話題になっている「自炊」である。ちょうど一年前くらいに、自炊っていいよねみたいなことを言われても、「そんなことやるのは好きモンだろう」くらいに思っていた。

ぼくもscansnap(富士通のスキャナね)を机においていたのだけど、会議のレジュメなんかをときどきスキャンするくらいで、とても活用してるとは言えなかった。その気分が劇的に変わったのは、キヤノンの複合機を去年の秋に買い替えたときだ。

以前の複合機でも、自動紙送り装置で両面の原稿からコピーも、ファックスも、スキャンもできた。だけど、スキャンはそのネットワークにぶら下がってるPCから、専用のアプリを立ち上げてコントロールしなくちゃならない。

原稿をセットしたら席にもどって「GO」。また原稿をとりに複合機までもどる。だけど買い替えた複合機では、自分のメールアドレスに添付で送ったり、サーバにそのまま保存させたり。たったそれだけで使い心地がまったく違うのだ。そんでもって、自炊に挑戦したくなった。あああ、機械が進化するっていいもんだ。

さて自炊。なぜ、自炊が興味を引くのか? 理由は二つあると思う。

一つは、PDFで保存できるなら捨ててしまいたい本があるからだ。本の保存は場所をとる。壁をすべて本棚にした家をつくる人がいるみたいだけど、それは少数派だと思う。なくしたいけど捨てられない、というのが、多数派のような気がする。ぼくもこっちだな。

もし、PDFで保存できて、その手間もたいしたことがないなら、自炊して本は捨ててしまいたい。実際は、PDFをもう二度と開かないかもしれない。でも、紙の本だってほとんど開いてない。要は、「ある」という安心感のような感情なんだと思う。

二つ目は、移動の途中で読むため。ぼくもたった一泊の出張に本を2〜3冊持っていってしまう。1冊だと、読み終わったり、つまらなかったりしたら、なんて心配してしまうのだ。これをiPadにいれておければいいなと思う。

ならば、こうした自炊欲望に出版社はどう応えるのがいいのか。まず、その前提は「いまはまだ紙の本をつくって売るのが商売の中心」であるということ。

これを前提にすれば、
・これから出版する紙の本は、PDFファイルをつくっておいて、紙の本の購入者には無料で提供する。もちろんPDFファイルだけを売ってもいいし、そもそも電子書籍にするのでもいいわけだ。
・これまでに出した紙の本を、1冊裁断してスキャンしてPDFにする。OCRはかけておくけど、その精度は悪くてもいい。

デジタルクリエイター的に言えば、いま制作している紙の本の印刷用のデータであれば、それをPDFにするのは比較的簡単だということがおわかりだろう。しかし、以前つくった紙の本を、データからPDFにするのはちょっとコシがひけちゃう。

当時のOS、アプリのバージョンで開かないと、字送りとかもう一度チェックしなくちゃ不安でしょ。ならば、もう裁断してスキャンしてしまったほうが手早い。OCRはどんどん精度を増すだろうから、時々OCRをかけ直してやればいい。

もちろん、これらは本格的な電子書籍をつくるまでの過渡的なものだ。さらに問題もイッパイある。紙の本を買ってくれた人=無料でPDFを提供するにしても、買ってくれたことをどう確認するのか? これまで出版した本のPDFにどうアクセスしてもらうのか?

で、国立国会図書館と有志出版社の「日本版Googleブックス」である。これまでに出版した本のPDFが、国立国会図書館のサイトで検索できて、一部が表示できるのであれば、自炊した本のデータ保存箱と同じことになるはずだ。

国立国会図書館にデータがある本なら、心配しないで捨てていいですよ、一部を読み返したいなら全体の20%まではネットワークから読めます、紙の本そのものを見たいなら、国立国会図書館にあるし他の図書館にもありますよ、となればいい。

AppleのiPadは、ありふれた部品や技術でつくられている、って話があるのだけど、電子書籍もありふれた技術の活用の仕方に、まだまだ可能性があるのではないだろうか?

◇2011.03.01 阿佐ヶ谷ロフトイベント
< http://www.loft-prj.co.jp/lofta/schedule/lofta.cgi?year=2011&month=3 >
続・2011年代の出版を考える 〜電子書籍ブームの先へ
日時:2011年3月1日(火)OPEN18:30/START19:30
会場:阿佐ヶ谷ロフト(東京都杉並区阿佐谷南1-36-16-B1)
前売り、当日共に1,500円(飲食代別)
【出演】
橋本大也(ブロガー・「情報考学」)
仲俣暁生(フリー編集者・「マガジン航」編集人)
高島利行(語研・出版営業/版元ドットコム)
沢辺均(ポット出版/版元ドットコム)
+ゲスト

【沢辺 均/ポット出版代表】twittreは @sawabekin
< http://www.pot.co.jp/ >(問合せフォームあります)
ポット出版(出版業)とスタジオ・ポット(デザイン/編集制作請負)をやってます。
版元ドットコム(書籍データ発信の出版社団体)の一員。
NPOげんきな図書館(公共図書館運営受託)に参加。
おやじバンドでギター(年とってから始めた)。
日本語書籍の全文検索一部表示のジャパニーズ・ブックダムが当面の目標。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━