SPARC Japan NewsLetter No.15 コンテンツ特集記事トピックス
line
menumenu menumenu
Open Accessはどこまで進んだのか(2) オープンアクセスはいかに実現されてきたのか

林 和弘(はやし かずひろ)
科学技術政策研究所:SPARC Japan運営委員会委員

● はじめに

研究者の文献管理とコミュニケーションの変遷 図:研究者の文献管理とコミュニケーションの変遷

電子ジャーナルはもう当たり前の時代になった、という表現自体がもはや陳腐化してきた。今や学術情報受発信に関わる関係者にとって、学術情報流通を電子化することは少なくとも英語を主としてコミュニケーションを行う研究領域においては主目的ではなくなり、電子化された、あるいは元から電子的に生まれた情報をどのように研究者コミュニケーションに生かし、研究者の研究活動に役立てるかを考え、実行しなければならない。このような状況下で昨今注目を浴びているものの一つが文献管理ツールと、それを利用した研究者コミュニケーションの在り方についての議論である。昨年2011年と今年2012年に、いくつかのご縁が重なり、今もっとも注目を浴びている文献管理ツール、Mendeley の CEO である Victor Henning 氏と親交を深めることができた。Mendeley は学術論文版 iTunes とも呼べるものであり、次世代の文献管理ツールとも新しいソーシャルメディアとも言われている。昨年 Henning 氏の初来日時に企画した NISTEP 講演会「研究者間コミュニケーションを根本から変える文書管理の変革」1 とそれを短縮して翻訳した記事2 はそれなりのインパクトを与え、Mendeley の紹介3 図書館の視点から見た考察4 などに引用され、社会科学的な考察を喚起するにも至っている。5

Mendeley の登場がなぜ大きなインパクトを学術情報流通の世界に与え、彼がなぜ時の人となっているのか。この講演会を企画する際に、Mendeley がどのようにして生まれ、何を目指すのかについて、できるだけ学術情報流通の文脈に沿って Henning 氏から引き出すためにどのように構成したらよいか、大いに、かつ、楽しみながら悩んだ。ツールの説明や他の文献管理ツールとの比較としては、SPARC Japan セミナー6 の企画にも部分的に携わっていたこともあり、思い切って、彼自身の起業家としての生い立ちと、Mendeley を通じた研究者コミュニケーションの将来に主眼を置くことにした。その際、文献管理ツールのこれまでの生い立ちについても、研究者の情報管理環境とコミュニケーション手法から振り返り、その変遷を捉え直して考察した。その内容の紹介および、そこからある程度将来を見通すことを今回試みてみたい。

● 電子ジャーナルの今

さて、まずは未だ進化が続いている学術電子ジャーナルの今を確認する。学術電子ジャーナルはチューリッププロジェクトと呼ばれている、エルゼビアの試みに端を発するのか、その前の OCLC やアメリカ化学会の電子情報発信プロジェクトによるのか諸説あるとされるが、そもそもwebを通じた本格的な情報の受発信環境が整う前より、紙と物流を通じた学術情報流通の情報自体をデジタル化することで始まった。1990年代後半から2000年前半にかけて Web を通じたコミュニケーションが浸透するにつれて、そのデジタル化した情報は、より公開しやすくなり、審査もオンライン上で行えるようになった。今では数千の単位のジャーナルが単一のプラットフォームを利用してオンライン上で投稿手続きや審査を行い、また、数千のジャーナルを公開できるプラットフォームも複数存在する。それぞれのジャーナルは CrossRef などを通じてほかのジャーナルとリンクし、あるいは Web of Science や PubMed 等の書誌データ、あるいは引用データからもつながるようになり、さらに発展して、今はもっと違うクラスのデータベースに、つながるようになっている。例えば物質データベース、遺伝子や化合物データベースにつながり、これからは人のデータベース、すなわち ORCID のような研究者の DB と繋がるようにもなって来た。加えて、ただ単にリンクで繋ぐだけではなく、API 等を通して、様々なデータベースをマッシュアップして繋げて解析や処理を行うことで、新しいサービスや新しい価値を測るための候補をどんどん生み出すようになっている。例えば、出版編集で身近な例でいえば、誹謗剽窃発見を支援する CrossCheck では、web の公開情報に加えて、各出版社が互助的に提供した論文データを用いて論文のコピーによる不正発見の手助けを可能とした。あるいは、公開で言えばこれから論文単位でソーシャルネットワークの反応を計量化する Altmetrics の採用が浸透し始めようとしている。各出版社がその気になって他の DB から情報を引っ張ってくれば、各論文の Twitter やブログでの反応などを即時的に表示でき、論文公開後のインパクトが被引用数より早く計量できる時代になった。このような電子ジャーナルとそれを取り巻く状況の中で Mendeley が研究者に受け入れられている。

● 電子的コミュニケーションとストレージの変遷

ところで、電子的な学術情報流通はもともと研究対象として学術系で始まったので、電子ジャーナル化関連の開発は、しばらくは学術の世界の情報のやりとりで先行していた。ウェブを利用した電子メール(eメール)も元々は大学内に限られていたものが社会に拡げられた。それが、最近になって、もはや電子でのコミュニケーションは社会の方が進んでしまっているというのは読者自身の普段の生活実態に見て取れると思われる。簡単に振り返ってみれば、ウェブの前は紙と電話とファックスを駆使して情報のやりとりを行っていたが、ウェブ以降になると、eメールがまず浸透して、加えて掲示板、BBS(Bulletin Board System)の利用が進み、ホームページの開設やポータルサイトが流行り、2005年ぐらいからブログやP2P(Peer to Peer)、スカイプなどの新しいツール、メディアが出てきた。この辺りから、社会ではウェブ経由での情報交換が加速し、2006-2007年を境に、SNS とか Twitter などのソーシャルメディアが登場して、これらは社会に爆発的に受け入れられた。社会はもう既に多種多様に電子的にコミュニケーションを取っており、新しいコミュニケーションメディアは“アラブの春”など政治的革命に至るまでの影響力を示すほどになった。しかし研究者コミュニケーションとしてみると、eメール以外のもので主要な地位を占めているものは、今のところはまだ現れていないとも言える。いつからかを正確に語ることはできないが、電子的コミュニケーション基盤の浸透という意味合いでは、社会においてと研究者間において逆転現象が起き、社会の電子的コミュニケーション基盤の方がより速く進化していると言えるだろう。

表:文献管理とコミュニケーションのバージョン分け
Ver. コミュニケーション
手段
ファイル交換 データベース 主要論文
フォーマット
文献管理ツール
(リリース年)
0 手紙 郵送 書庫 ファイリング・
バインダー
1 電子メール 電子メール添付 PCローカル PDF EndNote
(1988)
2 web web 共有 PC+web PDF RefWorks
(2002)
3 SNS クラウドに置いて共有 クラウド+PC PDF Mendeley
(2008)
4 ? 初めからクラウドで形成
されるものを共有?
クラウドのみ? Post PDF ?

もう一つ学術情報流通を支える環境で大事なものにストレージの変化がある。ウェブとかデジタルの前は当然机の上や、書棚、あるいは図書館にある紙に載せられた情報を利用し、保存とは紙の保存を指していたが、それがまず PC(あるいはマック)の中に保存できるようになった。メディアでみれば、フロッピーディスク(FD)、CD、光磁気ディスク(MO)、DVD 等を利用してローカルに保存するという時代を経て、ハードディスク(HDD)の登場によって容量の拡大が進んだ。同じころに、比較的閉じた中のネットワークの中にある HDD、ストレージに保存できるようになった。ネットワーク回線の速度の向上も加わって、今ではクラウド上にも相当の領域を確保し情報を保存できる時代になった。

● 文献管理ツールのバージョン分け

前置きが長くなってしまったが、以上の電子的情報流通環境の変化はそのまま研究者の情報交換、流通に密接に関連している。現在研究者も情報の洪水の中に埋もれている。研究のために読むべき情報は某大であり、研究成果としてなるべく多くの論文を多くの参考文献と共に書かねばならない。研究費を申請する際にはたくさん申請書を書いて自分の文献や関連文献を並べなければならない。あるいは昇進するためにもやはり同じようにたくさんフォームを書かなければならない。なんだかんだ言って便利に使われてきた紙でファイリングするにも限界があり、あるいは単に PC にフォルダーを作りその中に入れて管理するにもいよいよ限界が出てきた。ここで脚光を浴びてきているものが文献管理ツールということにもなる。

最近、試みにではあるが、以上の学術情報流通の変革の文脈を踏まえて文献情報管理のスタイルをバージョン 0、1.0、2.0、3.0と分類して説明を行っている。まずウェブ、デジタル化の前というのは当然自分の物理的なスペースに全部保管して、もし情報のやりとりをしたい場合は郵便で、つまり物流インフラに乗せるしか手段はなかった。これを基準の0とすれば最初の1.0では自分のパソコンの中に文献ファイルを保存してeメールで送れるようになった。2.0では、ウェブスペースに文献情報を置いて、その URL などを連絡して論文情報をシェアすることができるようになったとする。そして、今、3.0としては、クラウド(Cloud)の中に情報を登録し、人々がほかの人のデータも共利用することで、必要なデータベースを大勢で作り上げる(Crowd-source)。そしてその登録や閲覧の過程のやりとり(ログ)を解析することで各論文のパフォーマンスを測定できるようになった。

以上を具体的な文献管理ツールに当てはめてみる。0は紙のファイリングに相当することになり、バインダーや文書整理ボックスの利用にあたる。続いて EndNote が1988年に登場し、PC のローカル領域に文献情報等を保存して、主に個々の執筆支援に使われ始めた。これは1.0に相当することになる。2002年に登場した RefWorks では、ASP(Application Service Provider)サービスでウェブ上に論文情報をアップロードしてその置き場をeメールなどでシェアできるようになった。これは2.0にあたる。そしていよいよ3.0になって、2008年にリリースが開始された Mendeley では Born Cloud という形で、ただシェアするというよりは、一緒にデータベースを作り(co-creative, collective intelligence)、一緒に評価して(co-evaluation)、運営を続けるほどに質も量も良くなるという、新しい要素を付加した格好になっている。このような3.0タイプとしては、Nature 系(マクミラン社)の資本が入っている、Digital Science よりリリースされ、元はハーバードの学生が開発した ReadCube、日本では東大の岩崎氏が作られた TogoDoc と言う医薬系版 Mendeley と言えるようなツールもある。なお、念のため、1.0、2.0として紹介した EndNote、RefWorks が古いままということは決してなくて、各々開発と改訂を進めて、3.0の形態にどんどん近づけている、あるいは他ツールとの差別化や、その先を見越して改善を続けているという状態と言えるだろう。いずれにせよ、3.0のように、co-creating、co-evaluation というところまで来てしまうと、もはやただの文献管理ツールではなくて、研究者コミュニケーションを媒介するメディアとなり、学術情報流通のエコシステムの中の1つのサービスとして捉えられるレベルまで来ていると言える。

● 文献管理ツールの変遷からみえる次世代の研究者コミュニケーションの可能性

このように振り返ってみることで、一定の法則のようなものが見えてくる。法則というのも大げさかもしれないが、シンプルに見てやれば、その時代に利用出来る情報流通環境の範囲内で、そして段階的進歩の過程ごとに、研究者に役立つ文献管理ツールが開発され続けているにすぎない。Mendeley は突発的に生まれたというよりは時流に合わせて必然的に生まれたと見ることも可能である。

それでは、今なぜ Mendeley が俄然注目を浴びているのか。一つは社会で確立されたシステムの流用という点であろう。Mendeley は FM ラジオ番組での iTunes と言える Last.FM のエンジンを利用している。すなわち、先に述べたように、かつてとは違って先に社会で十分こなれた情報サービス基盤が学術情報流通向けにカスタマイズされているので安定感がある。続いて、創業者が研究者かつ起業家であったことも大きいだろう。そもそも研究者や研究者であった人が、欲しいサービスや時代が必要としているサービスを創り上げる歴史は、インパクトファクター(Eugene Garfield)、web(Tim Berners-Lee)、arXiv.org(Paul Ginsberg)など、枚挙にいとまがない。Mendeley 自身も Henning 氏を含む創業者3人組が PhD を取る過程で文献管理に困って作ったものとされる。また、研究者自身の欲求や好奇心から立ち上がるサービスには、本格的事業化に進む際にビジネスをやりくりするという意味合いでの問題が起こりやすいが、これも、先に述べた、Last.FM の創設者他からうまく出資を得ることに成功し、極めて円滑に事業の拡大にも成功していることが大きいだろう。つまり、これまで学術情報流通のステークホルダーと縁遠かった情報基盤インフラと資本、そして人材が投入されたことが大きなポイントとなるのではないだろうか。

となると、4.0があるとしてその姿はどうなるか。仮に1.0-3.0の流れを踏襲して外挿延長すれば、まず、新しい情報流通環境の段階的進歩(飛躍)が見られ、その時、その環境に最適化されたツールが改めて開発される。その基盤はもはや学術情報流通に特化して一から開発されるものではなく、社会的にも受け入れられたコミュニケーション基盤のカスタマイズとなる。それを開発するのはやはり若い研究者がその時何かの必要に迫られてとなる。資本や人材は思わぬところから投入される可能性もある。あくまでこれまでの外挿としてストーリー建てればこのような流れとなるだろう。ここで、飛躍を生み出し段階的進歩を遂げるポイントの一つとしてありえそうな話としては、クラウド利用の進展である。例えば、そもそもクラウド上で論文を書くなど、ローカルに論文を置くことが無くなれば、文献の管理の仕方も変わりうる。次に本文 PDF からの脱却も可能性として考えられる。現時点で、敢えて、あくまで強いてであるが Mendeley が持つレガシーな要素を一つ挙げると、PDF の取り込みが主要なトリガーイベントの一つとなっていることである。本文 PDF を取り込むと自動で書誌情報を抜き出して登録してくれるこの機能と、このトリガーイベントは大変現実的であり、今しばらくこれを否定するつもりは毛頭ないが、タブレット端末が浸透していくと予想されるこれからにおいて、本文 PDF ファイルの役割はどう変わっていくかについては注目すべきだろう。仮に本文 PDF からの脱却が起き、いわゆる紙面に依存しない論文本文ファイルが本格的に流通しだすと、その流れに合わせたツールが開発されるかもしれない。もう一点加えれば Peer Review の在り方も Henning 氏自身が変わると主張しているものである。誰かが公開しようとする研究成果情報の質を誰がどのように担保すべきか、あるいは担保せず、後々の評価に任せるのか。この議論を進めていくと、研究成果の発表メディアとして、先に確認した電子ジャーナルやそれを拡張したサービスが最適なのかどうかという話に繋がり、結果として文献管理の「文献」の在り方自身が変わる。本当にそうなれば当然、それを管理するツールも変わってくるだろう。さて、果たして本当にそうなるのか。あるいはこのような進化はいつまで続くのか。さすがにそこまでを予想するのは至難の技である。

専修大学の植村氏によるとグーテンベルグがもたらした機械印刷による情報流通の革命が、最終的に社会に浸透し落ち着くまでに250年を要したと言う。7 その “250年” から比べれば、“ほんの20年ほど前” にようやく始まったと言える web インフラによる情報流通の革命が落ち着くまでに、250年とは言わないまでもまだ年数はかかりうるだろう。それまでの間、社会の情報流通環境が変わり続け、結果的に研究者の情報交換スタイルも変わりうる。グーテンベルグの頃、冊子バージョンの学術雑誌が落ち着くまでに、もし今回試みたような観点に基づく様々な情報流通形態(バージョン)の変化があったとすれば、歴史に埋もれながらも一体バージョンいくつまで到達していたのかを思いながら筆を置きたい。

 


参考文献
1. NISTEP所内講演会 “研究者間コミュニケーションを根本から変える文書管理の変革”. NISTEP講演録. no. 286. 2012-02-08.
なお、本稿は、この講演会の冒頭に行われた概要説明をベースに大幅に書き加えたものである。
2. ヘニング ビクトール. 研究者コミュニケーションを根本から変える文書管理の変革:Mendeley CEOが語る学術情報流通の将来. 情報管理. vol. 55, no. 4, 2012, p. 253-261. http://dx.doi.org/10.1241/johokanri.55.253
3. 坂東 慶太. 文献管理サービスMendeleyの紹介. 医学図書館. vol. 59, no. 3, 2012, p. 243-249.
4. 林 豊. CA1775 - 大学図書館のサービスとしての文献管理ツール. http://current.ndl.go.jp/ca1775
5. 小山田 和仁. 研究開発戦略ローンチアウト:第31回「ソーシャルメディアの普及が科学研究にもたらす変化.
http://scienceportal.jp/reports/strategy/1201.html
6. 国立情報学研究所. 第2回SPARC Japan セミナー2011「今時の文献管理ツール」ワークショップ. 2011.
http://www.nii.ac.jp/sparc/event/2011/20111206.html
7. 植村 八潮. 日本画像学会年次大会:Imaging Conference JAPAN 2011 キーノートスピーチ. 2011-06-06.