Mar. 2016No.71

オープンサイエンス開かれたデータの可能性

Article

機関リポジトリから オープンサイエンスへ

教育研究機関の知的生産物を収集・保存して発信するための電子アーカイブシステム「学術機関リポジトリ」や電子リソースを利用する大学などで構成される連合体「学術認証フェデレーション(学認)」の運営に関わる山地一禎准教授と、地球環境データの大規模データベースや国文学研究資料館の古典籍データベース、東洋文庫の貴重書デジタルアーカイブに関する研究プロジェクトを手掛ける北本朝展准教授の2人が、オープンサイエンスの発展について現状と課題、展望について語り合った。

山地一禎

YAMAJI Kazutsuna

国立情報学研究所 学術リポジトリ推進室/コンテンツ科学研究系 准教授

北本朝展

KITAMOTO Asanobu

国立情報学研究所 コンテンツ科学研究系 准教授/総合研究大学院大学 複合科学研究科 准教授

評価基盤のカギは信頼

─オープンサイエンスは非常に広い概念。

北本 同床異夢と言うべきか、オープンサイエンスは人によって見方が違います。現状では、市民科学やオープンアクセス、オープンデータ、コラボレーションやクラウドファンディング、これらすべてがオープンサイエンスと呼ばれています。私は、オープンサイエンスとは研究に関する研究、メタ研究だと思っています。人によってさまざまなオープンの仕方があって、なぜオープンにするのか目的が違う。

山地 そう、現状はまだ定義づけできていないんです。皆、「何かある」と思っているけれど、大成功した人もいない。私自身はオープンリサーチデータの観点から、NIIにおいて「学術機関リポジトリ」のシステムをオープンソースで開発し、そのクラウドサービスを各機関に提供しています。日本は、機関リポジトリの数は500以上あり世界第1位を誇りますが、そのうちの200以上がNIIのリポジトリモジュール「WEKO」※を使っている。今まで学術機関は論文メインで運用してきましたが、論文は最終的なアウトプット、あるいは次の研究のきっかけでしかなかった。ところが、オープンサイエンスではプロセスを自分の研究に取り込むことがより簡単にできるようになる。ポイントは、データをオープンにするだけでなく、データを誰が何に活用したのかというクローズな部分まで、どのようにインフラとしてサポートしていくかです。

 そうした中で、難しいインフラ構築に取り組めるのはNIIならでは。しかも、中立的な公的機関が作っていて、使い勝手がいいからこそ評価も得られる。実際には要望や問題点の指摘も多いのですが、それだけコンタクトが多いということでもある。そうした利用者とのコミュニケーションはさらに信頼を生んで不可欠なインフラとなり、ブランドになっています。研究所が運営を行うメリットは、運用しながら常に新しいものを開発できることですね。

北本 一方で、基盤に対する貢献をどう評価するかが課題です。私が運用している「デジタル台風」という気象データベースでも、長期的に更新を続けていることが利用者からの信頼につながっている。ところが、もし論文を書くことだけが目的なら更新を続けることは評価の対象にはならない、という問題があります。データ基盤をオープンに運用して研究コミュニティに貢献する活動をどう評価するかは、オープンサイエンスにおける一つの重要な課題です。

 また、オープンとクローズをどう組み合わせて価値を生み出すのかも課題です。研究成果を共有することでコラボレーションが生まれ、データのリユースにより研究コストも下がる。いずれも、オンラインでつながるということが前提になっています。

山地 IT 環境で、どう簡単、便利に研究を加速化できるか。それこそが、NIIの役割の一つです。とくに、クラウド環境は人文・社会科学系にはまだ普及していません。その利便性を広めたい。

北本 人文系では個人研究が多いという点も理由でしょう。そもそもコラボレーションして研究することが今までは少なかった。でもこれからは人文系でも、個人研究に限界が生じることが増えるでしょう。ましてや、デジタル時代の人文学のあり方を研究する研究領域「デジタル人文学」ではコラボレーションが必須です。

山地 オープンにすると他の人の目に触れます。枠組みがあればデータのリユースから新しい研究のサイクルが始まる。新たな研究の発火材料にもなるのです。

予算はどこから捻出すべきか

─マイナス面は?

山地 データを出した人が正しく評価されるのかという問題はあります。

北本 デジタルオブジェクト識別子(DOI)とその登録機関であるジャパンリンクセンター(JaLC)では、研究データに識別子を付与する活動を推進しています。データに識別子が付与されてデータの作者が明示されれば、その貢献を評価することも可能になります。これは論文における著者役割の明示という話題とも関係するでしょう。今までは論文に「著者」というカテゴリーしかなかったため、多くの人々が関与するビッグサイエンスでは著者が1000人も並ぶことがありました。最近は単に論文著者というのではなく、もっと研究への貢献を細分化して明示する方向に進んでいます。ただ、研究者の貢献が計測可能となると、それが一人歩きして意図しない使われ方をする危険もありますが......。

山地 そうした歪みが、むしろ、ドライビングフォースになるかもしれません。今は公開することで透明性を担保する時代です。

北本 そこは意見が分かれるところかもしれません。データを保全して不正をチェックできるようにすることは切実な課題ですし、予算を出す側にもわかりやすい。ですが、オープンサイエンスの目的を不正防止としてしまうと、あまり価値を生まないのでは?

山地 僕の見方は逆です。インフラは核であり、費用がかかる。透明性の担保が出資者に響くのであれば、その点をうまくアピールすればいい。

北本 オープンサイエンスにはいろいろな対立軸がある、ということですね。だからこそ、全体像を踏まえた議論が必要なのです。

定着と信頼の輪

─今後の展望は。

北本 今の研究のやり方にはいろいろな問題が生じています。それをよい方向に変えていくためのドライバーとなるのが、インターネットです。オープンサイエンスという考え方が出てきた背景には、インターネットの活用によるオープン性の追究が不十分ではないか、という考えがあるのだと思います。

山地 ボトムアップで研究者が何を出していけるかがカギです。我々としては、研究データやラボノートを公開することが得になる環境を作ることが使命と思っています。素材自体はそろっています。データやクラウド基盤をつなげる仕組み、認証の仕組みもリポジトリもある。つなげば、何か生まれるかもしれない。

北本 実際にデータを作って公開すると、意外なところからコンタクトがあります。長期的な投資と考えればメリットはある。ただし、長期的にデータを作ることができる立場の人や機関がやらないと、投資を回収するのは難しいかもしれない。

山地 でも、データを公開すれば、誰かが見つけてくれる。

北本 時間はかかりますけどね。

山地 だからこそ、長期的にインフラ構築や運用ができる組織としてのNIIの意味は大きいということでしょう。

北本 5~10年続けないと、信頼は得られません。基盤というのはそういうものです。

山地 本当にサービスしている人じゃないと、この面白さは見えてこないんだろうなぁ(笑)。苦労はありますが、サービスが全国に広がっていく快感もあるのです。

北本 ぜひこの面白さを、NIIとともに体験してほしいですね。

(構成=森山和道 写真=土佐麻理子)

第71号の記事一覧