Mar. 2021No.91

NII Research Data Cloud 本格始動へオープンサイエンスを支える研究データ基盤

Interview

NII研究データ基盤「NII RDC」がいよいよ始まる!

NII×名古屋大学 見えてきた研究データ管理の課題と展望

2021年度から、NII研究データ基盤(NII Research Data Cloud)が本格的にスタートした。NII RDCは、研究データの管理基盤(GakuNin RDM)、公開基盤(JAIRO Cloud)、検索基盤(CiNii Research)の 3 基盤から構成されており、今回、新たにサービスを開始する管理基盤については、2020 年に実証実験を行った。この中で、先駆的な取り組みをしてきた名古屋大学では、附属図書館や情報基盤センターが中心となって研究データ管理の環境整備を進めている。環境整備やルール策定、データ公開基盤の整備・支援などを行ってきた名古屋大学の各担当者を迎え、NIIオープンサイエンス基盤研究センター(RCOS)の山地一禎センター長とともに、現在の取り組みや見えてきた課題、展望について語っていただいた。

青木学聡

Aoki Takaaki

名古屋大学 情報連携推進本部 情報戦略室 教授
大学 ICT 推進協議会(AXIES)研究データマネジメント部会 主査

2020年4月から名古屋大学情報連携推進本部情報戦略室教授として大学全体の情報基盤の企画に携わる。前職の京都大学情報環境機構時代より、研究支援のための情報基盤整備の立場で研究データ管理の課題に取り組む。

林和宏

Hayashi Kazuhiro

名古屋大学附属図書館 情報管理課専門職員
オープンアクセスリポジトリ推進協会(JPCOAR)
コンテンツ流通促進作業部会 JAIRO Cloudチームメンバー

2018年に名古屋大学附属図書館に赴任し、リポジトリの運用・管理業務に関わる傍ら、JPCOARで、次期JAIRO Cloudの実証実験や移行機関サポートの活動に参加する。

田中幸恵

Tanaka Sachie

名古屋大学附属図書館
東山地区図書課 東地区図書統括グループ 係長

2008年4月より図書系職員として名古屋大学に勤務。2020年度学術情報ネットワーク運営・連携本部 オープンサイエンス研究データ基盤作業部会 トレーニングサブワーキンググループ委員として、研究データマネジメント推進にかかる人材育成のための継続的な教材作成・更新、運用体制についての検討を行っている。

山地一禎

Yamaji Kazutsuna

国立情報学研究所
コンテンツ科学研究系 教授
オープンサイエンス基盤研究センター(RCOS)センター長

研究データの管理に大学も危機感

──2021年度より、NII ResearchDataCloud(NII RDC)が本格的に稼働しました。従来のサービスとの違いや意義をお聞かせください。

山地 これまでNIIは、デジタル化された学術論文や資料、研究成果などを保存・運用・公開する機関リポジトリを提供する「JAIRO Cloud」や文献検索サービス「CiNii」など、主に公開された論文に関するサービスを提供してきました。NII RDCでは、こうしたサービスを進化させるとともに、学術研究活動の過程で生成された研究データや関連の資料などを保存・管理できるように、「GakuNin RDM(Research Data Management)」という研究データの管理基盤サービスを新規にスタートさせました(図1)。これはまさに、研究活動に直結する新しいサービスであり、NIIとしても大きなチャレンジです。
 オープンサイエンスの営みは、図1のようなライフサイクルで回ります。まず研究計画を立てるところからスタートして、実験などを通じてデータを取得し、解析を行って、論文などにまとめて成果を公開します。それが他の研究者の着想に結びつき、新たな研究へつながる。いままでと大きく違うのは、右側のクローズドの部分、つまりこれまで非公開だった研究中のデータを共用の基盤で管理する点です。これを公開基盤と連携させることで、研究者の判断によりオープンにしていい研究データは公開し、サイエンスの発展につなげていく狙いがあります。
 これまで、大学では図書館が中心となって、機関リポジトリなどを通じ、論文の公開の部分を担ってきたわけですが、それを研究データの管理にまで拡張するということで、大学にとっても大きなチャレンジになりますね。

niitoday91_2_1.png

図1 NII Research Data Cloud
研究データのライフサイクルの中で、データ管理をGakuNin RDM、公開をJAIRO Cloud、検索をCiNii Researchがそれぞれ支援する。互いのデータ移行がスムーズで、ストレスレスな研究データ管理システムを提供する。

青木 研究データは研究者や研究室が個々の方法で管理しているのが実情で、まさにクローズドです。研究者の皆さんがどんな研究データを扱っていて、それをどう管理しているのか、外からはわかりません。また、研究領域ごとに管理の仕方もさまざまです。研究データは研究者にとって財産ですが、講座制の廃止や特任制度の拡大で、教員の退職や異動とともに研究室のデータや研究ノート、ノウハウなどがそっくり失われてしまうような事態も起きています。このままでは大学としての財産を失うことになり、大学側は危機感を強めています。これは、アカデミア全体の損失でもあり、デジタル化によって効率的に保存・運用していくことが重要だと思います。

山地 ハードディスクが壊れて研究データが失われてしまったり、どこにデータを保存したかがわからなくなってしまったりということは日本中で起こっています。研究者が個々にハードディスクやサービスを購入してデータを管理していたら手間やコストもかかります。また、現在、研究公正の観点から、研究資料などを原則10年保存することがガイドラインで定められていますが、十分に実行されているとはいえない状況です。大学が組織として研究資料やデータを管理できる環境を積極的に提供してくれれば、研究者にとってもメリットは大きいはずで、潜在的なニーズは非常に大きいと思います。

大学図書館の新たな役割

──名古屋大学ではどのような取り組みをされているのでしょうか?

青木 名古屋大学では2019年の初めに総長から直々に「研究データ管理やオープンサイエンスを推進するように」と指示があり、検討体制が急速に立ち上がりました。まず方向性を定めるために学術データポリシーを作成し、「研究データの管理・公開・利活用を支援するための環境を提供することが大学の使命であること」を明確にしました。現在は図書館や情報基盤関係の教職員が中心となって環境整備を進めています(図2)。

niitoday91_2_2.png

図2│名古屋大学でのRDM支援体制の構築
名古屋大学での取り組みは、竹谷喜美江「名古屋大学における研究データ基盤整備推進組織の整備について」、第3回SPARC Japan セミナー2019(https://www.nii.ac.jp/sparc/event/2019/20200207.html)も併せてご参照ください。

 図書館では主に公開基盤に関する業務を行っています。公開部分は研究データのサイクルの中では、学術情報が循環し、次の新しい研究を牽引する重要な役割を担います。これまではNIIの機関リポジトリ・サービス「JAIRO Cloud」上に学術論文などを保存し、情報発信をしてきました。現在は、論文だけでなく、研究データも公開できる新しいJAIRO Cloud(ソフトウエア名はWEKO3)への移行作業を行っています。

山地 WEKO3は新しい機能を追加しやすいシステム構成になっています。現状はまだ使われ始めたばかりですが、これから各機関で運用が始まってフィードバックを得ることで、使いやすいように機能を拡充していく予定です。

 研究データはこれまで扱ったことのない形式なので、図書館にとっては新たな挑戦になりますが、NII RDCを通じて、クラウド上で他の学術機関と課題やその解決方法を共有できるのは心強いと感じます。先行した事例が手本になって、次の事例が続くような連鎖が起これば、一気に広がりを見せて、日本中で学術情報の管理体制が整い、情報発信へつながっていくだろうと期待しています。

田中 研究中からデータを管理基盤に保存していれば、公開基盤への移行も簡単になります。そういったシステム連携のメリットの広報などが足りていないので、図書館では公開部分に限らず、研究データ管理の促進も含めて支援していけたらと思っています。研究データのオープン化の世界的な潮流に、図書館として寄与していきたいですね。

研究データ管理は誰がどう支援する?

──研究データ管理を実践するには、支援する人材も不可欠です。

田中 オープンアクセスリポジトリ推進協会(JPCOAR)の作業部会が中心となって、研究データ管理を支援する人材育成のための教材がいくつかつくられています。いまはそれを各研究機関でより活用してもらうため、NIIに設置されたオープンサイエンス研究データ基盤作業部会トレーニングサブワーキンググループ(以下TSWG)で、研究データ管理に関する一連の業務とその遂行のために必要なスキルをピックアップしたリストを作成しています。こうしたスキル一覧表を提示することによって、各研究機関において支援人材を育成するための教材やプログラムの選択・開発・評価に使っていただくことを意図しています。さらに、この業務を担い得るのはどういう職種の人なのか、どういう人材を育成すべきなのか、という情報も付け加えていますので、各研究機関の状況に合わせた組織的な支援・連携体制を構築する際のヒントにしていただけると考えています。

山地 既存の教材は、もともと海外の事例や教材を参考にしてつくったものなので、TSWGではそれを日本の職制や大学の組織構造に合う形に再構築してくれています。

田中 図書館員全体を見ると、研究データ管理に興味はあるけれど、これまでの業務と直結するものではないので、どう関わったらいいのかわからない人が多いという印象です。そうした人たちに向けて、一歩踏み出すきっかけになるようなコンテンツを提供していきたいと強く思っています。正直に言うと、私も当初、研究データ管理は本当に図書館が担うべき業務なのかと疑問に思っていました。ところが関連タスクを整理してみると、まったく新しいことばかりではないことに気づきました。公開基盤に登録された研究データへのメタデータの付与など、いままでの図書館の仕事の拡張やプラスアルファでできそうなことが実はたくさんあります。

 扱うデータの形式が多様になり、クラウド化されたという違いはありますが、図書館がこれまでも行ってきた学術雑誌の整理や提供と基本的には同じ役割、つまり、学術情報の流通と保存によって、教育研究活動を支援していくという役割に変わりはないのです。私もそのことに気づいてからは、利用者に対してベストな提供方法を考えるようになり、やりがいや面白さを感じるようになりました。

青木 図書館や情報基盤センターが行っていることは、研究者や学生には案外知られていません。研究データ管理に関わることで、研究者の生活により密着したところにリーチし、お互いに信頼関係を築く良いきっかけになるかもしれません。

田中 青木先生のおっしゃるように、研究者や学生に図書館等のポテンシャルを知ってもらい、研究データを公開したいときに頼れる場所としてもらえたら理想です。大学事務組織においても、これまで、図書館の仕事は外から見えづらく、アピールは難しいと感じていました。研究データ管理に関わる業務は多岐に渡っており、その支援を一部署で完結することは不可能です。どうしても、図書館以外の部署との連携が必要になり、お互いができることを共有しながら、組織的に支援を提供していくことになります。研究データ支援に関わることで、図書館のプレゼンスの向上にもつなげていけたら嬉しいです。

まずはニーズを掘り起こす

──2021年2月15日から管理基盤であるGakuNin RDMの本格運用が始まりました。利用状況はいかがですか。

青木 名古屋大学では昨年の実証実験から参加していて、大学が用意したストレージを使って、それをGakuNin RDMに接続する形で運用しています。つまり、データ本体は名古屋大学のシステム内にあり、それを共有するための入口がGakuNin RDMになります。今後もこのスタイルで運用していく予定です。大規模な研究プロジェクトでの活用事例はまだありませんが、研究室の中で使っているという声はいくつか聞いています。
 これまでの利用例を見てみると、GakuNin RDMの魅力は、研究室内や大学内での研究データ管理だけでなく、他の学術機関とのコラボレーションを進める際のポータルとしての使い方にあるのではないかと感じています。名古屋大学の事例ではありませんが、実際に大学間での共同研究にGakuNin RDMをポータルとして研究データを管理する体制をつくったという話もあります。

──どのような課題が見えてきましたか。

青木 研究者の多くはすでに独自の方法で研究データを管理しているので、そこに新しい仕組みを浸透させるのは容易ではありません。「新しい酒は新しい革袋に盛れ」という言葉があるように、まずはこれから研究を始める若手研究者へのリテラシー教育や、新たに始まる研究プロジェクトに合わせて利用を勧めていくことが、効率的な利用拡大につながるのではないかと考えます。また、こうした新しい仕組みを普及させていくには、不慣れな環境を乗り越えるための支援体制を充実させていくことも不可欠です。

山地 新しいことをやるときは、必ず反対する人がいて、大きな課題に直面するものです。人の考えや行動パターンを変えるのはすごく難しいことですが、ニーズをきちんと掘り起こし、徐々にいまのワークフローを変えていくのは、実はいちばん面白いところでもあります。

青木 まさに名古屋大学では、ニーズを掘り起こしながら仕組みをつくっているところです。ニーズは確かに存在し、研究者にとって便利になるのは間違いありません。研究データの管理を独自にやろうとすると、データにどんな名前を付けてどこに保存するか、研究ノートにはどんな項目を書くかなど、決めなくてはいけないことが山ほどあります。GakuNin RDMの使い方が浸透していけば、同時に機能拡張も進み、データ管理の方法も標準化されていくはずです。それにより、研究者のストレスは格段に減るでしょう。

山地 最近、退職する教授が学術の発展のためにこの情報をぜひとも残しておきたいという場合や、論文発表の際に研究データも一緒に公開しなくてはならないケースが増えています。公開部分に関しても、そういうニーズをきちんとキャッチして、徐々にすそ野を広げてワークフローを変えていく。将来を見越し、海外の動向に目を向ければ、それはやはり研究者にとって必要不可欠な営みになっていくと思います。

大学の声を聞きながら機能を実装できる強み

──今後の普及に向けて何が必要でしょうか。

青木 研究データ管理に関しては、単にストレージを共有するだけでは、他のさまざまなクラウドサービスと競合してしまいます。ストレージの共有から一歩先に進んだ、研究プロジェクトのポータルとしての機能を増やしていくことが必要ではないかと思います。

山地 日々使うものだから研究者の目は厳しい。「こんなもの使えない」といわれないように、使いやすく、役立つものをつくらなくてはいけません。研究データ管理にどんなスキルが必要かといった情報や、大学での活用事例からどんな機能が必要かといったフィードバックがこれから得られると思うので、NIIは大学とともにPDCAを回しながら改善改良を重ねていく。それをこれからスタートしていくわけで、さらに重要なフェーズに入っていきます。

青木 いままで以上に協力体制を強化していく必要があります。機能としては、まずは手軽に使えることがもっとも重要だと思います。事前準備としてやることがたくさんあると、使う前に気持ちが萎えてしまいます。GakuNin RDMのシステムは、大学が「学術認証フェデレーション(学認:GakuNin)」に参加していればアイデンティティプロバイダ(IdP)連携のみですぐに使えるようになります。ただ、IdPの運用は機関の問題なので、末端の研究者から見ると、非常にハードルが高くなってしまっているのが現状です。より多くの機関が学認に参加し、GakuNin RDMを気軽に利用できる仲間がどんどん増えてほしいと思っています。

田中 研究データ管理を支援する側にとっても、簡単に使えるものでないと、結局、指導できる人も限られて内々のものになってしまいます。NIIが構築してくださったシステムをただ使うだけではなく、大学側が積極的にユーザーボイスや活用事例をフィードバックして一緒に良いものをつくっていくという姿勢で臨みたいと思います。

 公開基盤に関しては、まだ日本国内での事例が少ないので、NII RDCが各機関と事例を共有できる場所、仲間を増やす場所として機能していけば、さらに発展していく足がかりになると思います。

山地 大学の声を聞きながら、必要な機能を実装できるのは、私たちの最大の強みです。大学との信頼関係はNIIにとっての財産ですからね。今回、NII RDCを構築していく中で、大学の人たちや若い人たちとも同じ目線で会話ができるような体制が整ってきました。セクターを超えて一緒に大きな挑戦をしていくことは、若い人たちにとって非常に良い経験になるでしょう。これが成功すれば、いままでよりさらに強固な関係を築いていけると楽しみにしています。

(文=秦千里)

関連リンク
第91号の記事一覧