Interview
研究活動の変革を目指す
ルール・ガイドライン整備チーム 人材育成チーム
文部科学省が取り組む「AI等の活用を推進する研究データエコシステム構築事業」は、デジタル技術とデータ活用による研究活動の変革―研究デジタルトランスフォーメーション(研究DX)を推進する事業で、「ユースケースの形成・普及」「データ共有・利活用の促進」「研究デジタルインフラ等の効果的活用」を一体的に推進する。事業は、国立情報学研究所(NII)と共同中核機関の理化学研究所、東京大学、名古屋大学、大阪大学によって2022年に開始した。その中で今回「データ共有・利活用の促進」のため、適切な研究データ管理支援、データマネジメント人材育成支援を目指す、「ルール・ガイドライン整備チーム」および「人材育成チーム」に、現在までの進捗、課題、展望について聞いた。

松原 茂樹MATSUBARA, Shigeki
名古屋大学
情報基盤センター 教授

甲斐 尚人KAI, Naoto
大阪大学
D3センター 准教授

長岡 千香子NAGAOKA, Chikako
国立情報学研究所
オープンサイエンス基盤研究センター
特任助教

平木 俊幸HIRAKI, Toshiyuki
国立情報学研究所
オープンサイエンス基盤研究センター
特任研究員
(敬称略)
■「研究データ管理」の普遍化を目指して
──研究データエコシステム構築事業での活動の概要を教えてください。
松原 研究データエコシステム構築事業ではNIIのほかに4つの共同実施機関が参画しています。名古屋大学は「ルール・ガイドライン整備チーム」のリーダー機関として、研究データの取り扱いに関するルールを国内の大学で整備、普及させ、全国的に統一的なフレームワークの下で研究データが扱われるようになることを目指しています。
大学における研究データの取り扱いは、現状では、研究グループや研究者の裁量で決まることが多いと思います。研究者にとっては自由度が大きく、一見、望ましいように見えますが、行動するたびに扱い方を判断しなければならないのは非効率です。
ルールやガイドラインがあらかじめ定められていれば、研究者が研究データの取り扱いで迷う必要がなくなり手続きが効率化されますし、グループで研究データを共有する場合にもデータの意味や管理方法などのあいまいさも解消されます。また、研究支援者にとっても支援方法を明確化できるなど多くのメリットがあります。
大学にとっては、グループや研究者ごとに異なっていたデータの取り扱いや置き場などを統一することで、研究データのガバナンス、つまり、どのようなデータがどこに存在するのかを把握しやすくなります。データ利活用の施策も打ち出しやすくなり、大学にとってもメリットが大きいと思います。さまざまな分野のデータがひとところに集積するようになると、データの利活用を通じて人と人、研究者同士の結び付きが強まり、研究活動の厚みが増すのではないでしょうか。データの価値とはそういうところで高まっていくのだと思います。
平木 私は「ルール・ガイドライン整備チーム」と協力し、データガバナンスを支えるための機能の開発を行っています。研究データの管理を適切に行う上で、現在のデータ管理の状態を把握することが重要です。データガバナンス機能は、1.データ管理上何を守らなくてはいけないか(ポリシー・ルール)を見える化、2.今のデータ管理状態を見える化、そして3.今のデータ管理状態がポリシーやルールに沿っているかどうかの検証の支援という大きくこれら3つの柱の実現を目指しています。
甲斐 まずは研究データ管理の重要性を広くしっかり浸透させていくことが重要です。そこで「人材育成チーム」では、研究データ管理を正しく理解した研究者や研究支援者を育成する環境の構築を目指しています。具体的には、まずデータ管理に関する教材を開発し、学習管理システム(LMS)を通して全国の研究機関に水平展開することを目指しています。そして職種別学習カリキュラムの開発、さらにはラーニング・アナリティクス(LA)基盤の構築による個々人に適した効果的な学習環境を通して、研究データエコシステムのサイクルに適切にトルクをかけられる人材の育成を目指しています。
長岡 大阪大学が作成し、オープンアクセスリポジトリ推進協会(JPCOAR)で標準化した教材を全国に展開する際のプラットフォームとしては、NIIが提供している学習管理システム、「学認LMS」を利用しています。学認LMSでは、学習コンテンツの提供、改善のための学習分析機能の提供、関連するサービスとして教材再利用のためのリポジトリ提供など、これまでに構築してきたプラットフォーム機能があり、これらを通して人材育成に関する支援を行っていく体制です。
研究データ管理(RDM)の学習は、研究データを適切に扱い、再利用できる形にするために必要な知識やスキルを知ることができますので、一部の分野の研究者だけのものではなく、研究データを取り扱う全ての研究者にとって、データを取り扱うための必須の資格という位置付けにしたいと考えています。そのために教材の作成および普及を進めていらっしゃる甲斐先生ほか大阪大学の取り組みをプラットフォームでサポートするのが私たちの役割です。
■事業推進の現状と課題
──現在の活動の進捗、課題などについてお聞かせください。
松原 大学における研究データ管理の推進は、多くの大学が相互に参照し合いながら進めていくのがよいと考えます。実のところ、「研究データエコシステム構築事業」が開始された2022年夏の時点では、ルール・ガイドラインの出発点とも言える「研究データポリシー」を策定している大学は10校に満たない状況でした。国の施策として「2025年までに大学がポリシーを策定する」という目標が掲げられていますが、2024年末の時点では90校程度に達しており、着実に進んでいる印象があります。
もう一つ、研究データの公開に関しても、全国の大学で機関リポジトリの整備が進められています。従来、論文の公開が主だったのですが、研究データに関しても、リポジトリで公開するためのメタデータの基準づくりが進んでいます。
一方で実現が難しいと感じるのは、すでに研究グループ内で独自のスタイルが浸透している場合です。それらはさまざまに最適化された結果として定まったものでしょうから「現在の方法をやめて、今後は大学のガイドラインに従う」というのは簡単ではありません。研究データの公開についても大きな負担だと感じる研究者や研究支援者は多いと思います。それもまた難しさの一つです。
NII研究データ基盤の発展や普及が、この問題の解消に大きく寄与するものと期待しています。
平木 データガバナンス機能に関しては、特にここ2、3年はコア部分の機能、つまり「ポリシーをうまくシステム側で判定できるように設定する」、および「設定されたポリシーに則って、データ管理の状態を検証する」という機能の開発を進めています。
しかし、実際のルール・ガイドラインを、我々のデータガバナンス機能側でポリシーとして適用することに非常に難しさを感じています。現状、ルール・ガイドラインとして整備されているものは、人間には理解できても、システムからすると『読みづらい』、つまり機械可読性が低いためです。「それらの機械可読性を向上するにはどうすればいいだろうか」「どのようにロジックを組めばいいのだろう」と悩むこともあります。このあたりは松原先生と相談しながら、詰めていく必要があるだろうと思っています。
長岡 人材育成に関して、教材の作成は比較的順調に進んでいるように感じています。反面、今後について、やはり「どのように各機関に研究データ管理の文化や教育を浸透させていくのか」という点が最も大きな課題だと感じています。
今後も研究データ管理に関する知識や関連する教材は増えていくと思いますが、たとえばそれらの活用を義務化するとしても、では、どのレベルまでの学習を受講者に求めるのか。また、義務化と言っても、学習者である研究者や研究支援者が「嫌々ながらやる」ものにはなってほしくないわけで、それらを学び使うことで『いいこと』がある、と感じられるように持っていきたい。義務化の一方で、そのような、学習者が能動的に楽しく学ぶことができる路線も模索していきたいと考えています。
甲斐 教材の作成と展開に関しては、当初想定していたよりも前倒しで進めることができていると思います。これは、我々大阪大学とNIIとが、チームとして、逐一情報を共有できているというところが大きいと感じます。
特に、教材の展開について、NIIの学認LMSの活用をまず前提に置いたことは、展開先の負担軽減につながっていると思います。
長岡 NIIとしては、この「研究データエコシステム構築事業」が始まる以前から、各機関の教育コンテンツの開発・維持に関するコストを軽減すること、また、一部の教育者・研究者が作成した良質な教育コンテンツを全国のレベルで共有できるようにすることを目的として、教育コンテンツを共有・学習できるプラットフォームである学認LMSを構築してきました。いわば"種"をずっと育ててきたわけですが、そのプラットフォームが、今回うまくマッチしたと言えると思います。
■全国展開・水平展開のビジョン
―─そのような課題を踏まえ、今後の展望についてはいかがですか。
松原 ルール・ガイドライン整備チームとして、まずは2024年度中に研究データのガイドライン整備を行い、2025年度からそれを全国に展開していく予定です。それと併せ、先ほど平木さんからもあったように、整備したガイドラインを、NII研究データ基盤に機能としてどのように盛り込んでいくか。これをNIIの皆さんと協力しながら進めていければと思います。
平木 策定したルールやガイドライン、ポリシーを、研究データ管理に活かすための仕組みの開発を進めていこうと考えています。我々が今作っているデータガバナンス機能の中で、システム的にそのポリシーが機能しているか。また、そのポリシーの下で研究者の管理が行えているか。これらをきちんと検証できる形にしていくことが重要だと思っています。それらの実現のためにも、ポリシーなどの機械可読性の向上の検討も進めていきたいと考えております。
甲斐 人材育成に関しては、先ほど申し上げた通り、我々が現在開発している教材などの育成の仕組みを全国展開・水平展開していくことが目標です。実際には、研究データのエコシステムをうまく回すための人材育成は、分野や領域によっても違いがあるのですが、研究機関がまず理念浸透という第一歩を踏み出すという点では、おおよそすべきことは共通していると思います。
今後、なるべく効率的に大きな成果を上げるためには、全国の研究機関・大学が共通で導入できる人材育成環境の構築が求められると思っています。また、他チームとの関係では、現在、名古屋大学との連携も進めています。
昨今、研究者には、このデータ管理のみならず、研究倫理や情報セキュリティなど、さまざまな教育が課されています。そうした中で、本来の研究により多くの時間を確保してもらうためにも、できるだけ負担なく学習していただくというのが必須になるかと思っています。負担の少ない学習を実現するためには、たとえば今回開発を進める教材を誰もがしっかり全て見る必要はないので、職種など、それぞれの必要性に応じ個別最適化したカリキュラムを作り、必要な部分だけを学んでもらうといった工夫も重要だろうと思います。これは、研究者や研究支援者それぞれが深く関与する研究データライフサイクルの各フェーズにおいて求められるルールやガイドラインの落とし込みによって実現を目指したいと思っています。こういった点で名古屋大学と連携を図ろうとしています。
長岡 あとは、甲斐先生の仰っていた「個別最適化」の推進ですね。各チーム各機関ごとに、置かれた状況はさまざまだと思います。我々としては、できる限り統一化された手を付けやすい教材をパッケージとして提供することを考えていますが、最初に手を付ける教材としてはいいとしても、それとは別に、「各機関が、それぞれ自分たち用にカスタマイズできる」仕組みづくりも進めていきたいと考えています。
松原 「ルール・ガイドラインの整備」と「人材の育成」は、大学における研究データ管理の両輪です。ルールを作っただけで終わるのではなく、適切に浸透、運用させていく人材づくり、そしてそのための教材も不可欠です。両チームの関係性を強化し、今後も活動を推進していきます。
取材・構成:川畑 英毅/写真:杉崎 恭一