Mar. 2021No.91

NII Research Data Cloud 本格始動へオープンサイエンスを支える研究データ基盤

Article

日本の学術機関のデータ公開を支える「WEKO3」

JAIRO Cloudの基盤ソフトウエアWEKO3が始動

実は、日本は米国に次ぐ「機関リポジトリ先進国」であり、機関リポジトリをもつ大学や学術機関は 876(2021 年 1 月時点)に上る。その約 7 割が利用しているのが、NIIとオープンアクセスリポジトリ推進協会(JPCOAR)で共同運営する機関リポジトリサービス「JAIRO Cloud」だ。現在、JAIRO Cloud は、その基盤ソフトウエアである「WEKO」とともに次期バージョンへの移行・開発が進められている。

林正治

Hayashi Masaharu

国立情報学研究所
オープンサイエンス基盤研究センター
特任助教

林豊

Hayashi Yutaka

国立情報学研究所
学術基盤推進部 学術コンテンツ課
研究データ基盤整備チーム 係長

JAIRO Cloudを研究データリポジトリとして刷新

 機関リポジトリとは、デジタル化された論文や学術資料、研究成果などを大学や学術機関が保存・管理・公開するための一連のサービスの総称である。日本の機関リポジトリ導入数は世界でもトップレベルだが、自前でシステムを構築・運用できる学術機関は決して多くない。NIIはそうした機関を支援するため、2012年度から機関リポジトリ機能を提供するマネージドサービス「JAIRO Cloud」を提供してきた。初年度の利用機関は73だったが、いまや638機関がこれを利用している(2021年1月現在)。なお、サービスの運用は、大学などが会員として参加する「オープンアクセスリポジトリ推進協会(JPCOAR)」と共同で行っている。
 サービスの運用を担当する林豊係長は、「JAIRO Cloudはサービス開始から、多くの利用機関や図書館コミュニティの意見や要望を取り入れながら機能の拡張をしてきました。いわばコミュニティとともに成長してきたクラウドサービスです」と語る。
 大学や学術機関といったエンドユーザーのニーズに継続的に応えていくことに加え、JAIRO Cloudにはもう1つ、学術界から期待される役割がある。ここ数年、文献資料だけでなく、研究データへのオープンアクセスが世界的に求められるようになってきたのだ。こうしたトレンドを受けて、NIIは、JAIRO Cloudの基盤ソフトウエア「WEKO2」の機能性を強化し、クラウドサービスとしての可用性や信頼性、保守性を担保しながら、文献リポジトリと研究データリポジトリとしての機能要求に応えていくことを決断。先端的なアーキテクチャを数多く採用した「WEKO3」を基盤とする新たな機関リポジトリサービスとして、JAIRO Cloudを刷新することにした。
 WEKO3の開発に携わる林正治特任助教は、「WEKO2は利用者の声に寄り添った、きめ細やかな文献リポジトリサービスとして進化してきました。その良さは継承しながら、WEKO3では研究データリポジトリとしての役割をも担う新たな学術情報の流通基盤として構築し運用していきます」と意気込みを語る。
 WEKO3はWEKO2をほぼ全面的に書き換え、インフラ構成もこれまでとは大きく異なる。パブリッククラウド上にKubernetesクラスタを構築し、マスターデータベースにはPostgreSQL、メッセージブローカーにRabbitMQ、全文検索にElasticsearchなどを採用、パフォーマンスや負荷分散、運用の自動化などに配慮したモダンなアーキテクチャとなっている。これは欧州原子核研究機構(CERN)が開発したリポジトリソフトウエア「Invenio 3」を下敷きにしており、林特任助教はその理由を、「細やかな機能の実現に最適で、かつ学術世界の潮流にも沿ったモダンなフレームワークだから」と説明する。
 これにより、高い自由度でメタデータを扱えるようになり、一般の閲覧者、登録ユーザ、リポジトリ管理者の誰が利用しても閲覧や検索、カスタマイズなどがしやすいサービスが誕生することになった。

開発と運用の両輪で継続的な発展をめざす

 WEKO3をベースにした次期JAIRO Cloudへの移行は600以上の利用機関に影響するため、2021年3月から段階的に実施している。移行ドキュメントの作成、連携サービスとの調整、データ変換と利用機関による確認、サービスの切り替えなど、やるべき作業は山積している。重要なのは、開発と運用のチームが同じ方向を向きながら、ユーザーサポートを担うJPCOARの関係者も含めて、密に連携していくことにある。
 「開発と運用は完全に切り分けられません。お互いに丁寧なコミュニケーションを心がけ、双方の視点から細かな改善を継続的に取り入れていくことが重要です」と林係長は言う。両者が見ているゴールは「研究成果の活用が進む学術社会をつくること」であり、WEKO3/JAIRO Cloudは、間違いなくその礎となるだろう。
 「アジャイル開発にも取り組んでいるが、試行錯誤の段階でうまくいかないことも多い。それでも挑戦をやめることなく、迅速な研究開発と安定したサービス運用の両立をめざしていきたい」と林特任助教。日本の機関リポジトリサービスを支えるための試行錯誤は続く。

(取材・文=五味明子 写真=佐藤祐介)

関連リンク
第91号の記事一覧