Dec. 2021No.93

新たな知の拠点、柏分館学術情報基盤サービスの拡充へ

Interview

mdxがめざすもの

東京大学とNII柏分館の連携相乗効果に期待

東京大学(東大)柏Ⅱキャンパスの新拠点で、東大など9大学とNIIなど2研究所が共同運営する「データ活用社会創成プラットフォーム(mdx)」が始動した。研究データの利活用に狙いを定めたmdxの特徴や可能性について、プロジェクトを率いる田浦健次朗 東大情報基盤センター長に聞いた。

田浦 健次朗

Kenjiro Taura

東京大学情報基盤センター長
東京大学大学院情報理工学系研究科 教授
国立情報学研究所 客員教授
1997年東京大学理学系研究科博士課程を修了。博士(理学)。1996年より同大学で助手、2001年より講師、2002年より准教授、2015年より教授。2018年より情報基盤センター長。国立情報学研究所客員教授を務める。専門は並列処理、高性能計算、プログラミング言語、システムソフトウエア。高性能、大規模並列処理とプログラミング、利用の容易さを両立させる研究に従事している。

山田 哲朗

聞き手Tetsuro Yamada

読売新聞論説委員
1990年、東京大学卒、読売新聞入社。2006年、マサチューセッツ工科大学(MIT)ナイト科学ジャーナリズム・フェロー。経済部、科学部、ワシントン支局特派員などを経て、2018年、科学部長。2019年から論説委員(科学技術担当)。

より学際的な、ビッグデータ研究に資するmdx

山田  柏Ⅱキャンパスに学術データの拠点ができた経緯を教えてください。

田浦  東大の五神真前総長とNIIの喜連川優所長が、データ駆動型社会に向けて、公的な新拠点をつくろうと意気投合されたことがきっかけです。東大側も、情報基盤センターを移転し、データ活用社会創成プラットフォーム(mdx)を新設すると決めました。

山田  東大情報基盤センターはすでに、8大学を結ぶ「学際大規模情報基盤共同利用・共同研究拠点(JHPCN)1」 の中核になっています。

田浦  情報基盤センターのミッションは、東大にとどまらず、全国的なミッションとしてスパコンの基盤を整備しています。スパコンは、情報学の研究に加え、情報関係の分野ではない理工系の研究者にも計算のために広く使われてきましたが、近年ではこうした情報基盤をハブとして学際的な研究に役立てたいという要望も増しています。1つの大学だけでは持てないような設備を広く全国に提供し、情報科学や情報基盤の専門家でない研究者にもスパコンを使ってもらって、共同研究に貢献をするのが目的です。
 これまで、スパコンについてはいわゆる理工学系のシミュレーションのための利用が中心でした。それを、データ科学やデータ利活用を軸とする分野に拡大し、幅広いユーザに使っても らうためのプラットフォームとして新設したのがmdxです。

山田  より学際的であり、ビッグデータを扱う研究者全般に利用が広がるイメージでしょうか。

田浦  はい。従来スパコンを使っていた研究者の中にも、計算の結果生まれたデータや実験の結果生まれたデータを蓄積し、後から解析できるよ うにデータベース化して、他の研究者に共有したいと考えている人もいます。これまでのスパコンではできなかった部分を補い、可能にするのがmdxの狙いです。

NII RDC(研究データ基盤)との連携で学術研究を支える

山田  そもそもデータが存在すること自体を知らないとか、どこにデータがあるかわからないといった、研究者もいるかと思います。

田浦  さまざまな深さのレイヤーで取り組まなければいけません。mdxという基盤を1つつくれば解決する問題でもありません。全国的なデータをカタログ化し検索できるような世界をつくっていかないといけないと思います。
 例えば投薬や医療行為のデータ、IoTのセンサーや実験から出てくるデータ、気象データのような観測データなど、それぞれの分野で集めたものをお互い効率よく共有でき、簡単に処理や計算もできるような、そういう基盤が全体として必要です。

山田  NIIとどう連携しますか?

田浦  2021年度からNIIの「研究データ基盤(NII Research Data Cloud, NII RDC)2」事業が本格運用されています。その基盤の1つ「GakuNin RDM」を活用して研究データを管理し、研究者間でデータを共有します。さらに研究者が自分の管理するデータを公開基盤である「JAIRO Cloud3」につなげば、データを簡単に公開することができます。
 mdxの役割の1つは、NII RDCを通じて共有、公開するデータをきちんと格納するストレージを提供することです。もう1つは、見つかったビッグデータを実際に処理しようという時に必要な計算機の機能を提供することです。NIIのRDCと我々のmdxは、全体として、誰に対しても優しいサービスをいかに提供できるかを問われます。情報系のスキルの高い専門家から、それ以外のWebブラウザでデータを手早く分析したい人まで、いろいろな人に使ってもらえるものを整えていきます。

各研究機関をつなぎ全国的な学術基盤へ

山田  コンピュータ技術、ネットワーク技術の観点では、どんな利点がありますか。

田浦  これまでのスパコンというのは、1つの大きな部屋を用意して、そこに「みんな一緒に入ってきて使って下さい」という仕組みで、ある程度は他のユーザから勝手にデータを見られたりしないようにはなっているものの、分離の度合いは弱く、セキュリティ上、注意が必要な個人データや医療データなどをスパコンに上げるのは躊躇されるケースが多くありました。
niitoday93_02_01.png

図 | mdx上に構築される仮想化環境と利用の仕方:仮想化された高性能環境により、利用グループごとに分離した高いセキュリティ環境を提供する。

 これに対し、mdxはユーザごとに、1つの完全に独立した仮想化環境をつくることができます(図)。セキュリティが重要な用途にも、安心度が高い分離した環境をつくることができ、その中は基本的にユーザが好きにいじってカスタマイズしていいという仕組みです。ここが今までといちばん違う点です。アカデミアのクラウドとしては、かなり先駆的な取り組みと言えるでしょう。

山田  東大とNIIの相乗効果は期待できますか。

田浦  NII柏分館と東大情報基盤センターは同じ建物にありますので、密な人的交流に期待しています。NIIは学術情報ネットワーク「SINET」で日本中の大学をつないでいます。さらに、先述のようにNII RDCを通じて、研究者が自分の研究データを共有しています。これらとmdx、さらには各大学にあるスパコンなどをつないだ全国規模の一体的な学術基盤をつくっていくにあたり、NIIと情報基盤センター群の密接な協力が不可欠だと思っています。今後の展開に期待していてください。

(写真=盛 孝大)

[1]JHPCN
「学際大規模情報基盤共同利用・共同研究拠点」:北海道大学、東北大学、東京大学(中核)、東京工業大学、名古屋大学、京都大学、大阪大学、九州大学の基盤センターが運営する共同研究のための組織。全国から共同研究を募集し、採択された課題に計算設備(これまでは主にスパコン)の利用時間を割り当てている。

[2]NII RDC
NIIが提供する、研究データのライフサイクルを支える基盤として、2021年に本格運用を開始。研究データの管理基盤(GakuNin RDM)、公開基盤(WEKO3)、検索基盤(CiNii Research)から構成されている。

[3]JAIRO Cloud
NII開発のWEKOを機関リポジトリソフトウェアに採用した、クラウド型の機関リポジトリ環境提供サービスとして2012年度に運用開始。2016年7月からはJPCOARとNIIとの共同運営に移行。

第93号の記事一覧