Dec. 2021No.93

新たな知の拠点、柏分館学術情報基盤サービスの拡充へ

Interview

地球観測データプラットフォーム「DIAS」

社会課題の解決に資する研究を柏分館から

柏分館の重要な目的の1つに、東京大学(東大)との連携研究の強化がある。そのなかで、昨今の気候変動に対する注目度の高まりから、急速にその重要性が認知されつつある国家プロジェクト「DIAS(Data Integration & Analysis System)」について紹介する。システム面からリードする東大地球観測データ統融合連携研究機構 生駒栄司特任准教授と、オープンサイエンスの観点から研究の高度化を図る国立情報学研究所(NII)の北本朝展教授に話を聞いた。

生駒 栄司氏

IKOMA, Eiji

東京大学
地球観測データ統融合連携研究機構 特任准教授

北本 朝展

KITAMOTO, Asanobu

国立情報学研究所
コンテンツ科学研究系 教授
総合研究大学院大学 複合科学研究科 教授

地球環境研究の基盤である「DIAS」

 地球温暖化に、科学はどう解決への緒いとぐちを示すのか。DIASはこれらの課題に取り組む研究者たちを支援するための、ビッグデータプラットフォームだ。DIASには約50ペタバイト(ペタ=1015)もの地球環境データの格納が可能だ。さらにそれらのデータを統合・管理するミドルウェアや、各種データを利用するための共通APIやアプリケーション開発基盤、研究者が直接利用するサービスまでもが連携。予測分析やシミュレーションに使いやすい形でデータを統合的に管理し、研究活動を支えてきたところにDIASの特徴がある。
 第1期プロジェクトがスタートしたのは2006年1。現在の第4期「地球環境データ統合・解析プラットフォーム事業」(2021〜)は、海洋研究開発機構(JAMSTEC)を中心に、東大やNIIも分担機関として参画するかたちで進められている。もっともDIASは2006年に突然始まったものではない。原点は、約40年前に東京大学生産技術研究所(東大生研)が手がけた地球観測衛星データのアーカイブに遡る。手づくりの衛星データ受信アンテナ、自前の記憶装置(テープアーカイブ)など、データの収集から格納まですべてを自分たちで地道に行ってきた活動の蓄積が、現在のDIASへつながっている。
 「東大生研では40年前から、『データによる公共的な価値の創出』をめざし、地球観測のための各種の衛星データなどを受信し、収集したデータを格納するシステムを自前で構築、研究に使えるデータとして統合的に管理してきました。現在も、やっていることは基本的に変わりません」と、生駒特任准教授はこれまでの活動を振り返る。

膨大なデータを扱うのに最適な柏分館

 DIASのシステムは現在、東京・駒場にある東大生研と東大柏IIキャンパス、北海道大学、北見工業大学の4カ所に分散しており、柏IIキャンパスには東大とNII柏分館の2施設が含まれている。拠点間の通信には、NIIの学術情報ネットワーク「SINET」が使われており、気象衛星ひまわりやXRAIN(国土交通省が運用するリアルタイム雨量観測システム)などの外部データもSINET経由でDIASに格納されるしくみだ。
 「DIASにはシミュレーションデータ以外に、ひまわりなどの観測データも毎日、リアルタイムでテラバイト単位(テラ=1012)で流れてきます。安定運用には、大容量データの高速伝送が可能なSINETのパワーが欠かせません。また、大規模なデータシステムを大学だけで運用するのは難しい。SINETに直結した柏IIキャンパスの利用はDIASにとって必須でした」と、生駒特任准教授は柏分館との連携の意義を話す。
 プロジェクトの初期段階からDIASの活動に関わる北本教授も、「柏分館には大規模な設備を置くスペースがあり、電力設備も充実している。大規模システムを支えるのに十分な可用性を備えています」と強調する。
 なお、DIASの登録ユーザ数は2021年8月時点で9,416名。2015年度の約5倍増となった。データ量だけでなくユーザ数、アクセス数ともに激増するDIASのバックボーンを、柏分館の先進的な設備が支えているのだ。

オープンサイエンスや人材など、今後の課題

 柏分館ができたことで、ハード面のサポートが拡充されたDIAS。今後はオープンサイエンスに、いっそう注力していくという。北本教授は、「地球環境データはプライバシーなどに関する問題が比較的少なく、環境や防災など公共性が高いものが多いため、研究者間でのデータ共有の意識が比較的高く、オープン化しやすい。ただこれまではデータのライセンスが必ずしも明確ではなく、オープン化の妨げになる場合もありました。現在はクリエイティブ・コモンズ(CC)2ライセンスをデータセットに付けるなど、改良を重ねています」と語る。
 北本教授は、近年、研究者の間で「オープンデータ指向」が急速に強まっていると指摘する。DIASでもこのトレンドに呼応するかたちで、データセットに一意な識別子「DOI: DigitalObject Identifier」を付与する活動を2017年に始めた。オープンデータが抱える課題に、「データを使う人(論文の執筆者など)に対し、データをつくる人の貢献が見えにくい」という問題があるが、DOIの付与により、データの利用実績やデータが研究に与える功績を可視化しやすくなる。
 一方、生駒特任准教授は今後のDIASの活動は、気候変動問題への対策が中心になると語る。なかでも自治体からの要望がとくに強いのが、台風や集中豪雨による河川の氾濫の予測だ。たとえば熊本県球磨川周辺では全国の約2,700カ所に取り付けられた国交省のライブカメラから収集した画像をDIAS上で解析し、河川氾濫の危険度をリアルタイムに判定するプロジェクトが始まっている。観測中のライブカメラの画像を危険度の高い地点の順に並べたり、急速に危険度が高まっている地域をピックアップして、画像をリアルタイムで確認したりすることも可能だ(図)。
niitoday93_04_01.png

図 深層学習を用いた氾濫画像の自動認識(球磨川水系)。ライブカメラの映像をリアルタイムに深層学習で解析し、氾濫状況を色分けして示す

 今後は、DIAS上の水位等の観測データや気象予報データなどを重ね合わせることで、直近の河川氾濫予測や、自治体のシステムと連携した避難場所の状況確認など、さらなる拡張が期待される。そのほか、浸水予測、災害情報のポータル化、気候データと観光地のサービスとの連携など、さまざまな分野での適用を計画中だ。
 一方、課題は人材不足だ。システム構築からその上で動くアプリケーションやサービスの管理、ユーザである研究者のサポートまで、プロジェクト担当者には幅広い役割が要求されるため、人材獲得が難しいことは否めない。しかし、気候変動やサステナビリティに対する若い世代の関心は数年前に比べて明らかに高くなっている。
「DIASへの参加が、キャリアパスへとつながっていくような道筋を示すことが必要でしょう」と生駒特任准教授。柏分館との協業はDIASを魅力的なデータプラットフォームに成長させるための重要なステップになるだろう。

(取材・文=五味明子)

[1]文部科学省研究委託事業「データ統合・解析システム」として開始(2006~2010年)。第2期「地球環境情報統融合プログラム」(2011〜2015)、第3期「地球環境情報プラットフォーム構築推進プログラム」(2016〜2020)と継続。

[2]作者の意思を反映しながら著作物の流通(再利用)を図るための国際的なルール。

関連リンク
第93号の記事一覧