研究シーズ2018情報基礎科学

データを理解しやすく、意味をとりやすくするデータ解析技術

宇野 毅明情報学プリンシプル研究系 教授

研究分野ビッグデータ/データ解析/人工知能

研究背景・目的

企業活動のさまざまな場面でビッグデータが活用され始めています。これをビジネスの発展につなげるには、例えば、買い物データやアクセスログから顧客の嗜好の全体像を正しく理解する、工場のログから生産性や故障につながるきっかけを理解する、というように「ビッグデータの持つ意味を正しく捉えること」が重要になります。しかし、従来の統計や機械学習、セグメント分析や2x2による分析では、あまりにも一般的すぎる特徴しか捉えられず、一方で個別の案件は特殊すぎたり、多くの要因が入りすぎたりしているため、たとえ全体、あるいは一部のデータを可視化しても、ノイズや関係ない事象が多すぎて本質に迫ることは難しいものです。外部情報に頼らず、データがデータ自身だけで語れる意味を、自動的に導き出す解析技術が重要です。

研究内容

私たちは、「データ研磨」というデータに含まれる共通性や特徴的なパターンをあぶり出す技術を研究しています。これにより、従来のクラスタは、「例えば、こういう行動パターンの人達やこういう特徴を持つ人達がいる」という形で、具体的に説明できるようになります。病気の原因や買い物行動をライフスタイルや移動パターン、居住地などと結びつけたり、ブログや苦情などのテキストから、重要なトピックを網羅的かつ意味のとりやすい形で見つけたりすることができます。故障や失敗などの原因となる要因のパターンも見つけることができます。また、ネットワーク解析に使えば、コミュニティ構造もあぶり出すことができます(図)。開発した超高速アルゴリズムを使えば、100万件以上のデータでも10分ほどで結果を得ることができます。

uno1.jpg

データ研磨により、ネットワークのコミュニティ・クラスタ構造を浮かび上がらせる

産業応用の可能性

データを理解したい分野、例えば、マーケティング、病気と健康、工場の生産性、テキストデータの分析、移動データ、生産活動や売り上げのデータ分析など、個別の意味と全体像を理解してビジネスを進める、さらに、それらから自動的に推薦や意思決定を行う場面で使えます。こういったデータ解析では、まず自分の持つデータは何に使えるか、どうやってデータをとるか、何を目標にするか、といった課題設定が難しく、それを専門知識なしで見当をつけるのはたいへん難しいものです。まずは、データや課題をお持ちになって、何ができるか、何をするべきか、相談されることをお勧めします。お気軽にお越しください。

研究者の発明

連絡先

宇野 毅明[情報学プリンシプル研究系 教授]
uno[at]nii.ac.jp ※[at]を@に変換してください

Recommend

さらにみる