最終更新日:
2019年3月6日 丸の内トラストタワーN館にて、『一般社団法人データ活用コンソーシアム』設立について記者説明会が行われました。
『一般社団法人データ活用コンソーシアム』は「日本国内」に特化した、AIデータの流通・活用促進を目的に2019年3月6日に発足しました。
目次
データ活用コンソーシアムの概要
日本におけるAI研究・開発の課題として、データの共有・流通プラットフォームがないことがありました。これにより、研究者の知見が集約されません。よって、開発の停滞だけでなくAIを用いたオープンイノベーションの障害にもなっています。
そこで、AIデータ活用コンソーシアムの目的は、AI研究、ビジネスで用いるデータの流通および研究基盤構築をオールジャパンで取り組む事にあります。
活動開始は、2019年4月よりです。
大学・研究機関・AIスタートアップが連携して今回の設立が実現しました。具体的には、京都大学や東京大学。日本マイクロソフト株式会社や理化学研究所などが提携します。
<具体的な活動内容>
- データホルダー、AI研究者、AIソリューションベンダの協働の場を提供
- AIによるオープンイノベーションを通じて社会課題の解決を促進
- 日本固有の自然言語、画像をはじめとする開かれたデータの流通の場の提供
- 円滑なデータ流通を実現するための知的財産、契約モデルの構築
- 多様なデータ流通の為のクラウド基盤の構築、およびサービス提供
- コンソーシアムが構築するデータ流通基盤を会員に提供
- データ流通基盤の社会、企業における実装およぴ活用の促進
コンソーシアム設立に至る背景や想い
この度『一般社団法人データ活用コンソーシアム』設立に至った背景や想いを、コンソーシアムの会長も務める元京都大学総長の長尾 真氏からお話いただきました。
ーー長尾氏
「中国では国がイニシアチブを取ってデータを活用しています。
アメリカは、グローバルビジネスをやっている企業が中心になっています。その中で「やってはいけない」決まりはあるが、決まりがないものはグローバル企業が、力強くデータを集めることができます。
一方で、日本は、「やってもいい」とされていることのみしか、データの活用がしにくいという制約があります。
このような背景により、AIの日本における人工知能の研究や活用は遅れています。
そこで、日本でバラバラになっているデータを有効に活用するプラットフォームを作ろう。データを自由に使えて、AIをいろんな分野で発展させる基礎づくりをしようという想いになりました。
AIを実証的に研究することを企業に任せる。社会に実装して、そこでまたデータを得られる。このような、研究・取得・社会へのアプリケーションのいい循環を生み発展させていくことが目的です。」
AIとデータを取り巻く課題
今回の設立の背景には、AIとデータを取り巻く環境に2つの課題がありました。
日本固有のデータの不足
AI研究およびビジネス活用を前提とした業種を超えた多様なデータ共有、基盤が欠如しています。日本固有のデータの不足は著しく、画像データに関しては特に海外データに依存しています。
具体的には以下のようなデータが不足しています。
- 多様性に富む日本語の自然言語データ(地域差、年代差、性差、業界差)
- 日常会話、ビジネス会話
- 日々増え続ける固有名詞、変化し続ける用法
- 日本文化固有の画像データ
- 海外で作成された画像データセットは日本固有の物を含まない(茶碗、鳥居、だるま、赤べこ、けん玉)
- 日本の地域固有データ
- 道路交通、気象、地理、電力·水道、人口動態
モダリティによるモデル構築
今日では、マルチモーダル深層学習で重要となる複数の異なるデータを組み合わせることが求められています。
例えば、「やばい」という言葉にはプラスの面とマイナスの面があります。これは、行動データと組み合わせて「やばい」の評価ができます。
このような複合モデルの構築が求められています。
また、若者とおじいちゃんおばあちゃんの話す言葉が違う言語モデルのような継続的な更新が必要なデータも求められています。
AIデータ流通・活用における課題
更に日本には、AIを活用する視点においても3つの課題が存在しています。
日本国内における課題
日本国内おける課題は3点あります。
①現在はデータホルダー毎に費用、契約などの交渉、手続きが必要です。しかし、実際には複合的かつ多様なデータが必要とされます。これがAI研究を阻害しています。
②Al活用を目的としたデータの商取引における契約モデルが欠如しています。Al活用を前提とした商取引のガイドラインが十分に整備されておらず、また事例も非常に限られています。公正な取引環境の実現が求められます。
③価値の確定までの時差が生じています。なぜなら、「物」と異なり、データの品質保証が難しいからです。
価値あるAIデータ基盤は、実装・実現が非常に困難
以下のような点において価値あるデータ基盤の実装・実現が困難になっています。
- 学習データのボリューム、偏りなどにより生成されたモデルの品質が左右される
- 陳腐化の早いデータにおいては、リアルタイム性とデータの揮発性を考慮する必要(時間と共に価値が変化するデータ)
- 生成後のモデルの価値が想定と大きく異なる場合がある(データの試用とモデルの検証)
- 段階的契約とデータ活用モデル
関係者間の連携
研究機関・AI人材・ユーザー企業などの連携が不足しています。例えば企業はデータをもっているもののAIで紐解くことができない事例は多くあります。一方で、研究機関やAIスタートアップはAIの知見・頭脳はあるもののデータがないことがあります。
このような、データを持つ企業の課題解決と研究促進の相互補完が求められています。
AIデータ活用コンソーシアムの具体策やビジョン
以上のような課題を解決するために、「日本国内」に特化したAIデータの流通・利用促進に向けて2019年3月6日に、「AIデータ活用コンソーシアム」が発足します。
コンソーシアムが取り組むテーマ
AIにおけるデータ活用における課題の検討やおよび解決のための作業部会(WG)を設置、AIの研究開発、ソリューション実現に寄与します。
具体的には①知的財産②法令③データ共有基盤の3点にアプローチしていきます。
目指す姿とチャレンジ
①データ利用・提供に係わる手続きを媒介し、手続きを簡素化します。研究者やデータホルダー、ITベンダー・企業ユーザーのハブ的な存在になります。具体的には、価格交渉や権利関係の調整を担います。
②会員間連携による課題解決を目指します。マッチアップやネットワーキングを行うことで、AI人材の協働と共創を促進します。
③ニーズに応じたAIデータの収集・提供モデルを構築します。これを2つのアプローチで実現します。一つは、契約を媒介するのみ。もう一つは、データをコンソーシアムにデータを預けて、データをコンソーシアムが管理・提供します。
④組織内データ基盤構築を実現します。こちらは、会員向けのチャレンジになります。「どこに、データがあるか分からない」という問題を解決するために、組織的なデータの流通、共有基盤を構築します。
これにより、データの可視化。猥雑な手続きの解消。多様なデータへの対応が可能になります。更に、『AIデータ活用コンソーシアム』のデータ基盤を組織内システムとして、転用支援まで行います。
パイロットプロジェクトについて
パイロットプロジェクトとして、公共オープンデータ協議会と連携しプロトタイプスタディを開始します。複雑な商流・用途に対応した手続き、メータリング、法令対応により、円滑なデータ流通を実現します。
4月からの活動開始に向けて、更なる取り組みや提携の話も進んでいるとの言及があり、続報が楽しみです。