AIに必要な3つの条件とは!? データ分析コンテストで企業のデータ利活用における課題を解決! 「DeepAnalytics」

社内に蓄積された「データ」の利活用方法がわからない。

そんな課題を感じている人は多いだろう。

日本ではデータをクローズドに扱う会社が多い。これは社会的な課題であり、日本において「AI技術の発展」が他の先進国に比べて遅れている大きな理由の1つである。

データはAI開発において不可欠だ。データに関する技術革新によって社会や産業での不合理な構造や仕組みがさらに改善され、従来の産業構造を大きく変えることになることも多いと言われている。

そんな企業のデータ活用を「コンテスト」で推し進める会社がある。

データ分析コンテストによる集合知で企業のデータ利活用課題を解決

場所は東京市ヶ谷。とある企業を訪れた。株式会社オプトワークス。親会社である株式会社オプトホールディングのビッグデータ全域の技術研究開発を担うチーム「データサイエンスラボ」と協働し、データ分析オープンイノベーションプラットフォーム「DeepAnalytics」を運営する会社だ。

データサイエンス分野におけるコンペティションサイトといえば2017年3月、Googleによって買収されたアメリカの「Kaggle(https://www.kaggle.com/)」が有名だ。AIモデルによる企業や社会の課題解決を目指すデータ分析コンテストプラットフォームだ。登録するデータサイエンティストは数十万人を数え、データ分析マーケットを牽引してきた。

オプトワークスが運営するDeepAnalyticsは、Kaggleと同様、データ分析コンテストをオープンの場で実施する。データサイエンティストの集合知で企業のデータ利活用における課題を解決する「AIモデル」を調達できるのが特長だ。また、同プラットフォームを活かし、大学などの高等教育・研究機関へデータサイエンティストの育成サービス及びコンテンツなども提供し、国内のデータ分析人材育成に寄与するとともに、そこで育った学生が後のコンテスト参加者になって企業のデータ活用に貢献する、というエコシステム構築を目指している。

DeepAnalyticsの仕組み

企業・行政とデータサイエンティストをコンテストで結びつけている。

勝者には高いインセンティブが支払われ、多くのデータサイエンティストが競い合う仕組みで、成績がリアルタイムで表示されるため、常に参加者の中での自分の順位が分かり、競争心を刺激できる。

データ分析会社やデータ分析を守備範囲とするコンサルティング会社に分析業務をアウトソースして得られるアウトプットレベルをはるかに超えた結果を出せる(より高精度なAIモデルを調達できる)ことも大きな特長であり、クライアントの既存モデルの精度を超えなかったことは1度もないというから驚きだ。

サービスをスタートして約3年。売上と気象のデータから需要予測モデルを導き出し食品廃棄ロスを減らしたコンテストや、売上と商品成分データから新商品を企画するコンテストなどの成功事例があるほか、画像分類に課題を抱える会社がコンテストを開いて上位者をスカウトし人材採用に成功した事例まで、幅広い実績を積み重ねてきた。

参加者も異業種における課題の面白さや奥深さに気づいて、キャリアを変えていくきっかけにもなることもあるという。

その実態はいかに?データサイエンスラボ代表 齊藤氏に話をうかがった。

取材させていただいたのは「データサイエンスラボ」代表の齊藤秀氏だ。

齊藤 秀 氏
株式会社オプトホールディング 最高解析責任者 CAO データサイエンスラボ代表
グループ18社のビッグデータの利活用やAI戦略を担う。筑波大学で客員教授を務め、経済産業省で委員も務める。自民党で講師を務めるなど産学官で幅広く活躍するスペリャリスト

AIに必要な3つの条件

ーDeepAnalyticsをオープンした理由はなんですか?

コンテスト形式ならAI開発に必要な条件3つが満たせると考えているからです。

条件の1つ目は『才能』です。データサイエンティストやソフトウェアエンジニアなどの個々人の能力がAI開発には不可欠です。

そして2つ目は『データ』です。元となるデータがなければ、AIはそもそも開発することすら出来ません。

そして最後は『計算資源』。膨大な計算を迅速に行うことができるマシンパワーが必要です。そのマシンパワーの上で、初めてAIが活躍できるのです。

私はその3つの中で、特に1つ目の『才能』に注目しています。

2013年からシリコンバレーではスタートアップのアクイジション(acquisition)が起きていて、FacebookやGoogleなどのITジャイアント企業が新興企業をどんどん買収しています。買われているのは、ほとんどがAI関係のスタートアップで、それは2017年現在も続いています。

これは、裏ではそのスタートアップ企業に所属するデータサイエンティスト(=『採用』)をまるごと取り込みたいという意図があるわけです。日本でも同様のことがこれから起きていくと思いますが、しかし、こんなことができるのは大手有名企業だけですよね。

では、中小企業やスタートアップが才能ある人をどう集めるかと考えたときに、才能のある人が集まっているKaggleのようなプラットフォームが日本にもあれば良いのではと考えました。

コンテストを開催することで日本中、ひいては世界中のデータサイエンティストが同じ問題に取り組みます。『才能』が一つのところに集まるということが重要です。研究サイドではイメージネット等のAI開発用途の大規模データセットが多数、整備されてきています。民間でもクラウドソーシング等の活用によりデータ収集・整備が可能になってきています。また、クラウドコンピューティングの普及により、GPU等の計算資源にもアクセスしやすくなってきています。

以上のブレークスルーがあり、このコンテストというやり方がAI開発において有益だと考えたのです。」

教育にも活用。課題解決が必要なのは企業だけじゃない。

ー教育にも活用されているということでしたが、どのようなことをされているんですか?

「コンテストで使用したデータを提供企業同意の元、大学などの高等教育・研究機関で使えるようにし、教育支援サービスを提供しています。

国では『独り立ち、棟梁レベル』つまり、実際のデータ課題を自立して設定・解決できる人材の育成が大事だとされています。しかし、日本のデータサイエンス教育の現場では、実データを解く能力を育成する機会がない、ということが問題になっています。PBL(Problem-based Learning:問題解決型教育)といって実践の中で勉強していく手法を取り入れるようにと文科省や各大学が進めてますが、大学は産業界の実課題や実データを十分に保有しておらず実践教育が難しいのが実情なんです。

そこで、私たちは「DeepAnalytics」に蓄積されたデータや運営しながら培った知見をベースに、例えばプロのコンテストと同様のコンテストに授業課題の一環として挑戦できたり、プロのコンテスト上位者がどんな分析をして精度を向上させたのかを学ぶことができる教育サービスを提供していきたいと考えています。また、そのサービスを通して企業と優秀な学生をつなげ、データ分析人材マーケットの活性化も見据えています。

ちなみに、日本で初めてデータサイエンス学部を創設した滋賀大学の新入生は、すでに私たちのシステムを用いて勉強をはじめています。また、国のデータ人材育成プログラムに採用され、全国の主要な大学のデータサイエンス教育に導入がはじまってきています。」

参考1

情報・システム研究機構による「ビッグデータ利活用のための専門人材育成について」によると日本における問題の根源は棟梁レベルのデータサイエンティストの決定的な不足にあるとされている。この解決のために国家レベルの拠点を配置して、年500名規模の棟梁レベルの人材育成を目指すとしている。

また社会全体のリテラシーやアウェアネスを向上させるためにコンテストを開催するとも述べられている。

詳細はこちらを参考にしてほしい。http://www.rois.ac.jp/open/pdf/bd_houkokusho.pdf

参考2
2016年9月30日配信:
ビッグデータ】オプトホールディング、日本初データ分析コンテストサービス Deep Analyticsを滋賀大学データサイエンス学部へ提供~日本初のデータサイエンス学部と提携し、次世代の人材育成を目指す~
http://www.opt.ne.jp/holding/news/gourp/detail/id=3755

集合知によってデータの限界がわかる

ーコンテスト形式で多数のデータサイエンティストが参加するメリットはほかにありますか?

「精度の限界がわかることでしょう。1人や2人で分析していると、出てきた結果の数値が悪かった時に、その原因が担当者の能力不足なのか、データの不足なのかの区別がつきません。しかし、数百人でやると、そのデータで得られるアウトプットの限界が大方わかります

そのため、どの程度の精度まで出れば、分析をやめていい(もしくは分析に使用するデータを追加するべきな)のかの判断ができます。

また、オープンデータを使用可能にすると、参加者が意外なところからデータを持ってくることもあり、新たな発見もありますね。

それともう1つ、コンテストには様々な分野で活躍する人が参加するため、優勝する人は、その分野の専門家ではないことがあります。通常、データ分析をアウトソーシングする際には自社のデータに強い、あるいはそのデータを専門にしているデータサイエンティストに依頼するケースがほとんどです。しかしコンテスト形式では、参加者を特に制限しないので、全く異分野で分析業務を行う人や大学・研究所等の研究職の方々などがチャレンジします。そういう人の、非専門家ならではの発想によるデータ分析結果を得ることができるのも、メリットの一つだと思います。」

テーマは「電力・気象」第3回ビッグデータ分析コンテスト開催

現在、経済産業省やIoT推進ラボが共催で第3回ビッグデータ分析コンテストを開催中だ。

これはIoTを活用した先進的プロジェクトの創出や社会実装に向けた取り組みの一つ。東京電力や気象庁が提供したデータや、それを活用したデータ分析課題をもとにアルゴリズムの開発コンテストを実施している。
部門は予測部門と可視化部門に分かれ、それぞれ課題や賞金が設定されている。

具体的には参加者は、提供されるデータを基に、太陽光発電の発電量予測にチャレンジする。電力の安定供給や・効率的な利用を目的としている。また「可視化」の取り組みは新たな試みだという。

2017年10月17日時点で既に約150回、課題が提出されており、活発に競争が行われている。以下のサイトからリアルタイムの参加者の順位などがわかるようになっている。

https://deepanalytics.jp/compe/48?tab=comperank

コンテストは同様に一般企業でも開催される。自社のデータの活用に課題を感じている人はぜひ一度詳しくDeepAnalyticsのページを見ていただきたい。

https://deepanalytics.jp/

編集後記

時代の流れの中でデータの利活用に課題を感じている会社は多いだろう。しかし、なかなかその活用が進まない。

オプトワークスは最初から最後まで丁寧にコンサルティングを行い、DeepAnalyticsでのコンテスト開催にこだわらないデータ利活用へのアドバイスやソリューションも提供している。

今後、DeepAnalyticsをはじめとしたプラットフォームが成熟することで、国内のデータ利活用が進んでいき、日本のAI技術が多いに発展していくことを期待したい。

おざけん
ディレクター。可能性を秘めたAIが正しく社会に実装されるようにメディアとしてサポートします。技術だけでなく、どのようなユーザ体験を生み出せばAIが生活に溶け込んでいけるのか。シンギュラリティにむけ、産業や国を超えた活発な議論を促進していきます。趣味はカメラ撮影。

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する