HOME/ AINOW編集部 /データは石油だ! 大企業×スタートアップのデータ活用の可能性『AI・データの利用に関する契約ガイドライン』が策定
2018.07.05

データは石油だ! 大企業×スタートアップのデータ活用の可能性『AI・データの利用に関する契約ガイドライン』が策定

最終更新日:

IT調査会社のIDC Japanによると、世界のデータ量の合計は2020年には約50ゼッタバイト(50兆ギガバイト)になると推定されています。

新たな通信規格5Gの流通とともに同時接続可能な端末数も増え、IoT機器によるさらなるデータの増大も予想されます。

データ増によるディープラーニングなどの機械学習技術の活用の広がりは、私たちの暮らす社会の発展のために不可欠なものです。今までの技術ではなし得なかった社会課題が解決されることも期待されています。

しかし、AI(機械学習)の活用にかかる法律は十分に整備されておらず、未だ不明確な部分が多いことが課題となっています。AIの開発企業とデータを提供するユーザ企業の間で共通理解の形成は進んでおらず、契約が不成立で終わってしまうことや過剰な制約によってイノベーションが妨げられてしまうおそれもあります。

経済産業省は、AI技術の開発・利用が阻害され日本の国際的競争力の低迷や、少子高齢化など社会課題の解決が困難になることを懸念し、データ利用等に関わる契約やAI技術を利用するソフトウェアの開発や利用に関する契約を締結するための参考として「AI・データの利活用に関する契約ガイドライン」を作成しました。

日本ディープラーニング協会(JDLA)は、そのオブザーバーを担い、理事の岡田陽介さん(ABEJA)が検討会の委員を務めています。

今回は、A岡田さんへのインタビューを交えながら「AI・データの利用に関する契約ガイドライン」や日本でのデータ利活用の現状について考察します。

岡田陽介さん
1988年生まれ。愛知県名古屋市出身。10歳からプログラミングをスタート。高校で、コンピュータグラフィックスを専攻し、文部科学大臣賞を受賞。大学では、3次元コンピュータグラフィックス関連の研究を複数の国際会議で発表。2011年、株式会社響取締役CTO就任。サービス開発など技術全般を担当。東京のベンチャー企業に入社し、6ヶ月で最年少事業本部マネージャー昇格。四半期で数億円の事業開発を担当。 その後、シリコンバレーに滞在し、最先端コンピュータサイエンスをリサーチ。人工知能(特に、ディープラーニング)の革命的進化を目の当たりにする。帰国後、日本で初めてディープラーニングを専門的に取り扱うベンチャー企業である株式会社ABEJAを起業。2017年に設立された日本ディープラーニング協会(JDLA)の理事の他、データやAI技術に関わる政府系委員会の委員等を務める

日本が抱えるデータの課題

おざけん

岡田さんはデータの利活用に関してどんな課題を感じていらっしゃいますか?

岡田さん

大企業は大量のデータを保有しています。反面、スタートアップはデータを持っていないので、大企業とスタートアップが相互に連携しあってデータ活用していくことが大切です。

 

その際に、2つ課題があると感じています。

1つ目のポイントは、そもそもデータに所有権が存在しないということです。

一方で、大企業は自社で保有するデータの所有権を主張される場合があります。そのため、契約時には、まず「所有権ないんですよ」っていう話からスタートするわけですよ。

2つ目のポイントは新しいアルゴリズムを作る機械学習の理解が進んでいないということです。

今までのソフトウェアのプログラムは、開発時ににデータが必用となるケースが少ないですよね。従来のソフトウェアは、プログラムを組んでデータを入れて利用するような仕組みです。。

ソフトウェアに関する理解が念頭にあるため、開発者に事前にデータを渡さなきゃいけないという趣旨を理解しづらいんです。

この2つの点がボトルネックだと考えています。

おざけん

岡田さんの会社ではガイドラインのようなものはご用意しているんですか?

岡田さん

ガイドラインはありませんが、当然契約のひな形は用意しています。

 

開発を受注する際に大企業の方と話すことがありますが、逐一説明すると本来のプロジェクトが進まないので「やるんですか?」「やらないんですか?」とプロジェクトへのコミットメントを確認することもあります。

 

なのでフラットな形のガイドラインが必要ですよね。

岡田さんのエピソードからもデータの契約に関して課題が浮き彫りになりました。

AI・データの利活用に関する契約ガイドライン」に記載されている課題も岡田さんの実体験に近いものがあります。

AIソフトウェアの権利や責任が不明確

権利関係やや責任関係が法整備されていない背景では、AI技術が急速に発展するため法整備が追いついていない事情があります。

だからこそ、AI技術を利用したソフトウェアに関する権利関係、責任関係については明文化されていない部分が多く、当事者が安心してAIの開発や利用をすることができない可能性があります。

加えて、責任の所在が不明瞭であるがために、責任の押しつけあいが発生してしまい交渉が不成立に終わってしまうケースや、実際にトラブルが起きたときの対処法が不明確なので、問題解決が困難になる場合もあります。

開発企業に提供するデータに高い経済的価値や秘密性がある

機械学習などのAIの要素技術は、高い精度を出すために、品質の高い大量のデータを必要とします。

そのため、開発に際しては発注するユーザ企業が開発企業にデータを提供することが一般的です。

このデータは発注企業が提供するモノやサービスを通じて積み上げてきた貴重なものです。オープンデータの活用についてさまざまな場面で聞くことも多いですが、そう簡単に貴重なデータを明け渡すことは難しいという企業も多いでしょう。

おざけん

この点ではオープンデータの活用も進めていくべきなのでしょうか?

岡田さん

オープンデータという言葉はよく聞きますが、ほとんどのデータは結局オープンにならないと思っています。

 

日本における「オープン」の意味合いはグローバルとは少し違ってくるのではないでしょうか。

オープンデータを、政府が保有するオープンデータという話なのか、企業間のの契約においてデータをオープン化するということなのかで、認識が違ってるんですよね。

もともとは、オープンデータというのは大企業とベンチャーが契約を締結した上で、コンフィデンシャルにデータの取引をするという意味だったはずなんですよね。


日本とグローバルで「オープンデータ」の意味合いが違ってくるのは驚きですね。グローバルではどちらかというと「誰でも使える」という認識なんでしょうか?

そうです。日本は簡単に「オープン」と言ってしまうところがあると思っています。

 

GoogleもFacebookもオープンデータと言いつつも規約をちゃんと結んでいますよね笑

日本で「オープンデータを活用すべきだ」と言う人もいますが、実際そんなに使えるオープンデータなんてないんですよ。

だからこそちゃんとした契約を結んで大企業と連携しないといけないよねという意図があると思います。

まとめ

  • 大企業とスタートアップのデータの契約をスムーズにして、データを中心としたエコシステムを構築する必要がある。
  • 権利や責任が不明確な高い価値のあるデータを契約の中でオープンに使っていけるようにすることが大事

→そのためのAI・データ利用に関する契約ガイドライン

AI・データ利用に関する契約ガイドラインとは

経済産業省は2017年5月に「データの利用権限に関する契約ガイドラインver1.0」を公表しました。あらゆる事業者同士のデータ契約を想定して作られたものです。

しかし、

機械学習を利用したの開発の実務では、利用しにくい部分がある

などの声が寄せられました。

そこで2017年12月から2018年3月の期間で「AI・データ契約ガイドライン検討会」が設けられ、JDLAをはじめ、NEDOや各省庁がオブザーバーとして、アカデミアや弁護士、企業(PFNやトヨタ自動車)が委員として選出され、、検討が進められました。

このガイドラインは、【データ編】と【AI編】の2つに分かれ、「データの利用権限に関する契約ガイドラインver1.0」をアップデートしたものがデータ編、AIの発展に鑑みて新たに作成されたものがAI編です。

AI編だけでも150ページ以上の内容がある。

パブリックコメントも終わり、ようやくアウトプットとして出せるようになりました。契約ガイドラインを作ってみていかがでしたか?

世界に先駆けた先進的な取り組みだと思います。

 

そもそも、AIがどんなものであるのかを技術的な論点も含めて定義をして、それに対してしっかりと法的な見解を結びつけたという点で、世界ではまだ例がないんですよ。

検討会の弁護士の先生に聞いたところ、海外の方々がかなり興味を持ってくださっているそうです。日本として有意義な結果を出すことができたと思っています。

特に有意義だった点はどこですか?

「ここまではやっていいよ」「ここからはやっちゃいけないよ」というところを決めたり、技術的な論点で、品質保証ができない前提なども組み込むことができた点ですかね。

品質保証ができないというリアルな部分まで攻めましたね笑

「品質保証ができない分、契約の仕方が難しいよね」という論点の中で、いわゆるウォーターフォール型の契約は難しいという話をしました。

 

フィジビリティスタディを採用して、徐々に契約を進めていく、いわゆるアジャイル開発のような契約を優先したほうがいいよねっていうところまで詰めることができました。

フィジビリティスタディ
実現可能かどうかを検討するため、事前に予備的に行われる調査・研究を指す語。「フィジビリ」や「F/S」、または「実行可能性の研究」などと言う場合もある。計画がそもそも実現可能かどうかを見極めるために行なうもので、結果次第では計画そのものを変更または却下することもある。

まとめ

  • AI編とデータ編に分かれる「AI・データ利用に関する契約ガイドライン」が策定された。
  • 技術的な論点、品質保証などリアルに踏み込んだ世界に先駆けるガイドライン

大企業とベンチャーがデータで歩み寄る必要性

オープンデータについてグローバルと日本で乖離がある旨は岡田さんがコメントしてくださいました。

今後は、大企業が保有するデータをベンチャー企業がスムーズに利用できるようにするなどデータを中心としたエコシステムを構築していく必要があります。

ここのガイドラインの内容はベンチャーサイドの速度感にかなり合わせてくれたと思います。

 

例外もあるかと思いますが、大企業はほとんど、データに関する理解が低い印象です。多くのベンチャー企業は、この点で困っています。

このガイドラインは、ベンチャーサイドからしたらやや時代遅れなものかもしれませんが、大企業からしたら先進的な取り組みだと言えると思います。

大企業がデータについての理解がないとはどういうことなんでしょうか?

契約としての意識というか、新しい契約形態になりますから、そもそもどのようにこのデータを利活用して、どのように開発先となる企業と契約を結べばいいかって、理解が低い状態ですよね。

このガイドラインによってデータ契約がスムーズになれば、ディープラーニングの活用の幅が広がりそうですよね。

そう思います。

 

最近は「ディープラーニングでできないことが多いよね」という方も多いじゃないですか。でもディープラーニングでできるようになったこともたくさんあるわけなんですよね。なので、できることをちゃんとやって、そこでデータを利活用していけばいいのではと思います。

「データ イズ ニューオイル」といわれます。

今、データの利活用によって、「従来できなかったことができるようになってきた」「社会実装すれば有用に動作する」という事例は山ほどあるのに、できないことにフォーカスするのはよく分からないなと私は思っています。

ディープラーニング協会として今回のようにデータ契約に関しても積極的に取り組まれていましたが、ディープラーニング領域では今度どのように取り組みを進めていくのでしょうか?

特に日本は産業活用や政府での議論が国際的には遅れています。

 

ディープラーニングの活用によりできるようになったことをちゃんと産業界に適用していきましょう」という点は当たり前ですが、

協会という立場としては、国際的な動向や技術的な説明を含め、政府としてこういうところにちゃんと予算を充当した方がよいですよと提言をしていく役割だと思うんですよね。

アカデミアの世界では、そもそもできないと言われていたことが、ディープラーニングを活用することによって、実現できたことが事実としてあるわけですよね。適用できる領域にディープラーニングをちゃんと適用していくべき、と主張する立ち位置かなと思いますね。松尾先生もよくおっしゃっています。

まとめ

  • スタートアップがデータの活用で困っている一面がある。大企業もデータ契約の知識を得て活用を進めていくべき。
  • ディープラーニングでできるようになったことに目を向けてデータを活用していくことが大事。

全体まとめ

「データ イズ ニューオイル」という言葉が印象的でしたが、データは石油のように産業を支えるエネルギー源になっています。

そして、このガイドラインはデータという石油をよりスムーズに取り交わせるように策定されました。AIの定義からモデルケースまで具体的に設定された実用的なガイドラインです。

オープンデータに対する日本の意識がが国際的なそれと乖離している点は新たに発見した一面でした。契約のもとに、迅速にデータ契約を結ぶことができること、それこそが真のオープンデータの利活用といえるのかもしれません。

印刷してみたらAI編だけでこんなに分厚い量に。ぜひ目を通してみてください。

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する

あなたにおすすめの記事

基調講演だけではない。OpenAI、Microsoft、Metaもビジョンを語ったGTC2024セッションまとめ

ChatGPTもGeminiも忘れて、これらの(信じられない)次世代AIツールをチェックしてみよう!

「Yahoo!知恵袋」でも活用、LINEヤフーの生成AI活用戦略

あなたにおすすめの記事

基調講演だけではない。OpenAI、Microsoft、Metaもビジョンを語ったGTC2024セッションまとめ

ChatGPTもGeminiも忘れて、これらの(信じられない)次世代AIツールをチェックしてみよう!

「Yahoo!知恵袋」でも活用、LINEヤフーの生成AI活用戦略