最終更新日:
IT調査会社のIDC Japanによると、世界のデータ量の合計は2020年には約50ゼッタバイト(50兆ギガバイト)になると推定されています。
新たな通信規格5Gの流通とともに同時接続可能な端末数も増え、IoT機器増によるさらなるデータの増大も予想されます。
データ増によるディープラーニングなどの機械学習技術の活用の広がりは、私たちの暮らす社会の発展のために不可欠なものです。今までの技術ではなし得なかった社会課題が解決されることも期待されています。
しかし、AI(機械学習)の活用にかかる法律は十分に整備されておらず、未だ不明確な部分が多いことが課題となっています。AIの開発企業とデータを提供するユーザ企業の間で共通理解の形成は進んでおらず、契約が不成立で終わってしまうことや過剰な制約によってイノベーションが妨げられてしまうおそれもあります。
経済産業省は、AI技術の開発・利用が阻害され日本の国際的競争力の低迷や、少子高齢化など社会課題の解決が困難になることを懸念し、データ利用等に関わる契約やAI技術を利用するソフトウェアの開発や利用に関する契約を締結するための参考として「AI・データの利活用に関する契約ガイドライン」を作成しました。
日本ディープラーニング協会(JDLA)は、そのオブザーバーを担い、理事の岡田陽介さん(ABEJA)が検討会の委員を務めています。
今回は、A岡田さんへのインタビューを交えながら「AI・データの利用に関する契約ガイドライン」や日本でのデータ利活用の現状について考察します。
目次
日本が抱えるデータの課題
おざけん
岡田さん
その際に、2つ課題があると感じています。
1つ目のポイントは、そもそもデータに所有権が存在しないということです。
一方で、大企業は自社で保有するデータの所有権を主張される場合があります。そのため、契約時には、まず「所有権ないんですよ」っていう話からスタートするわけですよ。
2つ目のポイントは新しいアルゴリズムを作る機械学習の理解が進んでいないということです。
今までのソフトウェアのプログラムは、開発時ににデータが必用となるケースが少ないですよね。従来のソフトウェアは、プログラムを組んでデータを入れて利用するような仕組みです。。
ソフトウェアに関する理解が念頭にあるため、開発者に事前にデータを渡さなきゃいけないという趣旨を理解しづらいんです。
この2つの点がボトルネックだと考えています。
おざけん
岡田さん
開発を受注する際に大企業の方と話すことがありますが、逐一説明すると本来のプロジェクトが進まないので「やるんですか?」「やらないんですか?」とプロジェクトへのコミットメントを確認することもあります。
なのでフラットな形のガイドラインが必要ですよね。
岡田さんのエピソードからもデータの契約に関して課題が浮き彫りになりました。
「AI・データの利活用に関する契約ガイドライン」に記載されている課題も岡田さんの実体験に近いものがあります。
AIソフトウェアの権利や責任が不明確
権利関係やや責任関係が法整備されていない背景では、AI技術が急速に発展するため法整備が追いついていない事情があります。
だからこそ、AI技術を利用したソフトウェアに関する権利関係、責任関係については明文化されていない部分が多く、当事者が安心してAIの開発や利用をすることができない可能性があります。
加えて、責任の所在が不明瞭であるがために、責任の押しつけあいが発生してしまい交渉が不成立に終わってしまうケースや、実際にトラブルが起きたときの対処法が不明確なので、問題解決が困難になる場合もあります。
開発企業に提供するデータに高い経済的価値や秘密性がある
機械学習などのAIの要素技術は、高い精度を出すために、品質の高い大量のデータを必要とします。
そのため、開発に際しては発注するユーザ企業が開発企業にデータを提供することが一般的です。
このデータは発注企業が提供するモノやサービスを通じて積み上げてきた貴重なものです。オープンデータの活用についてさまざまな場面で聞くことも多いですが、そう簡単に貴重なデータを明け渡すことは難しいという企業も多いでしょう。
おざけん
岡田さん
日本における「オープン」の意味合いはグローバルとは少し違ってくるのではないでしょうか。
オープンデータを、政府が保有するオープンデータという話なのか、企業間のの契約においてデータをオープン化するということなのかで、認識が違ってるんですよね。
もともとは、オープンデータというのは大企業とベンチャーが契約を締結した上で、コンフィデンシャルにデータの取引をするという意味だったはずなんですよね。
GoogleもFacebookもオープンデータと言いつつも規約をちゃんと結んでいますよね笑
日本で「オープンデータを活用すべきだ」と言う人もいますが、実際そんなに使えるオープンデータなんてないんですよ。
だからこそちゃんとした契約を結んで大企業と連携しないといけないよねという意図があると思います。
まとめ
- 大企業とスタートアップのデータの契約をスムーズにして、データを中心としたエコシステムを構築する必要がある。
- 権利や責任が不明確な高い価値のあるデータを契約の中でオープンに使っていけるようにすることが大事
→そのためのAI・データ利用に関する契約ガイドライン
AI・データ利用に関する契約ガイドラインとは
経済産業省は2017年5月に「データの利用権限に関する契約ガイドラインver1.0」を公表しました。あらゆる事業者同士のデータ契約を想定して作られたものです。
しかし、
などの声が寄せられました。
そこで2017年12月から2018年3月の期間で「AI・データ契約ガイドライン検討会」が設けられ、JDLAをはじめ、NEDOや各省庁がオブザーバーとして、アカデミアや弁護士、企業(PFNやトヨタ自動車)が委員として選出され、、検討が進められました。
このガイドラインは、【データ編】と【AI編】の2つに分かれ、「データの利用権限に関する契約ガイドラインver1.0」をアップデートしたものがデータ編、AIの発展に鑑みて新たに作成されたものがAI編です。
そもそも、AIがどんなものであるのかを技術的な論点も含めて定義をして、それに対してしっかりと法的な見解を結びつけたという点で、世界ではまだ例がないんですよ。
検討会の弁護士の先生に聞いたところ、海外の方々がかなり興味を持ってくださっているそうです。日本として有意義な結果を出すことができたと思っています。
フィジビリティスタディを採用して、徐々に契約を進めていく、いわゆるアジャイル開発のような契約を優先したほうがいいよねっていうところまで詰めることができました。
実現可能かどうかを検討するため、事前に予備的に行われる調査・研究を指す語。「フィジビリ」や「F/S」、または「実行可能性の研究」などと言う場合もある。計画がそもそも実現可能かどうかを見極めるために行なうもので、結果次第では計画そのものを変更または却下することもある。
まとめ
- AI編とデータ編に分かれる「AI・データ利用に関する契約ガイドライン」が策定された。
- 技術的な論点、品質保証などリアルに踏み込んだ世界に先駆けるガイドライン
大企業とベンチャーがデータで歩み寄る必要性
オープンデータについてグローバルと日本で乖離がある旨は岡田さんがコメントしてくださいました。
今後は、大企業が保有するデータをベンチャー企業がスムーズに利用できるようにするなどデータを中心としたエコシステムを構築していく必要があります。
例外もあるかと思いますが、大企業はほとんど、データに関する理解が低い印象です。多くのベンチャー企業は、この点で困っています。
このガイドラインは、ベンチャーサイドからしたらやや時代遅れなものかもしれませんが、大企業からしたら先進的な取り組みだと言えると思います。
最近は「ディープラーニングでできないことが多いよね」という方も多いじゃないですか。でもディープラーニングでできるようになったこともたくさんあるわけなんですよね。なので、できることをちゃんとやって、そこでデータを利活用していけばいいのではと思います。
「データ イズ ニューオイル」といわれます。
今、データの利活用によって、「従来できなかったことができるようになってきた」「社会実装すれば有用に動作する」という事例は山ほどあるのに、できないことにフォーカスするのはよく分からないなと私は思っています。
「ディープラーニングの活用によりできるようになったことをちゃんと産業界に適用していきましょう」という点は当たり前ですが、
協会という立場としては、国際的な動向や技術的な説明を含め、政府としてこういうところにちゃんと予算を充当した方がよいですよと提言をしていく役割だと思うんですよね。
アカデミアの世界では、そもそもできないと言われていたことが、ディープラーニングを活用することによって、実現できたことが事実としてあるわけですよね。適用できる領域にディープラーニングをちゃんと適用していくべき、と主張する立ち位置かなと思いますね。松尾先生もよくおっしゃっています。
まとめ
- スタートアップがデータの活用で困っている一面がある。大企業もデータ契約の知識を得て活用を進めていくべき。
- ディープラーニングでできるようになったことに目を向けてデータを活用していくことが大事。
全体まとめ
「データ イズ ニューオイル」という言葉が印象的でしたが、データは石油のように産業を支えるエネルギー源になっています。
そして、このガイドラインはデータという石油をよりスムーズに取り交わせるように策定されました。AIの定義からモデルケースまで具体的に設定された実用的なガイドラインです。
オープンデータに対する日本の意識がが国際的なそれと乖離している点は新たに発見した一面でした。契約のもとに、迅速にデータ契約を結ぶことができること、それこそが真のオープンデータの利活用といえるのかもしれません。
■AI専門メディア AINOW編集長 ■カメラマン ■Twitterでも発信しています。@ozaken_AI ■AINOWのTwitterもぜひ! @ainow_AI ┃
AIが人間と共存していく社会を作りたい。活用の視点でAIの情報を発信します。