日本が目指すべきAIの社会実装の方向性とは？『AIアクションプラン・シンポジウム』レポート

2021年6月15日（火）、『NEDO 人工知能（AI）技術分野における大局的な研究開発のアクションプラン・シンポジウムー日本が目指すべきAIの社会実装の方向性－』がオンラインにて開催されました。

2021年現在、AIの社会実装はどこまで進んだのか。今後、深層強化学習で日本はイニシアチブをとれるか。これらについて、AIの有識者の方々はどのように捉えているのでしょうか？

この記事では、速報としてシンポジウムの様子をお伝えします。

※記事化のために一部を編集しています。

シンポジウムの概要
「人工知能（AI）技術分野における大局的な研究開発のアクションプラン」について
AIがAIと呼ばれなくなる？
AIの社会実装はどこまで進んだか
深層強化学習で日本はイニシアチブをとれるか
- 各国のAIに関する特徴と差別化戦略について
- タスクの意味と価値を理解できるAIは構築可能か？

シンポジウムの概要

今回のシンポジウムでは、「人工知能（AI）技術分野における大局的な研究開発のアクションプラン策定及び事業抽出のための調査」の成果を紹介するとともに、アクションプラン策定委員会の有識者委員と、日本が目指すべきAIの社会実装の方向性について議論されました。

登壇者

アクションプラン策定委員会　委員長
・中島秀之氏（札幌市立大学学長）

アクションプラン策定委員会　委員（以下五十音順）
・※稲見昌彦氏（東京大学先端科学技術研究センター教授）
・牛久祥孝氏（株式会社Ridge-i 取締役 Chief Research Officer／オムロンサイニックエックス株式会社 Principal Investigator）
・川上登福氏（株式会社経営共創基盤共同経営者マネージングディレクター）
・丸山宏氏（花王株式会社エグゼクティブフェロー／東京大学人工物工学研究センター特任教授／株式会社Preferred Networks PFNフェロー）
・村川正宏氏（産業技術総合研究所情報・人間工学領域人工知能研究センター副研究センター長（兼務）人工知能研究戦略部　研究企画室長）

※稲見委員は録画出演
※松尾委員は欠席

講演スケジュール

09:30：シンポジウム開始

09:35：主催者挨拶

09:40︰AIアクションプランの成果紹介

09:45：第１部トークセッション「AIの社会実装はどこまで進んだか」

11:00：第2部トークセッション「深層強化学習で日本はイニシアチブをとれるか」

12:00：終了

「人工知能（AI）技術分野における大局的な研究開発のアクションプラン」について

現在、世界各国で AI の技術開発が活発に行われています。そこでNEDOは、日本がAI分野で世界でリードしていくために新たな技術戦略の策定とプロジェクトの早期開始に向けてのアクションとして、『人工知能（AI）技術分野における大局的な研究開発のアクションプラン（AIアクションプラン）』を策定・公表しました。

NEDOは、2016年に「次世代人工知能社会実装ビジョン」を実装しました。同アクションプランは、このビジョンを参考にして、6名のAIの有識者の方々で構成したアクションプラン策定委員会で議論を行い策定しました。

委員会は、今年の1月から約半年間に渡って、全6回の会合をオンラインで開催し、今後10年の期間を見据えて将来期待される社会実装ビジョンとそれに向けた取り組み、さらにAI技術との関わりを整備し議論を行いました。

その結果、まず今後10年間AIを積極的に活用する分野として下記のオレンジの縦軸になる、「ものづくり（生産）」「生活・都市」「モビリティ」「教育」「健康（ウェルビーイング）」の5分野に絞り込みました。

また、横軸の灰色の部分は、これまでのAI技術で、青色の部分が今後10年のAI技術の開発の方向性を示しています。

AIアクションプランでは、AIを使うだけではなく、人とAIの共進化に向けて、12の取り組むべきAI技術の課題（水色の部分）を選定しました。

NEDOはこれら12の取り組むべき AI 技術開発を元にアクションプランとして戦略策定プロジェクト事業化に向けた検討を今後行っていく予定です。

出典︰https://www.nedo.go.jp/content/100933420.pdf

▼具体的なアクションプランの概要についてはこちら
https://www.nedo.go.jp/content/100933420.pdf

▼AIアクションプランが検討された委員会のレポート記事はこちら

AI専門ニュースメディア AINOW

【第2回】AIアクションプラン策定委員会レポート｜日本におけるAIの技術課題・社...

https://ainow.ai/2021/05/25/255204/

AIアクションプラン策定委員会とは？現在、人工知能（AI）の技術開発は、米中を中心として世界的に積極的な研究開発投資が行われ、各国は最先端の技術力を得るべく進化を続けています。日本もこうした時代の潮流に対応できるAI技術開発の体制構築が必要です。また、...

AI専門ニュースメディア AINOW

【第3回】AIアクションプラン策定委員会レポート｜教育・スマートシティー・ものづ...

https://ainow.ai/2021/06/07/255811/

AI専門ニュースメディア AINOW

【第4回】AIアクションプラン策定委員会レポート｜AIと人間のインターフェースが抱...

https://ainow.ai/2021/06/09/255818/

AIがAIと呼ばれなくなる？

中島委員長

AIって「昔からできたらAIじゃない」と言われ続けていたんですね。システムの一部に組み込まれると誰もそれを AI だと認識せずにみんな普通に使うようになるというような状態だと思うのですが、なんとなく今後は違うような気がしています。

それは、かなりAIが知的な領域に踏み込んできている、ということです。典型的な例でいうと、囲碁や将棋のプログラムは完全に人間を置いていくレベルになりましたが、未だにAIと呼ばれています。そういう意味で少し今後は違ってくるかなと思っているのですが、その辺りの議論から始めましょうか。

丸山委員

チェスをやるプログラムがありますが、それはあまりAIと言わないような気がします。アルファ碁みたいなものが普通のゲーム機の中に入って来れば、それはもはやAIじゃなくなるような気がします。

中島委員長

確かにチェスはAIとは言わないようですが、NHKの将棋番組を見ているとAIによる勝率の評価もされています。面白いのが、人間より機械が遥かに強くなってしまったら棋士は困るのかなと思っていたら全然そんな雰囲気はなくて、プログラムを道具にして学んで強くなっています。自動車が人間より速く走っても何も思わないのと似たようなことなんですかね。

牛久委員

AIと将棋はもともと親和性が高く、人間がひとつ賢いと思っている営みというのが「将棋を指す」ということなのかなと思います。そういう意味で、中島先生の「AIって呼ばれなくなるんじゃないか」という仮説は興味深いなと思っています。

今までのものは、だいたいAIと呼ばれなくなるということで、AI効果というものも知られていて、例えば、今はDeepLで翻訳してると思うんですが、最初はAIで翻訳できるようなったと言いながら、だんだん「翻訳エンジン」としか呼ばなくなるんですね。すごく賢いことをAIが自動でやっているから、AIと言われ続けるものがあるのかどうかというのは、面白い視点だなという風に思いました。

一方で、やはりAIと将棋はすごく仲がいいので、そういう意味でで昔からAIと読んでた。それをずっとAIと呼び続ける可能性というのは、将棋ならではのユニークな事象としてありそうな気もしています。

川上委員

人間っぽい領域が大きいところは、AIの他に良い言葉はないと思うんですよね。例えば、自動運転は「自動運転システム」と呼ぶか、「自動運転AI」と呼ぶか、といったことになると思います。

一方で例えば、同じくAIを使いながらサスペンションをコントロールします、というようになると、わざわざ「サスペンションコントロールAI」とは呼ばなくなるような気がしています。

人間っぽい領域という言葉は物議を醸しそうですが、比較的人間っぽい領域になってくれば、AIの他にあまり落ち着きどころのある言葉がないので、AIという言葉で落ち着くんじゃないかなというような感じがしました。

AIの社会実装はどこまで進んだか

中島委員長

私たちが議論して作成したAIアクションプランの中では「意味理解のAI」を強調してるんですよね。

今までのシステムというのは、自動化されて組み込まれて自動的に動くようになっていました。しかし、これからは組み込まれない、要するに見えた形で人間とインタラクションしながら動いていくという部分ができてくるんじゃないかなっていうふうに思っています。

今、深層学習がある意味、歴史的に初めて「AIという形で実用化されるようになった」と思っているんですけど、学習と言うからには、与えられた例から規則を抽出してもらうということになります。

それが右側の意味理解ということになると、そこから一歩踏み出して「人間と言葉で会話する」ということも含まれてくるような気がするんですね。ですから、いわゆる日本語なり英語なりで対話する相手として見ると、やはり埋もれずに見えてくる、少なくともインターフェイスとして見えてくるんじゃないかなという風に思っているところです。

中島委員長

また、今までは深層学習というシステム、もしくはコンピューターシミュレーションという形で動いていました。それから今、ビッグデータの時代ということで、それらを踏まえて画像・音声の認識精度の向上というが凄まじく成長しています。

それを、今後10年間では右側に移していきたいというのが我々の議論です。意味を理解するということ、それから単なるシミュレーションでなくて演繹と帰納の融合（深層学習と記号推論の融合と似たような形）、つまり例から学ぶということと、規則を適応するということの2つを組み合わせていくということですね。

その下は、社会全体として最適化するということです。全体最適化って、かなり難しくてどういう仕様で最適化するかというのがあまり綺麗に見えないわけですね。なので最適化って何？というところから議論していく必要があります。

その下のビッグデータは、深層学習で1000とか1万とか100万とかの例を与えることで学ぶんですけども、ATRの川人さんがよく言うのは「人間の子供は猫3匹見せたらもう学ぶ」という形なので、そういう「スモールデータからの学び」っていうことをできるようにしていかなければならない、ということですね。

それから、その下は色んなモダリティを統合した形でやっていくということです。今は「画像から言葉、言葉から画像に」みたいなことはありますが、それ以上にもっとタイトにくっついた形で色んなことができるようになると良いかなっていうのことを考えていました。

それに付随する社会的適応分野は、上にありますように「ものづくり」「生活・都市」「モビリティ」「教育」「健康」ということなんですけども、個人的には『教育とAIの絡み』が今後すごく大事になると思っています。

2019年に発表された日本のAI戦略では、「毎年25万人のAI人材を出す」という目標があったんですけど、今のところ全然達成できそうにありません。

少なくとも教える人がいないと思っているので、教育用のAIプログラムを作らないといけないんじゃないかとも考えています。

丸山委員

私は演劇と帰納の融合というところに特に重要性を感じていて、具体的にはシュミレーションと機械学習をどういう風に組み合わせるかだと思っています。最近Preferred Networksが、原子レベルのシミュレーションを機械学習で何桁も高速化するという発表しましたけれども、演繹と帰納というのはうまく組み合わせると今までできないことができるようになるのだろうなと思います。

今までは、深層学習が非常に進歩していたのでデータ万能主義みたいなところがあったんですが、案外そうでもないということですね。私達が持っている物理学とか化学とかそういう知識を使って、かつデータも使うというそんな新しい領域が増えてくるように思います。また、社会実装の面ではそれによる素材とか素材探索とかそういうところに非常に大きなインパクトを与えるのではないかと思っています。

牛久委員

今この4月から無機の材料をやっている先生方とご一緒させていただいていていて、まさに材料を開発するところで、こういったシュミレーションの結果だったりとかシミュレーション自体を機械学習やAIと統合していて、新しい材料を開発する速度を1000倍にしようというプロジェクトを始めているんですね。その中で、やはり演繹と帰納の融合は、まさに今後の一つの軸になると思っています。

もう一つ、言語と画像をつなげるみたいなマルチモダリティの部分っていうのが実は私自身ずっとやってる研究テーマでもあるんですけれども、そういう所って今のそのシミュレーションとか材料の話と結構親和性があってですね。

というのも、やはり材料ひとつとってもそこから計測されるデータとか材料を表すデータのその表現（文字列としての表現）は色々な示し方があるし、それを計測したデータでも多種多様なものがあるんですね。

これはまさにマルチモーダルであるし、「言語化されているものとそうでないものを結びつけながらこの物質作ってみたらこういう風な性能になるかな」みたいなことを予測できるようにしないといけないかなと思っています。

川上委員

私の方はビジネスで実装することをやってるのですが、スモールデータと演繹と帰納、シミュレーターの話は関連するのかなと考えています。

一つシュミレーターを使わないとなんともならない領域の方に、そんなに何回もテストできないという問題はあるわけですね。一回のテストに時間やコストがかかるときは、シュミレーターになるわけです。とはいえ、全部シミュレーターに落としたら、シミュレーターを作ることで日が暮れちゃうなっていう感じです。

そういう意味で言うと一部は人間の知見を入れながら、一部はそうではない部分でのシミュレーターで使っていけばスピードが速くなると思います。それが現実社会で合わないときに、その部分をデータで埋めていく形が必要なのかなと思っています。

それがスモールデータでできるのであれば、もっと簡単になるのかと思ったりしますが、現実的には多くのデータをとってそれをデジタル空間に乗せるときに人間の知見と過去の事例を入れた方が上手くいくと思います。

今後いろんなものがデジタルツインになるというふうに言われていますが、そういう意味で演繹と帰納という形でシミュレーターっていうのが、やりやすくなるんじゃないかなと思います。

村川委員

全体を見た時に最初に丸山さんが定義されたようにビッグデータ変調という部分をどう解決して行くのかということに対して、図を見るとやはり演繹と帰納の融合というところとスモールデータ駆動この2つがそれに大きく対応してるんだと思います。

特にスモールデータ駆動に関しては、少ないデータでできるに越したことはないのですが、その裏にはメタ認知とかが関係してきます。そうなると、スモールデータでどう取り組めばいいのかというところと、「意味理解のAI」というのが大きく関係してくると思います。

意味理解のAIが出来上がってくると、次は「人とAIの関係性」がより多様化してくるのかなと思っています。今まで出てきてない観点としては、転移学習技術を確立するかっていうのは現実的な意味で、やっていかなければならないと思います。

例えば自然言語処理のGTP-3などはコストが高いので、それを何度も学習させるわけにはいきません。一旦、そういうものを学習した上でプラス少ないデータでどうやって行けばいいのか、その辺りの技術はやはり確立していくべきなんじゃないかと思います。

それと、人間は何か抽象化してそこで過去の経験を新しいドメインにうまく適応できているわけで、そこの仕掛けをうまくAIが実現できるようになると先ほど中島先生がおっしゃったように、「組み込まれないようなAI」として存在するようなものなのかなと思っています。

中島委員長

今の人間の経験という部分それが曲者でして、人間って体を持っているし、生活をしているし、食べるしということで、言葉にしないでも共通にしていることがあるんですよね。

ところが、プログラムと対話しようあるいはプログラムに何か欲しいようとすると、そこを全て明確にしなければならないと言うか、それは昔からフレーム問題という形で知られています。

今後フレーム問題をどうしていくかっていうのは、未だに解決できていません。今あったメタ推論とかいうところにも絡んでくるんですが、生活してないAIにどうしているんだっていうのがなかなか難しいところだと思います。

丸山委員

中島委員長がおっしゃった「生活しないと理解できないものをどのように教えるか」ということなんですが、それは仕様に書けないっていうことなんです。つまり、人の心のような人工知能というのは設計するものではなく「育てるもの」だと考えたほうが良いのではないでしょうか。

育てるということと、設計することという概念は、あまり結びつきません。設計というものは必ず仕様が必要ですが、育てるというのは「環境を与えるけど、どういうものができるのかは程度運まかせ」みたいなところがあるんじゃないのかなという気がします。なので、人工知能という言葉は自己矛盾してるような気がします。知能は人工物じゃないんですよね。

牛久委員

先ほど中島先生がおっしゃっていたフレーム問題に、どう対応していくかという一つの仮説で、今でもAGIという読み方をして、色々なところのジェネラルな知能を実現しようとされている先生方ってたくさんいらっしゃると思うんですけれども、そういうふうに考えていくとフレーム問題は、「どこまで記述すればいいの」というところって、やはり難しいので未だに何も変わってないと思うんですね。

一方で、現在第三次AIブームということで、世の中に社会実装できているところって、そういったAGIをやっている先生方の文脈言うと「弱いAI」ということになります。そこだと、やはり相対的にフレーム問題って少なくなっていて、もちろんそれは「こういう使い道の AIを作りたいから」という文脈があると、考えないといけない選択肢の数っていうのがどんどん狭くなっていくからっていうことだと思うんですね。

なので、このブレークスルーを起こしている部分というのは、実はそういうところであるからフレーム問題みたいなのをうまく会議して、データを使っていながらうまく学習できているんだなと思います。そこが先ほどの「エキスパートシステム」みたいなところでもあったとは思うんですけども、ラストワンマイルとして人間とコミュニケーションするみたいなのが欠けていた部分だと思います。

なので、そういう風に何かの機能に特化してくれるAIというのが、最後に人間とコラボレーションして、その中で「人間が嫌がったらその判断はやめとこう」といった学習ができるようなAIまでいくと、より社会実装が進むんじゃないかなと思います。

深層強化学習で日本はイニシアチブをとれるか

各国のAIに関する特徴と差別化戦略について

事務局

私どもの方で今回のアクションプランの委員会に向けて、海外の事例に関した調査をいたしました。

このように、いろんな形でやっているというのが現状になっています。これに対して今、日本の現状はどうかというあたりに関して、委員の皆さんに補足いただければと思います。

川上委員

国家的な話と現状はどうかっていう話があるんだと思うんですけれども、基本的に日本の産業・企業は、いわゆる「技術で勝って事業で負けて」という感じだと思うんですね。ただ、AIの領域は特に技術で勝って事業で負けてっていうのが、なかなか成立しにくい領域なんじゃないかなと思っています。

日本は、技術を売ることが得意だと思うんですけど、それをそういう風に事業の中で捉え直して、どう事業にしてマネタイズするかというのが、まだまだ頑張っていかなきゃいけない部分だと思います。

特に、そのAIの技術と言うものをもう少しわかりやすく道具という形で捉えると、かなりいろんなことができて、進化のスピードが速い中で、それを使う人間だったり、それと一緒に使われる機械とかだったりていうものの関係性を捉え直して、どういう風に事業・ビジネス付加価値・生産性向上などに適応していくのかっていうことなんだと思います。

今、結構わかりやすく起こっているのは、生産性向上・コストダウン方向の領域で使われてることの方が多いと思ってます。一方、アメリカや中国は、最初にお金儲けとか事業があって、そこと直結して技術を捕らえてと考えているようなところが、まず日本との大きな違いだと思っています。

また、中国やインドもそうですけど、スタートアップの爆発力の違いみたいなところで、いろんなPOCを細かくやるわけですね。そうすると、それを13億倍の対象人数と言うか対象マーケットに広げていくことを考えながらPCOをこなして、上手くいったら莫大なお金を突っ込んでスピードアップする形の勝負をしているわけです。しかし、日本はそういうビジネスの勝負が、まだできていないのかなという風に感じています。

中島委員長

社会実装ということを考えた時に、日本でひとつ足かせになっているのは「法律」だと思います。一般的に法律って技術の後追いなわけなので、技術ができる前にそれに関する法律ができるわけじゃないんですけど、日本は分からないことに関して基本的にやってはいけないというふうに法律が書いてあります。

一方、アメリカは「ここはダメだけど、これらのことはやって良い」という書き方をしているんですね。いわゆる、日本はホワイトリスト方式、アメリカはブラックリスト方式と言いますけれども、そうなると新しい技術ができた時に、社会実装で諸外国にどんどん遅れを取ってしまいます。

例えば、今ですとまさに自動運転はそうなんですけど、アメリカや中国ではもう実用化されて自動運転車が走り回ってるわけですね。ところが日本は自動運転に関する法律ができない限り、実装できないという状況です。

タスクの意味と価値を理解できるAIは構築可能か？

中島委員長

私の方から意味理解の AI ということに関してお話をしたいと思います。
要するに人間な道具として扱う時にそのタスクの意味や価値を理解してもらえるのかという問題ですね。

先ほども述べましたように人間というのは生活をしています。これが大量生産をしているプログラムとの違いなわけです。例えば、新しい料理を創り出すというのは生活をしている人間にできますが、AIは苦手ないんです。一方でレシピのある料理を模倣するのは、AIでもできるという感じですね。

中島委員長

IBMのWatsonが、ある意味エキスパートシステムの現代版で優秀だと言われています。Watsonは基本的に人間をサポートする助手なんですよね。そうすると、助手に対して、仕事を伝えるというのが次の問題、つまりフレーム問題、身体性が異なるので価値を共有できない、ということに繋がってきます。

いわゆる記号接地問題という、記号の意味を実世界にちゃんと落とした形で理解できるかって言うことですけど、そういうことが難しいんじゃないかという問題があります。

現況のニューラルネットワークというのは、極端に言うと「意味を学習できない」「学習結果の間をついたデータを作ると騙せてしまう」という問題があります。

機械学習の弱点を強化し、記号推論の弱点を強化するというハイブリッド手法を提案したいと思っています。先程の演繹と帰納の融合もここ少し出てくるのですが、帰納論理プログラムみたいなことができるのではないかと思っています。

そして、赤字で書いてあるところが、なんらかの形で解決できるようになると嬉しいと思っています。まだ具体的にどんな感じでハイブリッド手法を作るかは決まっていません。みんなで作っていければと思っています。

今回委員会でいろいろ議論してる中で、システム1/システム2というキーワードが出てきました。パッとできることがシステム1、考えないとできないことがシステム2という感じです。

基本的には、システム1を深層学習が受け持って、システム2を記号推論が受け持つというのが心理学的にも妥当な話だと思っています。

中島委員長

最終的に、下記の図のようなものを作れば良いんじゃないかなと思っています。要するに外側とのループを回すのですが、その中で下にはディープニューラルネットワークがあってシステム1をやって、上に記号推論があってシステム2をやるということで、AとBの間のコレクションは今後研究していく必要があると思います。こういう2階建てシステムを作っていくと、意味理解のAIができるんじゃないかというご提案です。

村川委員

システムはシステム2のものを作っていこうというのは、もちろんやるべき事だと思います。ただ、やはり最初に着手する時に「何をターゲットにすればいいのか」というところは結構難しいんじゃないかなと思います。簡単すぎると面白くないですし、どこまで汎用的なものを目指すのかと言い出すと、なかなか着手できないのかなと。

ある程度、実用上役に立つ上手い問題設定ができると、この分野の研究もさらに活発化するんじゃないのかなと思います。例えば、人とロボットが共同作業するっていう世界のシステム1・システム2と、介護をするためのシステム1・システム2って、必要なシステム2の中身がだいぶ違うような気がするので、やはり問題設定をどこにするかってのは難しいなという風に感じたのですが、いかがでしょうか？

中島委員長

中島委員長︰おっしゃるとおりだと思います。まず、どういうドメインで研究を始めるかということ自体がチャレンジングだと思うのですが、やはり「会話ができること」は大事だと前から思っています。映画の感想を言い合えるくらいから始めると面白いと思います。

今Googleなどで翻訳はある程度できるようになりましたが、あれは論理構造を追いかけてるわけではなく、画像とセンテンスっていうのも論理構造を追いかけていないんだと思いますね。そこで言葉の本質である虚構（抽象度の高いレイヤー）だけで構図を作り上げてそこの論理展開をやれって言うことは、今のディープラーニングにはできていないことなので、そういうタスクをやらせようとして頑張れば何かなるかなという感じです。