HOME/ AINOW編集部 /Ideinとアイシンが「Saya」を通じて描く“EMOtive A.I.”の可能性
2022.11.24

Ideinとアイシンが「Saya」を通じて描く“EMOtive A.I.”の可能性

最終更新日:

自動運転技術の向上によって、無人バスや自動バレー駐車場が当たり前に見られる時代が来ようとしています。そんな時代において、人のぬくもりや安心感を補う存在として現在開発されているのが、EMOtive A.I.「Saya」です。

今回はアイシンとIdeinが協業で開発に取り組んでいるEMOtive A.I.「Saya」の現状と課題、そして可能性について伺ってきました。

中村晃一氏

Idein株式会社代表取締役。2015年にIdeinを起業した創業者でもあり、AIを社会実装するためのインフラを作るべく、エッジAIプラットフォーム「Actcast」を2020年から商用化しています。

大須賀晋氏

株式会社アイシンの先進開発部第5開発室室長。元々はドライバーモニターの画像認識カメラを開発しており、その後も画像認識系の製品の開発に携わり、現在はEMOtive A.I.「Saya」の開発にも取り組んでいる。

鍋倉彩那氏

株式会社アイシンで2019年からEMOtive A.I.「Saya」の開発に携わっており、現在はSayaの動きを司るシナリオ開発や画像認識を担当している。

 

▼過去のIdeinとアイシンの協業に関するラウンドテーブルの記事はこちら。

Sayaとは?

EMOtive A.I. Sayaは、「街の様々なところにいてくれる子供や高齢者でも接しやすいAIインターフェイス」をテーマに、雑談AIだけでなく、音声認識、音声合成、CG、人らしい動きをする制御を含めて、高度な対話システムを構築した、人に寄り添い、移り行く話題の中で、自然に誘導することができる新対話AIです。

Ideinの取り組みと近況について

ーーIdeinの近況を教えて下さい。

中村氏:2020年の1月に「Actcast」の商用版をリリースしたのですが、最初の2年間は知名度も実績も0からのスタートであったことに加え、コロナ禍の直撃もあり苦労しました。しかし、今年に入ってから急激に業績が伸び、4月に1万5000台を突破して、エッジAI分野ではトップシェアまで成長してきました。

活用事例としては、AIカメラ、AIマイクが数千店舗で実稼働、また、POCではなく実ビジネスのインフラとして使われるところまで成長し、最近ではそごう・西武さんや、JREモールなどで導入されています。サービスとして0から1のところを突破し、1から100のフェーズに入ったのかなと思っています。

▼Idein株式会社のPlayersはこちらから。

 

ーーここ最近で活用動向の変化はありましたか。

中村氏:現在はマーケティング目的のユースケースがほとんどです。我々が書記のターゲットにしているリテールでは、店舗などの現場に、どういう人が来て、どのように行動するかというデータが取れていなかったんです。そこのデータをActcastを使っていきたいという需要が多いです。

このような需要が生まれる理由としては、店舗への送客はWebで行っていたり、購入後はPOSレジでデータは取れますが、商品を選んで買うという一番重要な瞬間のデータが取れていないためです。つまり、デジタル化は色々な業界で進んでいますが、オフラインの現場はブラックボックスになっているのが現状です。

それ以外だと、AIマイクで店頭での接客の会話内容を記録するシステムでご活用頂いています。後のトラブル回避のために録音するというようなものなんですが、話者の分離や背景ノイズの除去などの為にAI技術を利用する必要があります。こちらも需要が高いです。

エッジAI自体のニーズでいうとプライバシーの問題はやはり大きいです。そこは皆さん気にされているところで、クラウドにアップロードせずに個人情報を含むデータをエッジで処理をすることでプライバシーを保護した状態でのデータ収集を実現しています。

あとはコストの問題です。データをクラウドに上げて処理をするタイプに比べて、エッジデバイスは通信コストやサーバーコストを大きく削減することができるため需要が増えていると考えています。

ユースケースのほとんどはAIブームで多くの会社がトライしていて、アイデアは良かったけれども、システム側の問題や プライバシーの問題など、様々な事情で具現化できずに、実証実験の終わりだったものを、我々がしっかりインフラを作り込んだことによって、ビジネスにすることができたということですね。

ーーIdeinはSayaにどの部分で携わっているんですか。

中村氏:Sayaを色々な所に置けるように小さい「Jetson」1台に集約するといったことをやっていまして、要するに実用化に向けたコストの削減とシステムの小型化です。

高速化や、AIではない部分の技術も得意とするのが当社ですので、小さくて安いデバイスを活用するというところで協力させてもらっています。

ーー中村氏から見て、Sayaに期待するところはどのあたりですか。

中村氏:我々とアイシンさんで、今Saya以外にもスマートシティだとか街づくり系のことに取り組んでいるのですが、そこでもやはりエージェントは重要な切り口かなと思っています。例えば、街を思い浮かべると施設やモビリティが浮かびますが、人が暮らしていく以上、それらと人間との接点が重要で、人との接点を置き換える、またはより良いものにアップデートさせていくかというところに、エージェントは深くかかわってくると思うので、そのあたりに期待しています。

ーーIdeinが描く未来像について教えてください。

中村氏:Actcastは第三者の会社にベンダー・ユーザーとしてビジネス利用して頂けるようなプラットフォーム型のサービスとして開発してます。とは言っても、いきなり第三者にビジネス利用頂ける状態にはならないので、立ち上げる為に当社自身がActcastを使用したソリューション開発に取り組んでいます。最近の話ですがようやく第三者の会社がActcast用アプリケーションの開発をして頂ける様になってきました。その最初のユースケースは、工場のアナログメーター数字が表示されるパネルをカメラで読み取るアプリ。もちろん、まだまだこれからではありますが、今回のように我々自身だけで作っていくのではなく、パートナー企業や第三者の企業によるソリューション開発を促進し、エコシステムを形成していきたいと考えています。

IdeinはAIカメラやAIマイクなどの情報処理装置だけを作りたいわけではありません。エージェントはまさに、エッジAIの究極系でもありますし、その先にはおそらくロボットがあるとは思うんですけど、エッジでAIが動いて一括管理されるものというものは、全てActcastの目指すべきところになります。

しかし、まずは入り口として、全く新しい市場で我々が強みを発揮できる領域が切り口になるので、 AIカメラなどのエッジAI分野に取り組んでいます。我々がそれなりに大きなエコシステムを築くことができたら、従来からあるような単純なセンサーを理由とするIoT領域にも広げていけると考えています。

EMOtive A.I.「Saya」について|株式会社アイシン

ーーSayaの役割について教えてください。

大須賀氏:大須賀氏:さまざまなAI と人間の接点を持つ場面で、無人でも寂しくないように、ユーザーとやりとりしてくれるアクチュエーターとして開発しているのがEMOtive A.I.「Saya」です。

例えば、自動バレー駐車場でActcast に繋いでいるインフラAI カメラ等とやり取りしてくれるエージェントや、無人自動バスで稼働しているAI カメラとやり取りをしてくれるエージェントを開発しています。

ーーSayaのパーソナリティな部分について工夫はありますか。

大須賀氏:パーソナリティの作り方は、非常に気を使っているところです。名古屋大学東中先生や豊橋技科大北岡先生と開発している質問誘導AIは、NTT日本語トランスフォーマーベースの雑談AIで、ユーザーが発話した文章に対して”次にシステムが質問したい内容”に沿って対話を展開していくというAI機能なのですが、そこにSayaらしい発話の選択みたいなものを入れています。

ーー性格の作り方はどのようにされていますか。

大須賀氏:質問誘導AIからシステム応答文の候補がたくさん出てくるので、Sayaらしさを判定する機械学習器を用いてランキング付けをして、1番ランクが高いものを出すというような感じです。クラウドソーシングを使用してSayaらしさを表すデータを作るのですが、Sayaのキャラクター性というのはビデオや資料などで伝えておき、Sayaだったらどんな質問をして、何と答えますか。というものを大量に集めて作っています。

ーー工夫した部分はどこですか。

大須賀氏:ターンテイキング¹は視線行動がすごく絡んでいるという話がありまして、人らしい対話を作るために視線行動の部分を工夫して作り込んでいます。

例えば、1970年代の心理学研究で明らかになったヒトの対話中の動作として、話し始めには人は目をそらして、話し終わりは相手をみるというものがあります。聞いている方はずっと相手の事を見るので、話し終わりに目が合う事がきっかけになり話者の交代(ターンテーキング)が起こると言われています。ちなみに、ポジティブなときは相手を見て、ネガティブな時には見ない。簡単なことを言う時は相手を見るし、質問する時も相手を見るなど発話内容でも変わってきますが、このような動作をSayaに実装することで対話しているユーザーが自然とコミュニケーションをとれている感覚が生まれます。

さらに、ユーザー側の視線を認識して更にターンテイキングに活かすというところをまさに今つくっています。

1ターンテイキング:会話の主導権が入れ替わるメカニズム

進化するエージェントは不気味の谷を越している?

ーーいわゆる不気味の谷²は越えたのでしょうか。

中村氏:かなり没入感が高まり、まさに目の前に人がいる、という感覚が高まっています。人に似すぎると違和感が生まれる不気味の谷を、圧倒的な没入感で越えたと感じています。

大須賀氏:映画やゲーム、アートなどでは、動画でも超えているんですけど、モーションキャプチャーで後ろで俳優さんが動いてるとか、声を当てているという方法で不気味の谷を超えています。私たちがソフトで自動で動作や声を作る時に、数10ミリセックから500ミリセックぐらいの動画をたくさん繋いで話している様子を作るんですけど、それが不自然じゃないように見せる技術をTELYUKA  さんと研究しています。

2不気味の谷:機械に対しては抱かれない親近感が、人を模した単純なロボットなどに対しては高まるが、人に似すぎると違和感の方が勝るようになるというもの

Sayaのこれからの課題は

ーーSayaの今の課題、技術的な壁はありますか。

大須賀氏:例えば、会話において間が長いという課題があります。相手が喋ったら、Sayaが喋りだすのに5.5秒かかっているんです。

これは、相手が喋り終えたことを認識する期間と、 音声認識する期間があり、音声認識した結果を対話A(質問誘導AI)に投げ、投げた後に返ってきた文言を、音声合成AIが話す、という処理を直列にしか出来ないため、足し算した結果、5.5秒になっています。ここをいかに短くしてくのかという所が課題です。人間の基本的な対話の反応時間は、平均200msとされていますが、その10倍の2秒でも人間は受け入れられると言われているので、高速化や最適化により2秒を目指そうとしています。ですが、人間のレベルまで行こうとすると、処理を直列で行っている状態では不可能に近いです。

中村氏:ミドルウェアや、アーキテクチャの技術によって速くすることもそうですし、モデルそのもの、アルゴリズムそのものも会話の途中から先を予測して文章の生成を始めるなどの改良が考えられます。

鍋倉氏:エンジニアから見る難しさみたいなところを話すと、ソフト自体の評価だけでは完結しない部分が大変です。例えば、Sayaのソフト部分の評価が全部オッケーだとしても、感覚的に気持ち悪いとか、話してみるとなにか違うみたいな、今までソフトウェアで作っていたものとは、また別の視点を持たないといけなくて、自分の感じた気持ち悪さとか、ちょっと怖いなっていうのをどうしたら、直せるのかっていうのを考えるには、心理学とか人間工学とかを勉強しないといけないので、開発陣側もとにかくSW開発力を高めるだけではなくて、色々な知見を持たないといけないんです。

大須賀氏:この開発のコンサルや指導をしてくれているスクウェア・エニックスの三宅陽一郎さんにもよく言われているのですが、人との継続的な関係を作るというのは、大きな課題だと思っています。毎日一緒に過ごして、ずっと一緒にいられる存在を目指しています。1度だけ案内してくれるだけならいいのですが、ずっとこの人を置いておいて、ずっと付き合えますか。と言うと中々難しい側面があります。この継続的な関係を人と作る時に、色々な相手のことを記憶していてくれたりだとか、相手の好みみたいなことをなんとなく分かっていないとできないので、そこはすごく難しい問題だと思います。

実用化に向けて

ーー実用化に向けた動きはありますか。

大須賀氏:元々展示やイベントで喋るというのはあるんですけど、今年度の目標としては、一般の人と話せるところに持っていくということです。

今やっていることは、名古屋・栄のロフトのコワーキングスペースに、対話システムを置いています。そこで、Sayaに喋ると覚えてくれて、2回目来たら、久しぶりと言ってくれる感じです。雑談で対話できるようになったため、情報収集もかねて置いてます。

次に、協業しているALSOKさんでは、介護施設で実証実験を行ってくれています。ALSOKさんの思惑の1つとしては、もちろん警備、案内の目的もありますが、介護施設で、Sayaが入居している方々の話し相手になれるのではないかという部分です。入居している方がヘルパーさんに忙しそうで遠慮してしまい、困りごとなどを言いそびれてしまうと言う事が結構あるらしくて、そういった声を拾えないかということですね。

あとは商業施設で使ってもらいたいという思いもあって、西武渋谷店さんのイベントではあるんですけど、一般のお客さんと喋るイベントも行っています。

そして、スマホ向けで、東京大学や理科学研究所の先生たちとディスカッションしながら、モバイル化というのを進めています。そこで、モバイル端末でアンケートを取る際に、回答内容の充実度が低いという課題の解決を目標にし、アンケートを人と話す形にすればもっと良くなるのではということで、ディスカッションしながら進めています。

ーーコワーキングスペースで行っている対話収集の目的はなんですか。

大須賀氏:新しくできたベンチャー向けのコワーキングスペースなので、どんな施設にすればいいかの意見を集めるために置いています。また、正直なところを言うと、 実証実験やテスト的なところもあり、実際世の中に出していくにあたって、最初はクローズの場所で検証しようという意味で行っています。

エージェントの今後は

ーーエージェントの重要性と可能性を教えてください。

鍋倉氏:例えばバスだと、 乗客が転倒してしまったとか、「次のバス停に着く時、そこの場所はドアが開いて危ないから避けて」という動作はAIカメラで検知できています。 

しかし、そこをユーザーに伝える方法というのは、ブザーや音はあるのですが、ユーザーによっては、ちょっとイラっとした等の声もあります。そこで、エージェントであるSayaが「危ないからよけてね」と言うことで、ユーザーも受け取りやすくなり、イラッとすることも減るのではないかと考えています。このように、ユーザーの心理に寄り添う形で、エージェントがどんどん広がっていくのではないかと思っています。

大須賀氏:色々な物を自動化すると、人間との接点が機械的になり少し寂しくなります。そのような際に、エージェントが応対してくれて、なにか問題があった時には、人と入れ替わるというようなことが1番ストレートなエージェントの可能性だと思います。

今、amazonが僕らの買い物のことを知っており、googleは、僕らの検索傾向等を知っている、そしてIdeinは誰がこの店に来ているのかということ知っているような状態です。そこでSayaがコンピュータ、データ、ネットワークの真ん中にいて、ヒトとやり取りをしてくれる存在になるのではと考えています。自分の信頼できるAIのパートナーがいるというところが、最終的にSayaの目指す場所のひとつです。

最後に

今回は、IdeinとアイシンにEMOtive A.I.「Saya」のこれからについてインタビューしました。自動運転技術や画像解析技術の発展と共に、このようなエージェントの可能性が広がっていくことが予想されます。

また、現在IdeinオフィスではSayaと会話をすることが出来ますので、是非訪問してみてはいかがでしょうか。

▼Idein株式会社の公式サイトはこちらから。

 

▼株式会社アイシンの公式サイトはこちらから。

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する

あなたにおすすめの記事

生成AIで“ウラから”イノベーションを|学生起業家が描く、AIを活用した未来

特許技術×AIでFAQを次のステージへ|Helpfeel

GPUの革新からAI時代の主役へ|NVIDIA

あなたにおすすめの記事

生成AIで“ウラから”イノベーションを|学生起業家が描く、AIを活用した未来

特許技術×AIでFAQを次のステージへ|Helpfeel

GPUの革新からAI時代の主役へ|NVIDIA