最終更新日:
1-10 Roboticsで機械学習エンジニアをしている島袋です。
弊社では、Pepper やチャットボットを始めとした、会話コンテンツの作成を行っています。
私は会話エンジン部分を担当しており、自社で作成した会話コンテンツで、よりユーザーが楽しんでもらうための仕組みづくりを日々行っています。
今日は「雑談」という視点から、AIチャットがより私達の生活に寄り添うために、どのような課題があるかをお話させていただきたいと思います。
AIチャットのコミュニケーション能力不足
アニメや漫画では、日常的にロボットやアシスタントAIが存在する未来がよく登場します。鉄腕アトムやドラえもんは言うに及ばず、個性豊かなAIたちと人間とのコミュニケーションが描かれています。
2017年現在、周囲を見渡せば一つ二つは簡単に、会話機能を搭載したデバイスやソフトウェア(AIチャット)を見つけることができ、いよいよ夢にまで見た体験ができるようになってきたのではと、期待はふくらむ一方です。
しかし残念ながら、これらのAIチャットと作品内で描かれているAIとの間にはまだまだ乖離があり、思っていたのとは違うという印象をぬぐえません。
現在世の中に広まっているAIチャットのほとんどは、「タスク指向型」と呼ばれるもので、特定のゴール(予定の入力、買い物、予約)の達成を支援することを目的に作られているものとなります。
このようなAIチャットは、業務自動化ニーズがある限りは導入が進んでいくと考えられますが、一方でユーザーの側からすると、生活に大きな影響を与えていると感じにくいのではないかと思います。
毎回会話するAIチャットが違うため親近感が湧きにくいこと、用がある時にしか使用しないため日常的な関わりが薄いこと、この二点が上記の用に感じてしまう主な原因としてあげられます。
言い換えれば、日常的なコミュニケーションができないということが、AIチャットのより一層の普及へのボトルネックになってしまっていると考えています。
雑談が苦手なAIチャットたち
人間同士のコミュニケーションを考えた時に、日常的なコミュニケーションとして頻繁に発生するのが雑談です。
雑談は、人間関係の構築や維持に重要な役割を果たしていると言われています。
弊社でお手伝いをさせていただいていますPepper などの家庭用ロボットや、LINEやWEBサービス上のチャットボットでは、雑談機能の導入は積極的に進んでいます。
AIチャットにおいても、雑談は重要なものであるという認識は、少なくない開発者が感じているところなのです。
一方雑談は、AIチャットにおいて実現することが非常に困難な機能でもあります。
雑談を実現する上で難しいと感じている点は主に2つあります。
1つ目は、Grice の公準と呼ばれる、会話を成立させるために私たちが暗黙的に守っていると考えられているルールを満たすことが難しいという点。
2つ目は、ジェスチャーや表情、声の高さや大きさといった非言語コミュニケーションを理解し利用することが難しいという点です。
以下、それぞれについて簡単に説明させていただきます。
脈絡のある話をすることの難しさ
Grice の公準は、協調的な会話を成立させるために私たちが暗黙的に守っていると考えられている量・質・関係・容態の4つのルールのことです。
誤解を恐れずに簡単に説明すると、常識や知識の度合い、会話相手の意図や今までの会話の流れに反しないように、私たちは会話しているということを示した法則になります。
AIチャットでも一般的にこれらのルールを守ることが期待され、会話システムのエラー分析などにもよく利用されています。
これらのルールを守るために、AIチャットでは主に以下の3つのモジュールを組み合わせて利用します。
・ユーザーの発話意図の理解
・会話の流れの考慮
・常識や知識を格納したストレージ
・上記を元にした応答文の生成
テーマとユーザーの発話が限定的なタスク指向型のAIチャットでは、現状の技術レベルでも、ルールを守った応答をすることはそこまで難しくはありません。
一方雑談となると、ユーザーがどのタイミングで何を言ってくるかが全く予想できませんので、必然的に個々の要素技術はよりクオリティーの高いものが要求されることになります。
どのモジュールもまだまだ発展段階であるため、雑談においては各モジュールが間違った判断をしてしまう可能性が高く、モジュールを組み合わせた際に間違いが増大してしまい、ルールを守っていないちぐはぐな応答を返してしまう可能性が高いというのが現状なのです。
空気を読むのもまだまだ苦手
非言語コミュニケーションとは言葉以外のコミュニケーションをとる手段全般を指す用語で、声の高さや大きさといった音響的なもの、間の置き方や発話のタイミングといった発話の時系列的なもの、ジェスチャーや表情といった身体的なもの、会話時の距離といった空間的なものと様々なものがあります。
非言語コミュニケーションは対人コミュニケーションにおいて非常に重要と考えられており、特にお互いの感情を理解するという部分では、言語コミュニケーションよりも適した方法と言われています。
タスク指向型のAIチャットでは、非言語コミュニケーションが不十分でも、最悪目的が達成されれば問題はありません。
一方雑談は、ユーザーとの信頼関係を築くための機能という面が強いため、これらの要素をどれくらい考慮できるかが、体験の質を決めると言っても過言ではありません。
しかし私たち人間のように、AIチャットは逐一ユーザーの表情や声のトーンを気にすることがまだまだ苦手です。デバイスの精度や処理速度、アルゴリズムの精度、応答の生成といった課題から、これらの情報をほとんど活用できていないというのが現状です。
利用の面でも、抑揚やジェスチェーを発話に加え、AIをチャット自身の「感情」がユーザーに伝えられるような工夫が行われたりもしますが、これらは今のところほぼ人手で行われており、非常に労力のかかる作業となってしまっています。
これからのAIチャット
AIチャットにおける雑談の重要さ、難しさについては理解頂けましたでしょうか? まとめると、雑談機能を実現し、AIチャットがより生活に寄り添うような存在になるためには、以下のような技術の発展が必要だと考えられます。
・一般的な発話に関してのユーザーの意図の理解
・これまでの会話の流れの考慮
・常識や知識の考慮
・上記3つを考慮した応答の生成 ・表情や声などからの感情推定
・ジェスチャーの認識と応答生成への利用
・ユーザーの視線や距離の認識と応答生成への利用
・応答時の抑揚やジェスチャー、表情の自動付与
・応答時の間や発話タイミングの自動調整
このままでは「雑談は大事、でも実現するのは難しい」という夢のない話だけで終わってしまいそうですが、もちろん工夫次第では今の技術でも様々なAIチャットが登場してくると思われます。
かなり早い段階で、非言語コミュニケーションの入出力に重きをおいたAIチャットが続々と登場してくるのではないかと考えられます。
ユカイ工学さんの『Qoobo』や、ソニーさんの新しい『aibo』などは、このような方向を目指して開発されているのではないかと思われます。
このようなAIチャットは、応答のパターンが比較的少なくて済むため出力上の課題が小さいことに加え、ディープラーニングの登場による画像認識精度の向上、センサー連携の容易化といった、ユーザーからの入力を受け取るための技術的なハードルが下がってきたことから、実現可能性が高まってきています。
また、この方向性の応用で、人間の発話をなんとなく理解したような動作をする、AIチャットも今後は増えていくのではないかと考えられます。
雑談での発話意図の理解はそう簡単に精度を上がらないかもしれませんが、非言語情報の入力との組み合わせで、かなり精度の高い応答を返せるようになるのではと期待できます。
まだまだ課題は山積みですが、AIチャットの今後の発展を楽しみにしていて下さい!
お知らせ
1→10 Roboticsでは、機械学習エンジニア、サーバーサイドエンジニア、フロントエンドエンジニア、Androidエンジニアを募集しています。
AIを活用したロボット・チャットボットの体験づくりに興味がある方は、ぜひこちらのページからご応募ください!