最終更新日:
※直近2週間くらい書けてなかったので、本号は直近3週間くらいで見つけた面白かった記事も含みます
目次
①自動予約人工知能duplexの発展版?googleの自動会話システムは正しい方向にグイグイ進化している
今週アメリカで行われたGoogle Cloud Next ‘18で発表された「Contact Center AI」について。
以前公開された電話予約AI「google duplex」は美容院やレストランの予約タスクに限定されていたが、今度のやつはより広い”会話”に対応した様子。だいたい役に立たないchat bot的なものがここに来て一気に実用的なレベルに入ってこようとしている勢いを感じる。
記事では、ebayで購入した商品の返品についてユーザーが電話してきた場合のAIの受け答えの事例が紹介されている。duplexのときのように、人間のような自然な会話を行い、しかも購買履歴から取得したデータを使って「この前ネットで買った〇〇についてのお問い合わせですか?」という小憎い便利さをアピールしてくる。優秀かよ。
前回のduplexに対してはいろいろと突っ込みどころがありました。例えば、機械が電話していることをレストラン側の人間が知らされないことや、逆に機械が電話しているとわかれば受け手の人間側が適当な対応を取るであろうこと。ユーザーがお手軽に予約が可能になればお手軽にドタキャンをするであろう現実的な問題など、単純に「便利なAI予約システム」を作るだけでは逆に人間の手間や心理的な面倒臭さを増やすことになることが指摘されていた。自分も電話口の相手が機械だとわかったらまともに取り合おうとしないだろうなと用意に想像がつく…
しかし今回の「Contact Center AI」の目的は”コールセンターの人間の手間を減らすため”だと明言されており、GoogleのFei-Fei Li氏も以下のように発言していて好感が持てる。
「Googleは、人間本位のAIを追求していく」とし、Contact Center AIにおいても人間を代替するのではなく、逆に人間が価値を発揮できる仕事に集中できるよう支援することが最大のテーマだと話した。
ただ単に技術力でぶん殴るのではなく、どのタスクを解くためにどういった方法でAIを活用するかという設計(デザイン)ができるかどうかが今後ますます重要になり、サービスの明暗を分けることになると思っている。
②日本でAI活用が進まない原因がすべて濃縮されているような話
上記の、「AI活用の設計」を500%間違えるとこうなるというお手本のような事例。
社員の顔を画像認識し、眠そうにしてるとエアコン冷風を吹きかけて寝させないという「AIシステム」をNECとダイキンが発表。
みんなが言いたいことはtogetterが代弁してくれているのでおk
と、書いている間に炎上に対して弁解するような記事が登場
すでに眠い状態になってからではなく、眠気の兆しを検出した時に刺激を与えることで覚醒効果が大きくなり、その効果は温度や照度、芳香刺激など、刺激の与え方や組み合わせで高められることもわかった
きちんと数字と説明が書かれていてこちらの記事だとまだ「ふんふん」と読んでられる。こちらの記事を先に出していればよかったのにね…
インパクトに傾倒した(説明が不十分な)AIプレスリリース芸には気をつけないといけないねということで。
③データドリブンな教育はまだまだこれからがアツい
教育にテクノロジーを活用する、いわゆる “EdTech (Education×Technolog)” がアツい。
スマホやタブレットを使ったeラーニング的なものだけを指すのではなく、アプリ内で出題される問題への不正解の仕方によってユーザーの”理解度”を機械的に割り出し、ユーザーの理解度に合った最適なレベルの問題を出して教育効率を爆上げしているサービスを提供しているベンチャーのお話。
最近だと、リクルートが提供するの「スタディーサプリ」のデータ活用に関する第一回目のイベントがあり大人気だった模様。教育分野はまだまだ石器時代のようなスタイルがまかり通っている領域なだけに、最前線でデータ活用している事例はきっと目からウロコな発見がたくさんあるのだろう。
記事中では、”人工知能を使って、生徒のレベルにあった問題を出し続ける”とされているが、『ある数学の問題が解けない場合はAという公式を理解していない可能性が高いので、公式Aの理解を問う問題をだす』というような、ある意味のレコメンデーションアルゴリズムのようなマッチングを行っているのだと思われる。肝は、その問題が解けない時に何をユーザーが理解していないのかを定義する、つまり「正解ラベル作成のプロ」みたいな人たちの汗と涙の結晶によって、問題理解への最短経路をレコメンドし続けられるのだと思う。そういう意味では、真の教師とはその人達ではないのかと思わなくもない。
④自然言語処理系のいろいろ
自然言語処理やソーシャルリスニング系のプロダクトで有名なユーザーローカル社が文書要約に関する無料webサービスを、
自然言語処理の研究室として有名な東北大の乾研究室発のベンチャーも文書生成に関するプロダクトを発表。
互いに関係はないが、自然言語で有名な企業や研究室から同じような時期に発表があったということで。
日本語文章の生成や要約はまだまだ難しく、鬼門感がある。
ユーザーローカル社の方は文書要約のデモ用ページが公開されていたので、実際に自分が今まで書いたブログをインプットしてみて文書要約をさせてみたが、はやり「うーん」という感じだった。道のりはまだまだ遠そう。(もしくは自分の日本語がヤバイ)
一方で、日本語で本当に納得感のある文書要約や生成ができるのだろうかと思う日々です。
ツイッターで流行っている#54字の文学賞など見ていると、日本語のあまりのハイコンテクストぶりに我々は言語というよりLineスタンプのような抽象的なミームだけの情報のやり取りをしているのではという気持ちになってくる。それの要約や生成と言われましても…という気持ち。
⑤日本の夏はどんどん暑く、そして長くなっているという有益なデータビジュアライゼーション
このヒートマップは、夏期(6月から9月)の東京における過去140年間の日別平均気温を表したものだ。
きっとTLで多くの人が目にしたであろう、東洋経済オンラインが出した有益なデータビジュアライゼーション。
TL上のデータアナリスト関係者の何名かも、「やられた、これは良い可視化」というようなコメントを書いているのを見つけた。東洋経済オンラインさん、good job!
日本の夏は間違いなくどんどん暑くなり、しかも暑い日が増えていることが一目瞭然。こんな熱い日はダイキンの人工知能エアコンに冷やしてもらいましょう。
⑥手話x画像分析xスマートスピーカーの最高にクールな組み合わせに感動した
これまで見たスマートスピーカー関係の事例で最も感動したやつ。
TensorFlow.jsで手話のサインを画像的に読み取ってテキスト化し、スマートスピーカーのAlexaとコミュニケーションするという内容。
スマートスピーカーといえば当然「言語x言語」のインターフェースであったが、ここに深層学習を使った画像分析も加えて活用することで「画像(視覚情報)x言語」のインターフェースが出来上がる。つまり、手話を全く使えない人でも、このシステムを介せば手話ユーザーと会話ができるようになる。
技術的には画像分析で手話を理解できるようになったところが肝なのだろうけど、そのアウトプットとしてスマートスピーカーを介在させて現実的な利用法を示しているのが本当に素晴らしい。自分も技術をこういうふうに社会に貢献できるようになりたい。
⑦一見謎テクノロジーなんだけど、実はすごいやつ
ユーザの姿勢をWebカメラで捉え、似た姿勢の画像を8万枚の画像データセットから探索しリアルタイムに表示する「Move Mirror」をgoogleが公開。
自分のPCとインカメを使って実際にここから体験もできる。
動画を見ると/実際に体験してみるとわかるのだが、自分と同じポーズをした画像をひたすらリアルタイムで表示してくれるだけというもの。「なんかすごそうだけど、で、これはなんなの?」という心配な気持ちで一杯になる。
一応記事では、「自分の動き(ダンス)のコラージュ的なGif画像を作れる」としているが、それでもなお「それが何?」という気持ちが拭えない。
ただ、この技術はひいてはWebカメラの前でダンスするだけで、この動きに一致するミュージックビデオや映画が検索できるようになるかもしれないとのことで、ちょっと「なるほど」と思った。物理世界の動きもgoogleは”検索”をしていこうとしているらしい。
それにしても、この「Move Mirror」はちょっとイミフ感がある。もしかしてユーザーがデモで撮った動画を学習用にこっそり収集してたりしてないよね…?
⑧ダイキンよりも技術の使い方がわかってそうな資生堂さんの儲かりそうなIoTプロダクト
技術の使い方がめちゃくちゃうまいといつも感心している資生堂さんのIoT事例。
スマホで肌の状態を測定し、その瞬間の肌状態に最も適したスキンケアを提供してくれるデジタルガジェット。
本体は無料で、美容液・乳液のカートリッジを購入してもらう”ネスレのネスプレッソ”と同じビジネスモデル。
ただし、蓄積されるデータの価値はネスプレッソよりもよほど価値がありそう。
専用アプリによる肌測定と天気などの環境データを分析し、独自アルゴリズムによって一人ひとりに合う美容液などを抽出する。美容液と乳液は個人に合わせて1000パターンから選ばれる。どういった肌状態の時に、どんな美容液を吐出したかなど、IoTを活用して使用状況を把握
こういうの考えているのは資生堂のどういった人なのだろう。すごく気になる。自分が女性だったら資生堂信者になっているところ。
ちなみに、資生堂のクリエイティブやテクノロジープロダクトを紹介している資生堂公式の「資生堂 センデン部」にはたくさんのネタが転がってるのでめちゃおすすめです。
余談ですけど、一番最初に資生堂天才かよって思った技術事例はTeleBeauty
⑨生物の情報メディアを使って手書き文字認識タスクに成功
バイオ系のネタ。DNAを使って手書き文字認識に成功したという話。
生物が遺伝情報の保存メディアとして利用しているDNA(デオキシリボ核酸)は、情報の保存堅牢性が高い上に、面積あたりの保存情報量が膨大という特性を持っている(堅牢性に関しては、日々破壊されているDNAを修復する機能があるので”堅牢”と言えるがここでは割愛。保存できる情報量が膨大、というのは目に見えない大きさのDNA分子にこんな複雑な体を作り上げる設計図が保存されていることを考えるとわかると思う)
生き物が使っているものなので、計算機などが情報保存メディアとして使っている半導体とは違ってもちろん”有機物”であることも特徴である。
そんな、計算機とは異なる部品で情報量や堅牢性にメリットのあるDNAをメディアや計算リソースとして使えないかという研究や実験はこれまでもずっと行われてきた。その一つの成果として、ついに手書き文字認識タスクを解けるところまでとりあえず来たよいう話。
次世代の計算機として量子コンピューターが実用化されて大衆化されていく流れと並行して、こういったバイオコンピュータみたいなものが席巻する世界線があるのかもしれない。