“AI” × “ビッグデータ”でマシンの中に自分のコピーを作り出す(SOMPOホールディングス株式会社 中林紀彦氏)

この記事は2017年 アドベントカレンダー企画「AIの未来予測」の記事です。寄稿してくださったのはSOMPOホールディングス株式会社 チーフデータサイエンティストの中林紀彦さんです。

プロローグ

20XX年12月のある日ビルの谷間にちらつく雪を見ながらFは、父に相談したら何と言うだろうかと考えて、数年前に他界した彼の父のことを「マシンの中にコピーを作ろう!外見だけじゃなく、思考パターンや感情とか内面的な部分もコピーして、今の年齢まで年を取らせてみようか」と思い立った。アシスタントに話しかけて[1]アルゴリズムの概要を伝え、ほどなく近くのカフェでスマート・グラス[2]を掛けて、必要なデータを集めながらアルゴリズムの実装を始めた。「まずは外見からと、、、」

外見を再現する

クラウドにある家族の共有ライブラリー[3]にはFacebookやInstagramなど過去に父が使っていたSNSのアーカイブも含めて、父の2次元の画像や動画が大量に保存されているのでこれらを変換して3次元化する。2Dから3Dへの変換ライブラリは以前にもDeep3D[4]を試した事があり細部の表現がイマイチだった記憶があるが、最近のDeep3Dは肌の細かい凹凸と質感まで再現できるようになっていて驚いた[5]。声も動画にあった音声データを音声合成ライブラリ[6]に学習させることで、特徴量をつかんだ聞き覚えのあるリアルな声を再現できた。

動作の部分については、講演の動画などから上半身だけで話している時の身振り手振りを再現できれば良いと思っていたのだが、アーカイブの中から2010年代に流行していたライフログ・アプリの加速度センサーとGPSデータが残っていたので、そこから歩幅や上下の揺れなどを推定し雑踏を歩く姿まで再現させてみることにした。
ここまで実装できたところで、スマート・グラスのAR(Augmented Reality : 拡張現実)に映し出されたカフェの前を通り過ぎる父の姿が当時と同じであることを確認した。

内面を再現する

次に難関の思考パターンや感情の実装部分だ。第3次AIブームの頃、質問応答型チャットボットで流行った質問と応答のペアを複数用意して学習させる初期のタイプの実装からは飛躍的に進化した、超大規模DRNN(Deep Recurrent Neural Network)モデル[7]などいくつかの汎用モデルも試してみたが、どうもシックリこない。やはり本人の思考パターンのゆらぎや感情の起伏によるバラツキを組み込む必要があると考えて、ネットワークモデルの拡張を試行錯誤し始めた。

思考パターンや感情に影響を与えそうなものを探し父のデジタル本棚[8]にあった浅田次郎などの小説や、アーカイブに残っていた映画鑑賞記録アプリのログから、ブライアン・デ・パルマの映画を好んで観ていたことが分かったので、これらの作品に登場する人物たちをモデル化[9]してDRNNモデルを拡張していった。拡張方法は、登場人物の思考パターンや感情のゆらぎをモデル化しDRNNの後続プロセスとして直列につなぐ実装を試みたが悪くなさそうだ。さらにアーカイブにあった音楽のプレイリストにある曲から歌詞を取り出して[10]情報源に加えた。

思考パターンや感情のゆらぎを組み込むことで格段に再現の解像度を上げることに成功した。チャットでテストしてみたが、学生の頃LINEでやり取りした感覚に近いリアルな感じに仕上がっていた。

未来の姿をシミュレーションする

外見と内面のそれぞれの再現がほぼ完成したので2つを融合させて、さらに父が他界してから現在までのデータを加えてモデルを現在の姿に進化させた。あの頃より白くなった髪と深い目尻のシワがあまりにも自然で、ARであることを忘れてしまうくらいの外見だった。もう少しチューニングしたかったが次の予定があったので、一旦カフェを出て次の打ち合わせ場所に向かった。

技術的な解説

ここでストーリーを少し技術的に解説しておきます。(設定の20XX年が何十年後かは読者の皆さんのご想像にお任せしますし、あくまでもフィクションです)

[1]パーソナルアシスタント機能を音声で利用しています。スマホの機能も、CPUなど演算装置は身につけずエッジやクラウドにあるリソースを使用し、外出先でのUIはワイヤレスヘッドセットを使った音声が主流です。

[2]メガネ型のデバイスでPC的なUIとしても利用可能です。このケースではカフェのテーブルで”AR PC”を使用しています。キーボード部分は実際はテーブルで、キーストロークがなく物足りないのでキーボードだけは持ち歩く人も多いです。

[3]ラウド上にある家族のデータを共有するためのストレージ。デジタル資産の相続が社会課題となった時期があり、クラウド上にある個人のデジタル資産は家族で共有できるようになっています。

[4]2次元の写真を3次元化するライブラリ(https://arxiv.org/abs/1604.03650)

[5]8Kが肉眼で見分けが付く限界と言われていますが、16K以上の画像データを使うことで肉眼では見えない皮膚の質感まで再現できるようになりました。

[6]初音ミクなど初期の音声合成では個人の特徴を再現することが難しかったのですが、音声に加えて体型や口の動きなど画像データも加えることで個人の特徴をリアルに再現できるようになりました。

[7]20XX年は既にDNNの時代ではありませんが、2017年の読者にリアリティを出すためにあえて使っていますのでご容赦ください。

[8][3]の個人のデジタル資産と同じように、電子書籍の利用権が相続可能になっているものもありますので、高価な書籍などは相続税の課税対象となります。

[9]動画にある登場人物を全て抽出して、言動をモデル化しています。

[10] 特に10代、20代の若い頃によく聞いた曲は、思考パターンや感情のゆらぎに大きな影響を与えるケースが多いので重みを大きくしています。

エピローグ

その夜、ビアバーのカウンターで父と二人横に並んでFは話し始めた。「父さん、久しぶり。実はオレね・・・・・」昼閒SNSのアーカイブで見つけた、”将来、君たちが人生の岐路を迎えたとき、少しでも多く希望の持てる選択肢がある世の中にできるように私も頑張ります”という父からのメッセージを思い出しながら、、、END

編集後記

今回は「“AI” × “ビッグデータ”でマシンの中に自分のコピーを作り出す」というタイトルで、サイエンス・フィクション的に”AIの未来”を描いてみました。このテーマで真面目に書き出すとオカルト的な感じになってしまうので、ストーリー仕立てにしてあります。
技術的な裏付けはほとんどない仮説と空想をつなぎ合わせたストーリーでツッコミどころ満載ですが、全く不可能なアプローチではないと思います。最近のAI界隈はは少し硬直化しているような気もするので、もっとアタマを柔らかくして面白いAIを生み出すヒントになれば嬉しいです。

中林紀彦
Twitter : https://twitter.com/nnakapa

AINOW
人工知能専門メディアAINOW(エーアイナウ)です。人工知能を知り・学び・役立てることができる国内最大級の人工知能専門メディアです。2016年7月に創設されました。取材のご依頼もどうぞ。https://form.run/@ainow-interview

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する