敵対的生成ネットワークの台頭【後編】

Kailash ahirwar氏は、南インドのバンガロールに拠点を置くAIスタートアップMate Labsの共同設立者です。同氏がMediumに投稿した記事では、敵対的生成ネットワーク（Generative Adversarial Network：略してGAN）の誕生から台頭までの歩みが解説されています。

生成ネットワークと識別ネットワークが敵対的に協働することにより実在しない偽画像を生成するGANは、2014年にイアン・グッドフェロー氏らが発表しました。この時発表されたGANにもとづいて、DCGAN、StyleGAN、BigGAN、StackGAN、Pix2pix、Age-cGAN、CycleGANといった様々な派生的GANが生み出されました。その後、GANを使って制作された絵画が有名オークションのクリスティーで落札されたことにより、一躍世間の注目を浴びることとなりました。

もはやAI研究者とAIエンジニアだけのものではなくなったGANは、最近では偽画像とは分からない顔の画像を生成するサイトや動画に移っているヒトの顔を入れ替えるDeepfake動画が発表されたことによって、ますます注目されるとともに悪用への懸念が高まるようになりました。

悪用される可能性があるものも、GANは映画産業をはじめとした様々な業界でのビジネス活用が期待されています。こうしたGANを正しく活用するには、AI業界の関係者さらには社会全体の倫理観が求められていると言えるでしょう。

以下の後編記事では、GANで制作された絵画の落札を皮切りにGANが社会的に認知されると同時に懸念されるようになった過程を解説します。

なお、以下の記事本文はKailash ahirwar氏に直接コンタクトをとり、翻訳許可を頂いたうえで翻訳したものです。

目次 [非表示]

台頭
結論

台頭

有名な理論物理学者のリチャード・ファインマン（※訳注1）は次のように言った。

作れないものとは、理解していないものだ

GANの背後にあるアイデアとは、データを理解するネットワークを訓練することである。GANがデータを理解し始めると、そうした理解によってリアルに見える画像を作り始めるようにもなった。それではGANの台頭を目撃していこう。

（※訳注1）リチャード・ファインマンは、1965年にノーベル物理学賞を受賞したアメリカの物理学者。様々な逸話があることでも知られており、そうした逸話は回顧録『ご冗談でしょう、ファインマンさん』（岩波現代文庫に上下巻で収録）にまとめられている。

Edmond de Belamy

Edmond de Belamyとは、敵対的生成ネットワークによって描かれた絵画であり、クリスティーのオークションで432,500ドル（約4,700万円）という驚異的な価格で落札された（※訳注2）。この出来事はGANの進歩における大きな一歩だった。はじめて世界中がGANとそのポテンシャルを目撃したのだ。この出来事以前は、GANは研究室のなかだけのもので機械学習エンジニアに使われるだけだった。GANによる絵画の落札は、GANの一般大衆への進出ともなった。

（※訳注2）Edmond de Belamyを制作したのは、パリで活躍するアーティスト集団「OBVIOUS」（英語で「明らかな、明白な」という単語）である。OBVIOUSの公式サイトでは、Edmond de Belamyを含むGANで生成された架空の一族の肖像画群を閲覧できる。
ちなみに、同集団の最新作にはAIが生成した浮世絵集『Electric Dreams of Ukkyo』がある。

This Person Does Not Exist（このヒトは存在しない）

もしかしたら次のサイトhttps://thispersondoesnotexist.comに親しんでいるかも知れない。2019年2月、このサイトはインターネットを席巻した。サイトを作ったのはUberでソフトウェアエンジニアをしているPhilip Wanである。彼は、NVIDIAがStyleGANという名前で発表したコードにもとづいてこのサイトを作った。サイトをリフレッシュする度に新しいフェイクの顔が生成されるのだが、この顔の容姿は驚くほどリアルなのでフェイクであるかどうかを見分けることができないのだ。このサイトは非常に薄気味悪いと同時に革新的でもある。フェイクの顔を作る技術は限りないバーチャルな世界を作るポテンシャルを持っている。

ソース：https://thispersondoesnotexist.com/

アメージングですよね！

Deep Fakes

DeepFakesもまた非常に薄気味悪いが革新的な技術である。GANを活用すると、ターゲットとなったヒトが写った動画に別のヒトの顔をペーストすることができる。DeepFakesもまたインターネットを席巻した。一般のヒトビトはこの技術の否定的側面に思いを巡らせた。しかしAI研究者にとっては、この技術はメジャーなブレイクスルーであった。この技術は、スタントマンの顔を役者の顔に変えるのに何時間もの編集時間が要求される映画産業において、数百万ドル節約するポテンシャルを持っている。

DeepFakesは常に薄気味悪いものではあるが、この技術を社会的利益のために使うのはわたしたち次第なのだ。

クレジット：https://thenextweb.com/artificial-intelligence/2018/02/21/deepfakes-algorithm-nails-donald-trump-in-most-convincing-fake-yet/

（※訳注3）昨年7月に公開したAINOW翻訳記事「deepfakeを家族で楽しむ。あるいはいかにして私の妻をトゥナイト・ショーに出演させたか」では、deepfakeの生成原理とビジネス的な活用事例について論じられている。

トレンド

StyleGANは、目下のところ、GitHubのpythonプロジェクトで6番目に多くトレンドとなっている。GANと名付けられたプロジェクトの数は今までに何千と提出された。次に示すリポジトリは人気のあるGANとそれを解説する論文のリストを含んでいる（https://github.com/hindupuravinash/the-gan-zoo）。

GitHub

hindupuravinash/the-gan-zoo

https://github.com/hindupuravinash/the-gan-zoo

A list of all named GANs! Contribute to hindupuravinash/the-gan-zoo development by creating an account on GitHub.

現実世界において

GANはグラフィックをめぐるゲームを強化することに使われている。わたしはこうしたGANの活用事例に非常に興奮している。最近NVIDIAは動画を発表し、その動画では動画のなかの環境をゲーム化するためにGANがどのように使われているかを示している。

（※訳注4）上記のNVIDIAが発表した動画とは、2018年12月に「動画から動画の統合」という題名で発表された論文についてのデモ動画である。この論文では、動画を学習データとしてゲームで使われるような3D環境を構築する手法が解説されている。この手法を使えば、3Dオブジェクトをモデリングする代わりに動画を用意することによって、3Dシミュレーション環境を構築できるのだ。動画から3D環境を生成する様子を収録した動画（以下を参照）も公開されている。

結論

この記事では、GANがいかにして有名になり、そして世界的現象となったかを見てきた。わたしは、今後数年間でGANが民主化されるのを見たいと願っている。記事ではGANの誕生を見ることから始めた。それからいつくかの幅広く有名なGANのアーキテクチャを探った。最後に、GANの台頭を目撃した。わたしがGANをめぐるネガティブな報道を見た時には、困惑したものだった。すべてのヒトにGANの影響力を気づかせ、わたしたちの最大利益のためにGANを倫理的かつ道徳的に活用していくのはわたしたち自身の責任であると信じている。GANといっしょに歩んでポジティブに広めよう。GANは新しい産業と仕事を作り出す大きなポテンシャルを持っている。また、わたしたちはGANが間違った方向に行かないようにしないとならない。

読んでくれてありがとう

もしわたしとコンタクトを取りたいならば、次のメールアドレスに連絡ください。ahikailash1@gmail.com

注記：最近、わたしはGANを冠した書籍『敵対的生成ネットワーク・プロジェクト』を上梓した。この書籍ではほとんどの幅広く人気のあるGANのアーキテクチャとその動作する仕組みについて書いた。具体的にはDCGAN、StackGAN、CycleGAN、Pix2pix、Age-cGAN、そして3D-GANについて書き、その動作レベルに関して詳述した。それぞれのアーキテクチャについて専門の章を設けた。これらのネットワークについて非常にシンプルに解説し、TensorflowとKerasフレームワークを使ったプログラミング言語に関する記述もある。もしGANを仕事に生かしたい、あるいはGANを使う計画があるならば、わたしの書籍を入手して読んでみて、ぜひとも価値あるフィードバックをわたしの連絡先ahikailash1@gmail.comにシェアしてください。