生成ネットワークと識別ネットワークが敵対的に協働することにより実在しない偽画像を生成するGANは、2014年にイアン・グッドフェロー氏らが発表しました。この時発表されたGANにもとづいて、DCGAN、StyleGAN、BigGAN、StackGAN、Pix2pix、Age-cGAN、CycleGANといった様々な派生的GANが生み出されました。その後、GANを使って制作された絵画が有名オークションのクリスティーで落札されたことにより、一躍世間の注目を浴びることとなりました。
もはやAI研究者とAIエンジニアだけのものではなくなったGANは、最近では偽画像とは分からない顔の画像を生成するサイトや動画に移っているヒトの顔を入れ替えるDeepfake動画が発表されたことによって、ますます注目されるとともに悪用への懸念が高まるようになりました。
悪用される可能性があるものも、GANは映画産業をはじめとした様々な業界でのビジネス活用が期待されています。こうしたGANを正しく活用するには、AI業界の関係者さらには社会全体の倫理観が求められていると言えるでしょう。
以下の後編記事では、GANで制作された絵画の落札を皮切りにGANが社会的に認知されると同時に懸念されるようになった過程を解説します。
なお、以下の記事本文はKailash ahirwar氏に直接コンタクトをとり、翻訳許可を頂いたうえで翻訳したものです。
台頭
有名な理論物理学者のリチャード・ファインマン(※訳注1)は次のように言った。
作れないものとは、理解していないものだ
GANの背後にあるアイデアとは、データを理解するネットワークを訓練することである。GANがデータを理解し始めると、そうした理解によってリアルに見える画像を作り始めるようにもなった。それではGANの台頭を目撃していこう。
Edmond de Belamy
Edmond de Belamyとは、敵対的生成ネットワークによって描かれた絵画であり、クリスティーのオークションで432,500ドル(約4,700万円)という驚異的な価格で落札された(※訳注2)。この出来事はGANの進歩における大きな一歩だった。はじめて世界中がGANとそのポテンシャルを目撃したのだ。この出来事以前は、GANは研究室のなかだけのもので機械学習エンジニアに使われるだけだった。GANによる絵画の落札は、GANの一般大衆への進出ともなった。
ちなみに、同集団の最新作にはAIが生成した浮世絵集『Electric Dreams of Ukkyo』がある。
This Person Does Not Exist(このヒトは存在しない)
もしかしたら次のサイトhttps://thispersondoesnotexist.comに親しんでいるかも知れない。2019年2月、このサイトはインターネットを席巻した。サイトを作ったのはUberでソフトウェアエンジニアをしているPhilip Wanである。彼は、NVIDIAがStyleGANという名前で発表したコードにもとづいてこのサイトを作った。サイトをリフレッシュする度に新しいフェイクの顔が生成されるのだが、この顔の容姿は驚くほどリアルなのでフェイクであるかどうかを見分けることができないのだ。このサイトは非常に薄気味悪いと同時に革新的でもある。フェイクの顔を作る技術は限りないバーチャルな世界を作るポテンシャルを持っている。
アメージングですよね!
Deep Fakes
DeepFakesもまた非常に薄気味悪いが革新的な技術である。GANを活用すると、ターゲットとなったヒトが写った動画に別のヒトの顔をペーストすることができる。DeepFakesもまたインターネットを席巻した。一般のヒトビトはこの技術の否定的側面に思いを巡らせた。しかしAI研究者にとっては、この技術はメジャーなブレイクスルーであった。この技術は、スタントマンの顔を役者の顔に変えるのに何時間もの編集時間が要求される映画産業において、数百万ドル節約するポテンシャルを持っている。
DeepFakesは常に薄気味悪いものではあるが、この技術を社会的利益のために使うのはわたしたち次第なのだ。
トレンド
StyleGANは、目下のところ、GitHubのpythonプロジェクトで6番目に多くトレンドとなっている。GANと名付けられたプロジェクトの数は今までに何千と提出された。次に示すリポジトリは人気のあるGANとそれを解説する論文のリストを含んでいる(https://github.com/hindupuravinash/the-gan-zoo)。
現実世界において
GANはグラフィックをめぐるゲームを強化することに使われている。わたしはこうしたGANの活用事例に非常に興奮している。最近NVIDIAは動画を発表し、その動画では動画のなかの環境をゲーム化するためにGANがどのように使われているかを示している。
結論
この記事では、GANがいかにして有名になり、そして世界的現象となったかを見てきた。わたしは、今後数年間でGANが民主化されるのを見たいと願っている。記事ではGANの誕生を見ることから始めた。それからいつくかの幅広く有名なGANのアーキテクチャを探った。最後に、GANの台頭を目撃した。わたしがGANをめぐるネガティブな報道を見た時には、困惑したものだった。すべてのヒトにGANの影響力を気づかせ、わたしたちの最大利益のためにGANを倫理的かつ道徳的に活用していくのはわたしたち自身の責任であると信じている。GANといっしょに歩んでポジティブに広めよう。GANは新しい産業と仕事を作り出す大きなポテンシャルを持っている。また、わたしたちはGANが間違った方向に行かないようにしないとならない。
読んでくれてありがとう
もしわたしとコンタクトを取りたいならば、次のメールアドレスに連絡ください。ahikailash1@gmail.com
注記:最近、わたしはGANを冠した書籍『敵対的生成ネットワーク・プロジェクト』を上梓した。この書籍ではほとんどの幅広く人気のあるGANのアーキテクチャとその動作する仕組みについて書いた。具体的にはDCGAN、StackGAN、CycleGAN、Pix2pix、Age-cGAN、そして3D-GANについて書き、その動作レベルに関して詳述した。それぞれのアーキテクチャについて専門の章を設けた。これらのネットワークについて非常にシンプルに解説し、TensorflowとKerasフレームワークを使ったプログラミング言語に関する記述もある。もしGANを仕事に生かしたい、あるいはGANを使う計画があるならば、わたしの書籍を入手して読んでみて、ぜひとも価値あるフィードバックをわたしの連絡先ahikailash1@gmail.comにシェアしてください。
次のリンクから本のコピーを入手することも可能です。https://www.amazon.in/Generative-Adversarial-Networks-Projects-next-generation/dp/1789136679?fbclid=IwAR0X2pDk4CTxn5GqWmBbKIgiB38WmFX-sqCpBNI8k9Z8I-KCQ7VWRpJXm7I
・・・
以上の記事はJournalから読めます。
Journalのユーザになれば、毎週日曜の朝目覚めるとあなたの[Tech]受信ボックスにその週でもっとも注目すべきストーリーが届きます。Noteworthy in Techのニュースレターを読んでみましょう。
原文
『The Rise of Generative Adversarial Networks』
著者
Kailash Ahirwar
翻訳
吉本幸記(フリーライター、JDLA Deep Learning for GENERAL 2019 #1取得)
編集
おざけん