最終更新日:
Rane氏が考える画像生成AIがクリエイティブ業界に与える影響は、以下のような箇条書きにまとめられます。
Rane氏が考える画像生成AIがクリエイティブ業界に与える影響
|
以上のように論じた後、カメラやPhotoshopのような新たなテクノロジーが発明される度に、クリエイターはそれらを活用して新たなアート作品を創作してきた歴史をふまえると、画像生成AIもクリエイターに新たな可能性をもたらす最新テクノロジーのひとつに過ぎない、とRane氏は自説をまとめます。こうした同氏の主張は、極めて穏健な画像生成AIに対する態度表明と言えるでしょう。
なお、以下の記事本文はZulie Rane氏に直接コンタクトをとり、翻訳許可を頂いたうえで翻訳したものです。また、翻訳記事の内容は同氏の見解であり、特定の国や地域ならびに組織や団体を代表するものではなく、翻訳者およびAINOW編集部の主義主張を表明したものでもありません。
以下の翻訳記事を作成するにあたっては、日本語の文章として読み易くするために、意訳やコンテクストを明確にするための補足を行っています。
はじめに
最近、アート業界でこんな物騒な論争があった。ある有名な画家が、新しい技術を使ってフォトリアリスティックな作品を制作した。多くの専門家はその作品は「本物の」芸術ではなく、その画家は何らかのチートをしたのだと主張した。
以上の画家はもちろん、17世紀半ばから後半にかけて活躍した伝説的なオランダ人画家、ヨハネス・フェルメールである。彼は鏡やレンズなどの「先端技術」を使って、光のグラデーションをうまく表現したのだろうか。このことは、長らく論争となっている。もしそうだとしたら、それは彼がチートをしたことになるのか、あるいは彼のキャンバスは彼の創作活動より劣っている何かなのだろうか。
フェルメールがその技術を使ったかどうかにかかわらず、今では誰もがフェルメールを芸術家であると同時に天才だと考えている。誰もが彼を天才と考えるのは、彼が人間の創造性の可能性を押し広げたからである。
この記事のタイトルを覚えている読者であれば、私がフェルメールを引き合いに出して次のような論旨を導こうとしていると察しているだろう。その論旨とは「画像生成AIエンジンがクリエイターの仕事を奪う」という騒動を正当化するのは、当時としては珍しい技術を使って傑作を描いた彼の業績を取り消すようなことだ、というものである。
さて、レンズを使って筆致を誘導することと、テキストプロンプトを使ってエンジンに他人のスタイルで何かを描かせることは、まったく同じことではない。しかし、芸術のための道具、あるいは「本物の」芸術との競争相手としてのテクノロジーに対する態度が時代とともにどのように変化するかを見るには、この例えは依然として役に立つ。
画像生成AIは、クリエイターにとって脅威なのだろうか。それとも、新しい種類の芸術を可能にし、私のような人々がより多くクリエイターエコノミーに参加できるようにするのだろうか。
今のクリエイターエコノミーで成功しているのは誰?
画像生成AIが良いか悪いかを考えるとき、この新技術が誰に影響を与えるかを考える必要がある。この場合、これは主にクリエイターやクリエイティブな人々に影響を与えている。こうした人々の集団は、この新技術から得るものがあるのだろうか。
一歩下がって、クリエイターエコノミー全体について考えてみよう。私はクリエイターエコノミーの熱心な参加者として、良い面も悪い面も知っている。
そもそも、私がコンテンツを作ることで生計を立てているという事実が素晴らしい。10年前なら、私のようなことをするのはもっともっと大変だっただろう。20年前なら、ほとんど不可能だっただろう。
クリエイターエコノミーは、クリエイターと視聴者の間の扉を開いた。YouTubeのようなプラットフォームは、人々がアート作品を作ることでリアルマネーを得ることを可能にした。クリエイターの1人としてファッション、女性らしさ、ポップカルチャーの交差点に関する動画を制作しているMina Leを見てみよう。Instagramでは、@watercolor_guideのようなアーティストがチュートリアルなどの動画を配信し、そのほかの動画も何百万人もの人々に届けられるようになった。こうしたことは、数十年前には実現不可能だっただろう。
これまで以上に多くのクリエイターが創作の機会にアクセスし、報酬を得られるようになった。視聴者はお気に入りのクリエイターを見つけ、彼らに創作の対価を払うプラットフォームを複数持っている。(食べ物の)シリアルの世界のトレンドについて語るポッドキャストの入手から、お気に入りのレズビアンネクロマンサーシリーズのファンアートの消費まで、視聴者たちは多様でニッチな欲求を持っている。
そして、アーティストでもなく写真もあまり撮らない人のために、謙虚なブログがある。もはや『The Atlantic』(※訳註1)のような一流の出版社に入社する必要はなく、自分の考えを発信できるのだ。TwitterやTumblrでマイクロブログを書いたり、Squarespace(※訳註2)などのプラットフォームを使って簡単に自分のウェブサイトを作ったり、Mediumに長文で自分の考えを投稿したりできるのが現代なのだ。
最も重要なのは、クリエイターにお金を払うという傾向が強まっていることである。10年間無料のコンテンツの時代が続いた後、視聴者とプラットフォームは私たちの素晴らしいコンテンツを作っている人々に実際に報酬を払い始めている。Substack(※訳註3)の購読、YouTubeの広告シェア、あるいはInstagram、TikTok、LinkedInのようなクリエイターファンドは、クリエイターに自分の仕事にはお金を払ってもらう価値があるという期待を抱かせている。
ここまでは、すべて順調だ。しかし、もちろん、コンテンツ制作の醜い側面もある。クリエイターエコノミーは、一貫性を求めるアルゴリズムを満足させるために、持続不可能なペースでコンテンツを投稿することを強いられるクリエイターのサブクラスを生み出してしまった(※訳註4)。
YouTubeが過剰な動画投稿を評価する2つの理由
|
以上のように不幸なクリエイターが誕生した一方で、Emma Chamberlainのような少数の(大きく成功した)例外を除いて(※訳註5)、コンテンツ制作者は金持ちになれるのだろうか。金持ちになったのはクリエイター自身ではなく、プラットフォームの所有者だ。例えば2021年時点で、YouTubeがクリエイターに支払った金額は累計300億ドルである(※訳註6)。しかし、2021年だけで、このプラットフォームは281億ドルの収益を自分たちのために生み出した(※訳註7)。
Business of Appsが発表した2021年におけるYouTubeの統計情報
さらに、コンテンツを視聴者に配信する責務を負うアルゴリズムにバイアスがあることもわかっている。TwitterとFacebookはヘイト、選挙の誤報、COVIDの誤報を広めたとして炎上を招いた。Instagramは自分たちのアルゴリズムが10代の少女の精神衛生に害を及ぼしていることを知りながら、嘘をついていたことが発覚した。
このような背景を踏まえ、画像生成AIによるコンテンツ生成は、意欲的なプロのクリエイターが他の人の収益を損なわない方法で、新たな収益の可能性を引き出すのに役立つだろうか。それとも、今日のアルゴリズムに影響を与えていることがわかっているバイアスをさらに高めながら、大規模かつ高速で生産されるコンテンツを過剰なまでに求める現状と同じサイクルにAI生成画像は投入されるのだろうか。
私の考えでは、画像生成AI技術は現在のクリエイターエコノミーが直面している問題を解決するものではなく、いくつかの新しい問題を導入する ― この問題については後で詳述する。しかしながら、コンテンツ制作の新しい道を切り開くものでもある。そして近年、労働者たちに導入された多くの自動化・AIツールと同様に、画像生成AIはクリエイターの生活をより快適にする可能性を秘めている。
また、これらの画像生成AIを作っている人たちは、この技術がクリエイターに力を与えるものだと考えていることも特筆すべき点だ。
「AI技術は、コンテンツ制作に関してその強力な能力を証明しています。」とLightricksのCEO兼共同創業者であるZeev Farbmanは、最近TechCrunchに語った(※訳註9)。
また、Farbmanは「当社のアプリに直接『画像生成』機能を実装することで、ユーザの可能性が広がり、素晴らしいコンテンツ制作の機会が無限に広がります」とも述べている。
例えば、私はアーティストではないので、ブログの挿絵になるような画像を探すのに苦労することがよくある。そんなときAIを使えば、私が欲しいものを表現した、まったくユニークな画像を新たに生成できる。この場合、AIによって増強されたのはまさに私だ。
以上の事例を逆側から見ると、私が今までブログの挿絵を挿入する時にしてきような、Pexelsのようなストック画像サイトから無料画像をダウンロードし、ダウンロード元へリンクを貼ることによるアーティストへの支援をもはやしないことを意味する。
現在Getty Imagesのストック画像にアクセスするために購読料を支払ったり、写真撮影のためにフリーランサーを雇ったりしている企業を想像してみよう。近い将来、このような企業はAIによる画像生成にお金を払うだけで、こうした作業を省略できるようになるかも知れない。
これまでクリエイターの懐に入っていたお金が、ネット上の画像を(ほとんどの場合、無許可で)かき集め、そうした画像にもとづいてアルゴリズムを構築した画像生成AI開発企業の懐に入っていくのだ。
ちょっと待って ― 画像生成AIはもう試してみたか?
生成系AIが流行り始めた1年くらい前、私は怖くなった。私は書くことを生業としている。小説家になりたいとも思っている。JasperやShortlyai(※訳註10)のようなツールは、私の生活や自分の技術に対する誇りを脅かすものだと感じた。もし、ロボットが私と同じことをできるようになったら、書くことに何の意味があるのだろうか。
私は宿敵と対峙すると決意し、AIテキストジェネレーターで架空の恋愛ストーリーを作成した。固唾を飲んで「ストーリー生成」ボタンを押した。
それはひどいものだった。笑えるほどひどいものだった。AIが生成した文章にはこんな一節があった。
彼女は彼の巻き毛を引っ張り、彼に跨った。彼はポケットを漁り、小さな石を取り出した。「これは晶洞石だよ。中に化石が入ってる石だよ」と彼は言った。
笑ってしまった。
私はAIで作られた華麗なアートワークを見たことがある。しかし、実際に自分の思い通りのものを作ろうとしたことはあるだろうか。私が試した時は、AIにブログの草稿を書かせようとした時と同じくらい苦労した。
Photoleapアプリを使い、このブログ記事で使うのにふさわしい画像を探す過程で作成した画像事例を以下にいくつか紹介したい。
以上のすべてはOKだろうか。こういう技術で豪華なものを作れるのは分かっているのだが、私にはできなかった。いろいろな言葉を組み合わせて、AIに任せるだけでは充分ではないのだ。AIが美しいものを作れるようにするには適切なテキストプロンプトを作成する技術、創造性、芸術性が必要なのである。また、これらの画像は目を引き、技術的に優れているかも知れないが、本当の意味で芸術であるとは言えないと私は主張したい。私にとっての芸術とは、感情を喚起するものである。これらの作品は、「本物の」アート作品を読んだり、見たり、消費したりしたときほど、強く私に訴えない。
ネット上で人間が作ったプロンプトからAIが生成した本物のアート作品を見たことがあるので、AIによって生成されたアート作品があり得ることはわかっている。しかし個人的には、私が油絵のアート作品や楽曲を作れないように、私にはAIでそのようなアート作品を作れないと思っている。
(AIと人間が共創した)好例は、コスモポリタン誌で初となるAIによる表紙デザインに協力したKaren X. Changの取り組みである。ツイートに添付された動画を見れば、彼女が作ったものが創造的でない、芸術的でないとは誰も言えないだろう。彼女はただ、AIの助けを借りただけなのだ(※訳註11)。
I used @OpenAI #dalle2 to create the first ever AI-generated magazine cover for @Cosmopolitan!! The prompt I used is at the end of the video #dalle pic.twitter.com/sbM2qbTAbq
— Karen X. Cheng (@karenxcheng) June 27, 2022
なお、コスモポリタン誌の表紙の生成に使われたプロンプトはツイートに添付された動画の最後に記載されており、それは「無限に広がる宇宙の中の火星で、女性らしいしなやかな体つきの女性宇宙飛行士がカメラに向かって堂々と歩く姿を下から広角で撮影したシンセウェイヴデジタルアート(A wide angle shot from below of a female astronaut with an athletic feminine body walking with swagger towards camera on mars in an infinite universe, synthwave digital art)」というものだった。
それでは、私はAIにどのような成果を期待しているのか。私は、AI生成アートがAI生成テキストと同じように使われることを期待している:つまり、スキルを持った誰かが画像生成AIを監督する必要があるのだ。AIを使えば、誰でも1万件のひどいブログ記事を作成できる。その一方で優れたライターや編集者だけが、AIを使って読者に情報を提供したり、楽しませたりすることができる優れた1本の記事を作れる。AIによる画像生成についても、おそらく同じことが言えるだろう。
企業の話に戻るが、私は企業が(プロンプトエンジニアリングという)この特殊なスキルに秀でたスペシャリストを採用することを期待している。デジタルマーケターがFacebook広告のコピーのA/BテストにInk For AllなどのAIツールを使ったり(※訳註12)、Ai AbdaalなどのクリエイターがLexなどのAIツールを使ってツイートを生成(※訳註13)したりするように、企業はAIをコンテンツの代替品ではなく、ツールとして活用するようになるだろう。
VentureBeatに寄稿したKlaviyo社のRobert Huselid氏とTom Dinitz氏はこの意見に賛同し、人間とAIとのコラボレーションに大きな可能性を見出しているようだ。
「画像は…生成されたものとして、さらに編集するための出発点を与えるために、ブレインストーミングを助けるために、グラフィックアーティストにアイデアを伝えるために、クリエイティブで効率的なA/Bテストを行うために、そして今日ではアーティストにしかできなかった幻想的なアイキャッチ画像を作成するために使用できます。」
私は新しいタイプのクリエイターの出現を期待している。文章を書いたり、写真を撮ったり、絵を描いたり、ビデオを撮ったりして、まだ自分の得意分野を見つけていない人が、この(プロンプトエンジニアリングという)新しい創作活動で自分の才能を発見するかも知れない。
真の懸念が存在する
画像生成AIによってクリエイターが追い出されるのではないかという懸念は脇に置いたとしても、AIの領域がまだ規制されていないこともあり、未解決の現実的な問題がある。
そもそも、ほぼすべての画像生成AIモデルは、同意を得ずに収集したしたアート作品で訓練されている。「Stability AI は確かに、その学習データから著作権で保護された作品をフィルタリングしていない。その結果、Stable Diffusionが存命のアーティストのスタイルや美学を模倣する能力は、潜在的に著作権だけでなく倫理にも違反する可能性があり、こうした能力を擁護できないと見なす人が多い」とThe VergeのJames Vincentは書いている(※訳註14)。
以上の状況についてStable Diffusionの開発元Stability.AIのCEOであるEmad Mostaque氏は、少なくとも現状ではイギリスとアメリカでは著作権が保護されている画像のスクレイピングは合法、と答えている。
以上の問題の解決策は、私が思うにアーティストの作品がモデルの学習に使われた時に、アーティストにお金を払うという単純なものである。誰かがAIにアーティストの画風を再現するよう依頼するたびに、そのアーティストは少額のロイヤリティを得られるようにするのだ。
しかし、それ以外にも問題がある。制限や規制がないため、これらの画像エンジンが何を生成できるのか、ほとんど監視されていない。誰でも自分の好きな有名人の頭を裸のモデルにつなげるようにphotoshopで加工できるが、画像生成AIはそうした行為を大規模に行う可能性を提供する。
国際プライバシー専門家協会の報告によると、おそらく最も有名なジェネレーターであるDALL-Eの開発者は「偽情報の作成を防ぐために、ユーザにセレブリティや政治家の画像を複製することを許可していない」(※訳註15)。しかし他の画像生成AIに対しては、それを禁止する法律は ― まだ ― ない。ゆえに規制が必要である。
最後に、現在のソーシャルメディアシーンを悩ませている問題は、画像生成AIにも影響する。アルゴリズムにバイアスがあるのだ。有名なのは、DALL-Eがこの問題と格闘したことである。人種差別的、性差別的な画像を生成し続けたことで非難を浴びた後(例えば、「科学者」というプロンプトに対する画像はほとんど常に白人で男性)、開発者はアルゴリズムをアップデートしたと主張した。しかし、彼らが行ったのは、ユーザが作成したプロンプトの一部に「女性」や「黒人」を無言で追加するだけであった。
この最後の問題は、人間の監視と意思決定の必要性が高まっていることを示唆していると私には思われる。AIにはバイアスがかかっている。人間にもバイアスがあるが、それを克服し、より適切な画像を生成できるように努力することは可能である。
新しい技術、同じ議論
テクノロジーがクリエイターに取って代わるかどうかという議論は、何百年も前から続いている。テクノロジーが進歩するたびに、人々はそれに文句を言う一方で、クリエイターはそれを採用し、新しい芸術を生み出すためにそれを利用してきた。
15世紀、人々は印刷機に対して懐疑的だった。19世紀には、絵画が写真によって失われるのではないかと心配された。最近ではデジタルアートは本物のアートなのか、photoshopは本物のアートなのか、といったことが議論されている。
以上のような議論の度に「このクリエイターの作品はテクノロジーによって無効になるのか」という問いに、クリエイターはその新しいテクノロジーを使って、より多くの作品を作ることで答えを出してきた。新しいテクノロジーが登場した時、それは「古い」やり方を打破しようともがくクリエイターを脅かすものではなかった。むしろ新しいテクノロジーは、(フェルメールのように)既存のクリエイターが驚くべきことを達成することを可能にし、写真や印刷機のように、全く新しいクリエイティビティの道を切り開いたのだ。
私の考えでは、画像生成AIはクリエイターエコノミーを増強するものであり、破滅させるものではない。クリエイターの仕事への報酬支払いや、アルゴリズムがバイアスを永続させないようにすることなど、(かつてテクノロジーが提起したようなものと)同じ問題が画像生成AIにも存在する。しかし、AIを搭載したものもそうでないものも含めて、これまでのほぼすべての新しいテクノロジーの進歩と同様に、画像生成AIは既存のクリエイター、そして潜在的には新しいクリエイターにも機会を与えることを約束するものなのだ。
・・・
フェルメールについて教えてくれたJeff Echtに感謝します。彼の記事をもっと読みたい方は、画像生成AIを題材にした以下の彼の記事を強くお勧めします(※訳註16)。
・・・
もし、このようなストーリーを読むのが好きで、作家としての私をサポートしたいと思われるなら、Mediumのメンバーになることを検討してください。月額5ドルで、Mediumのストーリーに無制限にアクセスできます。私のリンクからサインアップしていただくと、私はMediumから少額の手数料が頂けます。
原文
『Is Text-to-Image AI Empowering the Creator Economy or Dooming it?』
著者
Zulie Rane
翻訳
吉本幸記(フリーライター、JDLA Deep Learning for GENERAL 2019 #1取得)
編集
おざけん