2024年における生成AIの現状

最終更新日： 2024年6月27日

スペイン在住のAI技術批評家アルベルト・ロメロ（Alberto Romero）氏がMediumに投稿した記事『2024年における生成AIの現状』では、現在進行する生成AIの普及を歴史的に解釈しています。

近年の生成AIの動向は目を見張るものである一方で、その進化が減速しているのではないかと思われる報道も見られます。こうしたなか、ロメロ氏は生成AIに関するネガティブな側面とポジティブなそれの両方をまとめています（詳細は翻訳記事本文参照）。
ポジティブとネガティブがない交ぜとなっている生成AIの状況について、ロメロ氏は黎明期にありがちな熱狂が冷めて、静かに進化と普及が進む「小康状態」にある、と診断します。
小康状態にある生成AIを考察するには、過去に起こった技術革命である印刷機、電気、インターネットの歴史が参考になります。これらは、時間をかけて普及して世界を変革しました。同じように、生成AIも小康状態を経て世界を変革することが期待されます。
しかしながら、ロメロ氏は生成AIに関する懸念点も指摘します。最近、OpenAIのアルトマンCEOをはじめとしたAI企業のトップたちは、（「空に浮かぶ魔法の知性」のように）生成AIを大胆な表現で評しています。こうした評価は冷静なものというより、発言した彼ら自身を納得させる自己暗示的なものとも見えます。そして、あまりに大胆に生成AIを評価すると、それが裏切られた時の幻滅が大きくなります。
ロメロ氏自身は、生成AIの正しい歴史的評価には時間を要する、とだけ述べています。

以下の翻訳記事本文では、読み易くするために原文記事にはなかった見出しを追加しています。

なお、以下の記事本文はアルベルト・ロメロ氏に直接コンタクトをとり、翻訳許可を頂いたうえで翻訳したものです。また、翻訳記事の内容は同氏の見解であり、特定の国や地域ならびに組織や団体を代表するものではなく、翻訳者およびAINOW編集部の主義主張を表明したものでもありません。
以下の翻訳記事を作成するにあたっては、意訳やコンテクストを明確にするための補足を行っています。

ニュアンスに富んだ分析と未来を垣間見る
この記事は、AIと人間の橋渡しをする教育プロジェクト「The Algorithmic Bridge」からの抜粋です。

・・・

最近のAI業界におけるネガティブなニュース
最近のAI業界におけるポジティブなニュース
AIは「小康状態」を迎えている？
小康状態におけるAIの懸念点
AIは歴史的発明なのか、それとも忘れ去られる技術なのか？

最近のAI業界におけるネガティブなニュース

ニュースを見ていると、木を見て森を見ずになってしまいがちだ。証拠が散乱しているので、一箇所に集めてみよう。

AI業界における成長率、売上高、利益率は思ったほど大きくない。AIサイトへの訪問は停滞している（※訳注1）。VC企業のセコイアは、2023年に企業はNVIDIAのハードウェアに500億ドルを費やしたが、30億ドルの収益しかもたらさなかったと推定している。AIスタートアップのバリュエーション（※訳注2）は、本来あるべき水準よりもはるかに高くなっている。粗利率の低さから利益への疑問が生じ、クラウドプロバイダーは期待値を下げている。
知名度の高いAIスタートアップは失敗し始めている。例えば、資金力のある民間のAIモデル開発会社が解体されることになった。Microsoftは元CEOのムスタファ・スレイマン（Mustafa Suleyman）を含め、散らばったAIスタートアップの破片を拾い集めている（※訳注3）。創業者エマド・モスタク（Emad Mostaque）の失脚後（※訳注4）、Stability AIの将来は、控えめに言っても不安定だ。
企業はAIのセキュリティに疑念を抱き（※訳注5）、実装にも疑念を抱いている。OpenAIのGPTストアは大失敗だった。最初の関心の火花の後、人々は飽きてきている。New York Timesのジャーナリストであるエズラ・クライン（Ezra Klein）は、日々の仕事でこの技術をどのように使えばいいのかわからないと言っている。エコノミストのタイラー・コーエン（Tyler Cowen）は、彼の仲間の学者の間でツールの使用は「停滞した」と言う。専門家たちは、AIツールは「楽しい気晴らし」にはなるが、役に立つわけでも生産性を向上させるわけでもないと考えている（AIを使ってうまく行っても、いつもうまく行くわけではない（※訳注6））。
最後に、ほとんどの人は気にしていない。一般ユーザはChatGPTのことは知っているが、それ以外は知らない。一般ユーザの大多数は時代遅れのGPT-3.5を使っており、GPT-4、Gemini、Claude 3などのより良い後継のモデルに数ドルで乗り換えようとはしない。そのような人たちの中で、悲しいことに最も価値を得ているのは不謹慎な人たちであり、そんな人々が人間やインターネット（※訳注7）、そして私たちの文化を害している。

（※訳注1）イギリスの起業家アジーム・アズハル（Azeem Azhar）は2024年3月29日に投稿したsubstack記事で、2024年1月におけるChatGPTへの月間アクセス数が6か月前とほぼ同じことを指摘した。その理由として、同AIのユーザインタフェースが一般ユーザにとってはまだ難しいからではないか、と論じている。

近年の主要AIチャットボットの月間アクセス数推移

（※訳注2）バリュエーションとはある時点における企業価値指標のこと。この指標と企業の株価などを比較すると、株価が割安か割高か判断できる。

（※訳注3）ムスタファ・スレイマンは2010年にDeepMindを創業し、同社がGoogle傘下となった後、2022年にGoogleを退社してAIスタートアップのInflection AIを創業した。Inflection AI は2023年6月に40億ドルと評価され、13億ドルの資金調達に成功するも、2024年3月、スレイマンは同社を退社してMicrosoftに入社した。

（※訳注4）Stability AIを創業したエマド・モスタクは2024年3月23日、「分散型AIを追求するため」同社CEO職と取締役を辞任した。

（※訳注5）テック系メディアdiginomicaは2024年3月27日公開記事で、PagerDuty作成のレポートを紹介している。そのレポートによると、技術部門の幹部98%が生成AI採用の全社的取り組みは一旦中断してポリシーを策定しており、50％が企業の評判に生成AIがもたらすリスクについて懸念している、も回答した。

（※訳注6）テック系メディアThe Registerは2024年3月28日、GPT-4のハルシネーションを調査した記事を公開した。その調査によると、同AIに対してプログラミングに関する多数の質問をしたところ、24.2%の回答において存在しないパッケージ名を回答し、その回答で出力された存在しないパッケージ名を19.6%の回答で繰り返していた。こうした存在しないパッケージ名をマルウェアの名前に利用すると、このマルウェアを誤ってダウンロードする可能性がある。

（※訳注7）この記事の著者ロメロ氏は2024年2月6日、Substackサイトに『生成AI、あるいはブルシット（ごみ）としてのサービス』と題した記事を投稿した。この記事では、生成AIを活用した低品質なウェブ記事、偽情報や偽画像の氾濫を嘆いて、こんな愚行を犯す人間を「宇宙を理解した猿」と表現している。
なお、低品質なウェブ記事の氾濫についてはAINOW翻訳記事『AI企業は人間が作ったデータを使い果たした。彼らは今、AIを使ってより多くのものを作ろうとしている』、偽画像についてはAINOW特集記事『闇市場も誕生したフェイク画像をめぐる現状と対策まとめ』を参照のこと。

以上は生成AIが失敗していることを意味するのだろうか。そうかもしれないが、必ずしもそうではない。

最近のAI業界におけるポジティブなニュース

AIの現状について、公平な立場で考えてみよう。

AIに対するメインストリームの関心は低下しているが、AIバブルはいまだに何十万人もの読者に毎日最新情報を共有している（このニュースレターを含め、ニュースレター全般は速いペースで増え続けている）。Google DeepMindのデミス・ハサビス（Demis Hassabis）CEOのようなビッグネームが非難しているような誇大広告も鈍化している。バリュエーションは収益や期待値に応じてより合理的になっている。これらは、すべて良いニュースだ。
あるタスクに特化した生産性向上は現実のものとなっている（※訳注8）。ほとんどの知的労働者はChatGPTを使わなくなったかもしれないが、全体的には1年前と比べてより多くの人がChatGPTを試しており（※訳注9）、生産性を向上させる方法を見つけた人たち（主にプログラマー）は大きな報酬を得ている。
私たちは数ヶ月ごとに新しい最先端モデルを手に入れる。Anthropicは3月上旬にClaude 3を発表し、最近LMSys Chatbot Arenaで初めてGPT-4を上回った（※訳注10）。おそらくOpenAIのGPT-5、Appleの新しいSiri、MetaのLlama 3（※訳注11）、GoogleのGemini 1.5 Ultra、xAIのGrok 2など、夏にはさらに多くのリリースが予定されている。
先週だけでも3つの画期的な発表があった。DatabricksのDBRXはこれまでで最高のオープンソースモデルであり、AI21 labsのJambaは最高品質の（斬新なアーキテクチャを持つ）SSMトランスフォーマーであり、そしてOpenAIのVoice Engineは15秒の音声でリアルなカスタム音声を生成する音声合成モデルである（※訳注12）。
そして、AIモデルを可能にする研究の絶え間ない流入や、NvidiaのBlackwellプラットフォーム（※訳注13）、MicrosoftとOpenAIが今後数年で建設を計画している1億ドルのスーパーコンピューターのストレージのような、AIモデルの訓練と実装を可能にするインフラプロジェクト（ハードウェアとデータセンター）も忘れてはならない。

（※訳注8）経済メディアCNBC Make itは2023年4月25日、スタンフォード大学とMITのAIと労働に関する調査を紹介した。5,179人のカスタマーサービスに従事する労働者を対象としたこの調査によると、生成AIアシスタントを導入することで問題解決数が14%上昇し、とくに低スキルの労働者の成果は34%上昇した。一方で熟練労働者の成果には影響がなかった。

（※訳注9）アメリカの調査機関Pew Research Centerは2024年3月26日、アメリカにおけるChatGPTの利用状況に関する調査結果を発表した。その結果によると、アメリカの成人におけるChatGPTの利用率は2023年7月では18%だったのに対して、2024年2月では23%に上昇している。18～29歳については33%から43%に上昇している。こうした上昇は、仕事、学習、エンタメというさまざまな用途において確認された。
また、ChatGPT利用率を学歴別に見ると、大学院卒が37%、大卒が29%、高卒以下では12%であった。

アメリカ成人におけるChatGPT利用率の推移

アメリカ成人における用途別に見たChatGPT利用率の推移

（※訳注10）2024年5月1日版のChatbot Arenaランキングは、以下の画像の通り。GPT-4 Turboが1位に返り咲き、Llama-3が6位にランクインした。

2024年5月1日版のChatbot Arenaランキング

（※訳注11）Metaは2024年4月18日、パラメーター数が80億と700億のLlama 3を発表した。そして、今後数ヵ月以内により長いコンテキストウィンドウとより大きなサイズのモデルと、Llama 3の研究論文を発表する予定としている。ちなみに、原文記事は2024年4月4日に公開された。

（※訳注12）Voice Engineについては、AINOW翻訳記事『OpenAIの新しいAI音声モデルはどんな人の声のクローンを作れる危険性がある』を参照のこと。

（※訳注13）NVIDIAが発表したコンピュータアーキテクチャBlackwellと同製品を発表したGTC2024については、AINOW特集記事『基調講演だけではない。OpenAI、Microsoft、Metaもビジョンを語ったGTC2024セッションまとめ』を参照のこと。

AIは「小康状態」を迎えている？

この2つの対照的な構図は、どうして同時に起こるのだろうか。

前出のタイラー・コーウェンは、歴史に裏打ちされた予測で以上の矛盾を調整する。「AIの誇大宣伝は沈静化したが、革命は続いている」と彼は主張する。その主張によれば、AI業界に広がる最初の光景は瀕死の誇大広告であり、こうした光景になるのは糧を得る以上の注目を集め、得られる見返り以上の投資を集めた新技術がたどる自然な展開である。続いて現れる第2の光景は、コーウェンが言うところの静かで隠れた「小康状態」である。業界外からの視線を集めるか集めないかには無関心で、収益ではなく（AIモデルの）出力に焦点を当て、絶え間なく前進する。

コーウェンは、AI革命が根拠のない希望から続くとは主張していない。彼の主張には、AI革命が過去のテクノロジーと同じように、誇大宣伝、沈静化（私たちはこの段階に入りつつある）、そして革命というステップを踏むと仮定される、という理由がある。こうした楽観論が世間に轟くかどうかどうかは別の問題だが、彼は生成AIと最もよく比較される3つのイノベーション、すなわち印刷機、電気、インターネットから的確に類推することを惜しまない。以下に彼の言葉を引用しよう。

どんな革命的な技術にも、結局はそれほどエキサイティングではないと感じる時期がある。ドットコムの大暴落は2000年に起きたが（※訳注14）、それ以前からオンライン商取引は明らかに低調だった。そのわずか2年前、ポール・クルーグマン（※訳注15）は、インターネットは過大評価されているのかもしれない、と指摘していた。1998年当時、彼は完全に間違っていたわけではなかった。

さらに遡って、19世紀に工場に電気が導入された時のことを考えてみよう。この時期から数十年間、発電機構の進化のために何度も試行錯誤が繰り返された。印刷機は、15世紀半ばにグーテンベルクが発明した直後よりも、より安価な技術と紙のおかげで、17世紀のヨーロッパにはるかに大きな影響を与えた。

（※訳注14）ドットコム・バブルはインターネット・バブルと呼ばれ、1990年から2000年頃までに起きたアメリカのインターネット関連企業の株価高騰と暴落を意味する。2000年3月10日にはハイテク銘柄が多いナスダック総合指数が5048を記録したが、アメリカ同時多発テロ事件を経た2002年には1000台にまで下落した。

（※訳注15）ポール・クルーグマンはアメリカの経済学者。2008年ノーベル経済学賞を受賞した。

生成AIも同じような展開になる可能性がある。初期には混乱と熱狂が入り混じり、それから無関心が続き、結局のところ、最後には復活する。大衆のAIへの礼賛が、当然のようにしばしのあいだ失われたからといって、それを取り戻す必要があるだろうか。新世界を築くのは誇大広告やコンセンサスではなく、みんなが他のことに向かっている間に、静かに進歩を見守る人々の仕事なのだ（たとえ200年後、より安い紙のように、彼らが予見できなかった「無関係な」技術革新のおかげで、はみ出した果実を得ることができたとしても）。

コーウェンはこの見通しを支持する証拠を示し、「生成AIとLLMはうなぎ登りに進歩し続けている」とさえ主張している。彼はOpenAIの企業向けサービスや、Google開発のGPT-4の競合モデルについて言及し、そして最も重要なこととして「オープンソースのAIモデルは、カジュアルユーザのほとんどが気づいていないとしても、急速なペースで進化している」と言う。

さて、遠い歴史を振り返って希望を持ち続けることはできるが、コーウェンが選んだ例は最も有利な証拠ではないかもしれない。冒頭で述べたように、企業はAIについて確信を持っていないし、確信を持っている企業でも、その多くはAIを採用するのに苦労している。GoogleのGemini Advancedは大失敗で（※訳注16）、あるべき姿ではなかった。技術的な参入障壁があるため、ユーザはGPT-4やClaude 3のようなすぐに使える最高の製品よりもオープンソースに関心がなく、時代遅れのGPT-3.5ベースのChatGPTと比較すると、一般ユーザが体験するAIの進化はゼロに等しい。

（※訳注16）ロメロ氏は2024年2月23日、自身のSubstackサイトにGoogle Geminiの画像生成問題を論じた記事を投稿した。Geminiは人間の画像を生成する際、人種を現実とは異なって描画する傾向があった。例えば、白人であるGoogle創業者をアジア系男性として生成する。この傾向を修正するまで、Geminiの画像生成機能は使用停止となった。この問題については、AINOW翻訳記事『GoogleがAIゲームに負けている理由』の見出し「苦戦するGoogle、1歩先行くOpenAI」も参照のこと。

Ah, yes, famous Google founders Larry Pang and Sergey Bing pic.twitter.com/pCs7uVSBGU

— Circe (@vocalcry) February 21, 2024

希望が繰り返し萎んでいるのは、誇大広告が沈静化しただけでなく、革命そのものも沈静化しているという紛れもないサインではないだろうか。

繰り返すが、そうとは限らない。

コーウェンは私たちの期待を維持するための証拠を提供するのに失敗しているようだが、そう思われるのは彼の記事が8ヶ月前のものであり、成功も失敗も含め、この分野はあまりにも速く進むからだ。私は上記の2番目の大きな段落で、私自身の「希望に満ちた」証拠を提供した。今から8カ月後にも、希望を抱かせる証拠を提出することになるのだろうか。おそらくそうなるだろう。しかし、そうなれば、また新たな希望を抱かせる筆致を数本提供することができるようになり、このサイクルを繰り返すことになる。もしこのようなことが続くのであれば、コーウェンのテーゼは部分的に正しいことになる。私たちは今、高揚感の低い「興奮しない」段階にいる。この分野の開発は、ほとんどの人のレーダーの下を通り過ぎるだろうが、それでも進歩は続くだろう。誇大広告の段階はとうの昔に過ぎ去ったが、それでも進歩は続く。

現時点の限られた視野からでは、生成AIの革命性を証明することも反証することもできないだろう。生成AIの革命性については、歴史的にはるか未来からの後知恵から見られる中立的で合理的な光景のみが、真実を明らかにしてくれる。（印刷機の革命性に関しては）グーテンベルクにはできなかったことだが、後世の私たちは印刷機の発明と、本の大規模な印刷という印刷機の有用性が実現するまでのあいだに200年の隔たりがあったと自信を持って主張できる。

私たちが得られる楽観的な結論は、印刷機、電気、インターネットがそうであったように、誇大広告でない落ち着いた段階が、必要な隣接作業（技術的、社会的、倫理的作業）を可能にするということである。

小康状態におけるAIの懸念点

生成AIに関連するいくつかの疑問は、この新しい段階における生成AIのあり方について現在および今後にするべき議論を再構成し、理解するのに役立つ。

誇大広告の段階はまだ完全に克服されたわけではないが、誇大広告がAI業界とその根底にある工学的・科学的努力にどれほどの弊害をもたらしたのだろうか。生成AIを可能にする業界人が（誇大広告による大衆の支持といった）外部性についてあまりに無関心である場合、果たして世間は生成AIを諸手を挙げて受け入れてくれるだろうか。世界は、AIの指数関数的な成長のなかで抱いた「AI業界人は始めにAIに興味を持たせ、実際にAIから成果を得るのは後だと言った。ゆえに、成果を得るのは今だ」という幻想や、さらに質が悪いことに「AI業界人は私に嘘をつき、傷つけた。今さら信じろというのか」という文句から決別しようとしているのだろうか。

高い期待は短期的には大いに役立つが、信頼との危険なトレードオフを伴う。期待の飽和という転換点があり、それを超えると誇大宣伝は将来の努力を妨げ、永遠に期待を汚すことさえある。

もうひとつ、教訓となるべき疑問がある（教訓にはならないかもしれないが）。それは、GPT-3以来、私が自問自答してきたことだ（特にAI企業幹部がメディアと共有してきた大げさな主張のせいで、その行動はChatGPT後にピークに達した）。

生成AIは、それだけで十分に驚くべきものであるのではなかろうか。そうであるにもかかわらず、この分野が荒唐無稽な約束や誇大な物語を実現できないと確信するやいなや、AI企業幹部とメディアが生成AIの能力を誇張しなければならなかったのだろうか。

生成AIがそれほど素晴らしく偉大なものであるならば、サム・アルトマンがOpenAIの最終目標は「空に浮かぶ魔法の知性」であり、ポスト欠乏世界の始まりだと言う必要が本当にあったのだろうか（※訳注17）。あるいは、（Google CEOの）スンダー・ピチャイがAIは「火や電気よりも重要」だと言う必要があったのだろうか。あるいは、（Microsoft CEOの）サティア・ナデラが、生成AIは1995年にインターネットが感じたのと同じくらい大きいと感じていると言うだろうか。あるいは、イーロン・マスクがAIは「歴史上最も破壊的な力」になりうると言っただろうか。あるいは（NVIDIA CEOの）ジェンスン・フアンが、プログラミングを学ぶことは賢明なことではないと言うだろうか。

（※訳注17）アルトマンが2021年3月16日に発表した論考『万物のためのムーアの法則』では、AIの進化がもたらす社会の変容について論じている。アルトマンによると、AIの進化が進展するにつれて、あらゆる製品やサービスの生産コストがゼロに近づき、現在より物質的に豊かな社会が実現可能となる。こうした「ポスト欠乏社会」においては、国民と国家の関係を株主と企業の関係のように改変することで、国民は国家から配当金、すなわちベーシックインカムが支払われる、とされる。

もし彼らがそのような言説を必要とするのであれば、根本的な現実は彼らが主張するほど説得力がないため、彼ら自身が自分たちを説得せざるを得ないということではないだろうか。

今日、私はまだ納得のいく答えを持っていない。

AIは歴史的発明なのか、それとも忘れ去られる技術なのか？

最後に、誇大広告やその他の感情的な反応はさておき、私たちが最終的に直面することになるより広い問題は次のようなものである。自分たちの信念のもとに黙々とAIを構築している人々は、それが印刷機や電気、インターネットのような革命と呼ばれるに値することを証明できるだろうか。それとも、誇大宣伝が一段落した後、再び盛り上がることのない忘れ去られた技術の山に埋没してしまうのだろうか。

以上のような疑問は、時間が解決してくれるだろう。

中世の農民たちは印刷機の発明に立ち会ったが、その恩恵に浴するのに200年経過する必要があったので、彼らはその恩恵を知らずに終わった。生成AI時代に生きる私たちが中世の農民のようにならないことを祈ろう。中世の農民たちは、技術革新の遅さに反応するための情報を何も持っていなかったが、21世紀の私たちはそれほど寛容ではないし、革命になるであろうものにお金を払う人々はさらに非寛容である。ありがたいことに、AIの伝道者たちが主張するように世界が急速に進歩すれば、AIによる新世界の到来までそれほど時間はかからないはずだ。

原文
『The State of Generative AI, 2024』