最終更新日:
目次
はじめに
ChatGPTをはじめとする生成AIの急速な普及に伴って、AIが地球環境に与える影響が大きくなりつつあります。というのも、生成AIの開発と運用には大量の電力と水が消費されるからです。
そこで本稿ではこうした「AI環境問題」について、この問題に関する研究の動向、AIが地球環境に与えるネガティブおよびポジティブな影響、具体的な改善策をまとめたうえで、3つの提言を示します。
注目されるAI環境問題
AI環境問題に関する研究はAIモデル研究に比べると後発ですが、近年急速に注目されるようになりました。その一方で、後発研究分野がゆえの課題もあります。以下では、AI環境問題の動向を調査した論文を紹介することで、この研究分野の情勢をまとめます。
2018年以降に注目度急上昇
ドイツ・ボン大学の研究チームは2023年7月31日、『持続可能性のためのAIへの挑戦:それは何を意味するのか?』と題した論文を発表しました。この論文ではAI環境問題への関心の高まりを実証するために、科学論文に関するデータベースであるWeb of ScienceとScopusを対象として「持続可能なAI」をキーワードとして含む論文数を調査しました。その結果、約6,700本の論文が検出されました。
研究チームは、検出された論文の本数を2000年から2022年の範囲で折れ線グラフにしました。グラフ化すると2016年までは年間100本程度の発表だったのですが、2017年に200本発表されてからは年々増えていき、2018年には指数関数的な増加となりました。そして、2022年には年間2,000本発表されるようになりました。
もっとも研究チームは、「持続可能なAI」という表現は「地球環境の持続可能性を実現するためのAI」と「AIシステムの持続可能性」のふたつの意味があることに気づきました。このふたつの意味のうち、AIが地球環境に及ぼす影響の研究を意味しているのは前者です。こうした調査から「持続可能なAI」という表現の内実に注意すべきことを指摘しています。
産業界への応用は道半ば
AI環境問題にまつわるワードには「持続可能なAI」のほかに「グリーンAI」もあります。イタリア・フィレンツェ大学らの研究チームは2023年5月5日、『グリーンAIの体系的レビュー』と題した論文を発表しました。この論文ではGoogle ScholarやScopusといった科学論文データベースを対象として、「持続可能なAI」や「グリーンAI」を論じた論文を検索・抽出しました。さらに内容も精査したうえで最終的に選定した98本の論文について、その内容の体系的レビューを実施しました。
主要テーマについてはモニタリングを論じているのが28本、ついでハイパーパラメータチューニングが18本、モデルベンチマークとモデル比較が17本となっていました。これらの上位4つで全体の61%を占めています。
AIシステムにおいて電力を消費するフェーズには、開発時の「訓練」と実装後の「推論」があります。抽出したグリーンAI論文群では「訓練」がもっとも論じられており、ついでフェーズ全般、そして推論となっています。このような結果になったのは、AI開発における訓練で多大な電力を消費することが周知されているからだと考えられます。
AIシステムの構成要素にはアルゴリズム、学習データ、パイプライン等があります。これらのなかでもっとも論じられているのはアルゴリズムの63本であり、ついでシステム全般の24本、データの8本でした。
抽出グリーンAI論文群の著者を調査すると、学会関係者のみで書かれた論文が75本、学界関係者と産業界関係者の共著が20本、産業界関係者のみで書かれた論文が3本でした。この結果は、グリーンAIに関する研究がまだ産業界に波及していないことを示唆しています。
以上の2本の調査論文から、AI環境問題に関する研究は近年注目されており、訓練やアルゴリズムといったAIシステムの核となる部分と環境負荷の関係がさかんに研究されていることがわかります。その一方で、研究成果の産業界での活用はあまり進んでいないようです。
環境に対するネガティブインパクト
AIシステムが環境に与えるネガティブなインパクトには、これらのシステムの開発と運用に伴う大量の二酸化炭素排出、電力消費、そして水消費が知られています。以下ではとくにLLMから生じる環境負荷に関して、さまざまな報告をもとに考察します。
多大な二酸化炭素を排出するLLM
アメリカ・スタンフォード大学の研究組織HAI(Human-Centered Artificial Intelligenceの略称)が2023年4月3日に発表した『AI Index Report 2023』には、LLMの二酸化炭素排出量に言及した見出し「2.8 環境」があります(※注釈1)。この見出しにおいてGPT-3をはじめとした4つのLLMの二酸化炭素排出量を算出したところ、GPT-3が552トンと最も多く、Gopherの1.4倍、OPTの7.2倍、BLOOMの20.1倍でした(以下の表の列「CO2 Equivalent Emissions x PUE」を参照)。
各LLMの訓練時における二酸化炭素排出量を人間の活動と比較すると、以下の図にようになります。比較したLLMのなかで二酸化炭素排出量が相対的に少ないBLOOMであっても、アメリカ人が1年間に排出する二酸化炭素の1.4倍、ニューヨークからサンフランシスコまで飛行機で1人往復する場合の25倍を排出します。この推定にもとづけば、パラメータ数がはるかに多いGPT-4の訓練では莫大な二酸化炭素が排出されたと予想されます(※注釈2)。
検索から生成検索に完全移行すると…
現在Googleは、生成AIが検索結果を出力するSGE(Search Generative Experience:生成検索体験)の試験運用を進めています。このサービスの正式運用が始まった場合、検索時に消費する電力が増加すると考えられます。この話題に関して、リサーチメディアDigiconomistの設立者であるアレックス・デ・フリース(Alex de Vries)氏は2023年10月10日、オンライン科学誌Jouleに『増え続ける人工知能のエネルギー消費量』と題した論文を発表しました。
以上の論文では、既存のGoogle検索、生成AIによるテキスト出力、そして生成検索をそれぞれ1回実行した場合の電力消費量を試算しました。その結果、通常のGoogle検索実行時の電力消費量は0.3Whなのに対して、ChatGPTやBLOOMのようなLLMは2.9~4.0Wh、生成検索は6.9~8.9Whとなりました。なお、生成検索の試算値が2つあるのは、調査会社のSemiAnalysisとNew Street Researchがそれぞれ算出した値を引用しているからです。
以上の試算にもとづけば、従来のGoogle検索から生成検索に完全移行した場合、同社の消費電力が23~30倍になります。もっとも、こうした完全移行は少なくとも急速には起こり得ないと考えられます。というのも、生成検索への完全移行には大量のGPUの購入が不可欠となりますが、そうした購入は昨今のGPU不足を鑑みれば、まず起こり得ないからです(※注釈3)。ちなみに生成検索への完全移行に必要な計算資源は、SemiAnalysisはNVIDIA A100が4,102,568基と試算しています。
地域ごとに異なる水消費量
生成AIの運用にはデータセンターの稼働が伴うため、データセンターを冷却する水が大量に消費されることが知られています。この問題についてはカリフォルニア大学リバーサイド校らの研究チームは2023年10月29日、『AIをより「渇かないよう」にする:AIモデルに秘められたウォーターフットプリントの発見と対処(第3版)』と題する論文を発表しています。この論文は、世界の各地域に生成AI用データセンターを設立した場合の水消費量を試算しています。
一般にデータセンターの冷却は、暑い地域ほど水を多く消費します。さらにデータセンター自体を運用するのに電力を消費するので、その電力を発電するのに必要な水を消費します。発電に伴う水消費は、各地域の発電事情(火力発電は一般に水消費量が多い)が関係します。こうしたさまざまな要因を考慮したうえで、各地域でGPT-3を訓練した場合の水消費量を試算すると以下のようになります。高緯度にあるアイルランドが水消費が小さい一方で、メキシコやインドは水消費が多いことがわかります。高緯度にあるスウェーデンが水消費が大きいのは、同国の発電体制が影響しているのかも知れません。
研究チームは、さらに水500ミリリットル(ペットボトル1本分)の水で実行できるGPT-3の推論回数も試算しています。この試算結果は各地域のGPT-3訓練時水消費量の大小関係を逆転させたようになっており、アイルランドが69.6回実行できるのに対して、スウェーデンは17.3回しか実行できません。
論文は、生成AI運用時の水消費を太陽の動きからも考察しています。太陽が沈んで気温が低くなった夜間にデータセンターを集中稼働させたほうが、冷却水を節約できます。その一方で、太陽光が使える日中に集中稼働させれば太陽光発電を有効活用できるので、二酸化炭素排出量を削減できます。このように水消費量と二酸化炭素排出量を同時に削減するのは、太陽の動きから見れば両立は極めて困難です。
以上のようにLLMの電力と水の消費は、ともに膨大なものであることがわかります。そして、これらをともに削減するには新たなアプローチが必要となるでしょう。
環境に対するポジティブインパクト
AIには既存システムの最適化等を通して、電力抑制に貢献したりする環境に対するポジティブなインパクトもあります。以下では、そうした事例を紹介します。
データセンター冷却時の電力抑制に成功
前出のAI Index Report 2023は、AIの環境に対するポジティブインパクトの事例として、DeepMindが2022年に発表した強化学習エージェントBCOOLERを紹介しています。このエージェントをGoogleのデータセンターに試験導入したところ、導入後3ヵ月で約12.7%の消費電力削減に成功しました。
Googleが推進するAIによる持続可能性改善
Googleは2023年11月20日、同社のAIによる気候変動対策をまとめた英語ブログ記事を公開しました。この記事では、AIによる気候変動対策として以下のような2つを紹介しています。
|
以上の記事は、2023年11月、Googleとコンサルティング会社ボストン コンサルティング グループが共同でAIによる温室効果ガス排出量を5~10%削減できる可能性があることを報告したレポートを発表したことも伝えています。そのレポートには、2022年5月に日本やアメリカを含む14ヶ国の官民のリーダー1,000人を対象にして実施したアンケート調査の結果が掲載されています。
そのアンケート調査によると、87%のリーダーたちがAIが気候変動解決のツールになり得ると考えています。さらに「気候変動解決に関連したAIの貢献について、どのような分野にビジネス的価値を見出すのか」という質問をしたところ、排出量削減が61%、排出量測定が57%、気候変動危機の予測が44%という回答を得ました。この結果は、AIによる気候変動解決がビジネスチャンスとして見られていることを示しています。
なお、US版Google公式ブログの「持続可能性」ページでは、同社の持続可能性改善に関する取り組みがまとめられています。
AIが書いたり描いたりしたほうが環境に優しい?
カリフォルニア大学らの研究チームは2023年3月8日、文章の執筆とイラスト制作に関して人間とAIの二酸化炭素排出量を比較した論文『文章を書いたりイラストを描いたりするときの二酸化炭素排出量は、人間よりAIのほうが少ない』を発表しました。その論文によると、平均的なアメリカ人とインド人が1ページ(英単語250ワード)を執筆する場合に排出する二酸化炭素量と、BLOOMとChatGPTが同様のタスクを実行した場合の二酸化炭素排出量を比較すると以下のグラフのようになります。LLMは人間に比べて、二酸化炭素排出量が130~1,500分の1で済むと試算されたのでした。
イラスト制作に関しても同様の比較を実施したところ、LLMは人間に比べて、二酸化炭素排出量が310~2,900分の1で済むことがわかりました。この結果にもとづけば、英文の執筆よりイラストの制作のほうが、AIへの代替による二酸化炭素排出量削減効果が高いと言えます。
もっとも、以上の比較結果は各種統計値から算出されたものであり、比較タスクの内容が度外視されています。現実には、学術論文のような高度な専門知識を要する英文の執筆をLLMに任せられず、また棒人間のようなイラストではLLMより人間のほうが制作時の二酸化炭素排出量が少ない可能性があります。
以上の比較結果を鵜呑みには出来ませんが、直感的に言えば、内容が決まりきった定型的な文章やイラストの制作については、人間よりLLMが実施したほうが環境に優しいことが示唆されています。
提案される改善策
前述のネガティブインパクトのうち地域ごとに異なるLLM運用時の水消費量については、カリフォルニア大学リバーサイド校らの研究チームが2023年6月20日、改善案に関する論文『地理的負荷分散による環境的に公平なAIを目指して』を発表しています。
この論文は、Googleのように複数の地域でデータセンターを運用している場合における環境負荷分散を論じています。各データセンターに単純に稼働負荷を分散するのは、環境負荷の見地に立てば不平等かつ非効率的です。また、データセンターが世界各地にある場合、各地域の環境負荷は太陽の動きによって変わります。それゆえ、データセンター全体の環境負荷を地域ごとに公平に分散するには、さまざまな要因を考慮した稼働負荷分散が求められます。
以上の問題に対して、研究チームは以下のような環境負荷分散アルゴリズムを比較した結果、WUE(Water Usage Efficiency:水使用効率)といった環境負荷に関する指標をモニタリングするアルゴリズム「GLB-Euity」(GLBは「Geographical Load Balancing(地理的負荷分散)」の略称)が、もっとも公平に各データセンターに環境負荷を分散することをシミュレーションによって証明しました。
アルゴリズム名 |
アルゴリズム概要 |
GLB-Cost | 総エネルギーコストのみを最小化する。 |
GLB-Carbon | 総カーボンフットプリ ントのみを最小化する。 |
GLB-Water | 総ウォーターフットプリントのみを最小化する。 |
GLB-C2 | 総エネルギーコストとカーボンフットプリントの加重合計を最小化する。 |
GLB-All | 総エネルギーコスト、カーボンフットプリント、およびウォーターフットプリントの加重合計を最小化する。 |
GLB-Null | 各ゲートウェイから最も近いデータセンターへ作業負荷を直接ルーティングする。 |
GLB-Equity | 1時間ごとに測定したエネルギーコスト、炭素効率、WUEにもとづいて、すべてのデータセンターが環境に及ぼす影響を最小化する。 |
なお、データセンターのシミュレーションにはGoogleのデータセンター所在地を参考にして、アメリカに4ヶ所、ヨーロッパに4ヶ所、アジアに2ヶ所(シンガポールと日本)を想定しました。
3つの提言
AI環境問題は、AIの安全性問題と同様に短期的に解決するのが困難です。長期的に取り組むべきこの問題に関して、以下では3つの提言を示します。
|
AI環境問題については、継続的な注目をうながすためにAINOWで今後とも情報発信していきます。
記事執筆:吉本 幸記(AINOW翻訳記事担当)
編集:おざけん