最終更新日:
ケース氏によると、ChatGPTをはじめとする生成AIはどんなプロンプトに対しても、もっともらしい回答を出力するがゆえに、その活用がふさわしくない場合でも使われてしまっています。例えば月並みなユーザが専門的かつ独創的な論文を生成AIを使って執筆しようとした場合、期待した出力が得られないうえに、そうした出力を得るために多大な労力を費やしてしまいます。このように現状の生成AIは、本来はユーザの負荷を減らすために使うべきにもかかわらず、かえって負荷を大きくするユースケースで活用されることがあるのです。
2024年6月に開催されたAppleの開発者会議WWDC2024では、Apple製品と連携する生成AIであるApple Intelligenceが発表されました。入力した文章を即座に校正できたりする同AIは、ユーザの労力を減らすために技術を活用するという設計思想にもとづいて実装されている、とケース氏は指摘します。こうした設計思想こそ同氏が提唱する「カーム・テクノロジー(Calm Technology:静かな技術)」なのです。そして、Apple Intelligenceは「カームテックとしての生成AI」の先駆的事例となって、今後のAI業界におけるカーム・テクノロジーの普及をけん引するかもしれない、とも同氏は考えています。
ケース氏が提唱するカーム・テクノロジーは、同氏が著した邦訳書籍『カーム・テクノロジー 生活に溶け込む情報技術のデザイン』でまとめられており、カームテック研究所公式サイトにもその原則が掲載されています。そうした原則の第1項目は「テクノロジーは、可能な限り最小限の注意力を要求すべきである」となっています。
なお、以下の記事本文はアンバー・ケース氏に直接コンタクトをとり、翻訳許可を頂いたうえで翻訳したものです。また、翻訳記事の内容は同氏の見解であり、特定の国や地域ならびに組織や団体を代表するものではなく、翻訳者およびAINOW編集部の主義主張を表明したものでもありません。
以下の翻訳記事を作成するにあたっては、日本語の文章として読み易くするために、意訳やコンテクストを明確にするための補足を行っています。
はじめに
遅ればせながらAIを取り入れたAppleの最近の発表は、一部のChatGPTファンからは「つまらない」と言われている。私の見方は少々違う。AIのおかげでパイの焼き方を学べたからだ。
昨年の感謝祭では私はコンピューターから離れ、家族と一緒にパンプキンパイを作ることを楽しみにしていた。しかし、パンプキンパイの作り方について質問があったので、ウェブに目を向けた。ネットでレシピを探したことのある人なら誰でも知っているように、ポップアップ広告やレシピサイトの作者による無関係な長話でいっぱいのサイトに私は圧倒されてしまった。
イライラしながらChatGPTを開き、パンプキンパイを一から焼く方法を尋ねた。
数秒のうちに、明確で簡潔な説明が表示された。(そして、GoogleのAIによる概要で話題になった「接着剤を加える」というような幻覚もなかった(※訳注1))。パンプキンパイの作り方のためにウェブを探し回る必要がなくなったため、家族とおしゃべりしながら料理に集中できた。皮肉なことに、ChatGPTはパイ作りに人間らしい体験を取り戻させてくれたのだ。
以上のような幻覚に対して、Googleは人間による手作業で削除・修正しており、こうした幻覚は「非常に珍しいクエリにおいて表示されるものであり、ほとんどの人の経験を代表するものではない」とコメントしている。
なお、AIによる概要は2024年8月時点で日本でも利用できる。
Google AI overview suggests adding glue to get cheese to stick to pizza, and it turns out the source is an 11 year old Reddit comment from user F*cksmith 😂 pic.twitter.com/uDPAbsAKeO
— Peter Yang (@petergyang) May 23, 2024
AppleのAIへのアプローチは、多くのアプリやデバイスに反映され、カームテックの哲学にほぼ沿っている。その哲学を要約すると、ツールをタスクに適合させるのであって、その逆ではないということだ。
Appleのデザイン哲学は消費者にとって価値があるだけでなく、人工知能によって未来が完全に変わるという大胆な予言に支配されがちなAIを、私たちがどのように理解すればよいかを再構築してくれるだろう。
以上が私の言いたいことだ。
認知的負荷とChatGPTの限界
ChatGPTに対する興奮は、その欺瞞的なまでにオープンエンドなチャット・インターフェース(どのようなプロンプトにも同じように答えられるとほのめかす)と相まって、実際には認知的負荷を少なくするどころか、より多くの負荷を必要とする数多くの応用事例を生んだ。例えば誰かがレポートを書くためにChatGPTを使うかもしれないが、その後、アウトプットの事実確認に多くの時間を費やすので、役に立つというより負荷になってしまう。
人工知能に対する多くの失望は、GPT使用について理想的ではないタスクにそれを使い、平凡な結果や間違った結果を得て、AI全体を否定的に判断することから生じている。プロンプターが独創的なテーマを持っていないトピックについてユニークなエッセイを生成したり、プロンプターがウェブデザインの基礎を理解していないのにGPTにウェブサイトをデザインするように指示したりするのは、そうした理想的でない事例だ。汎用的なGTPのインターフェースは、ドライバーで十分なのにスイスアーミーナイフを渡すようなものだ。より複雑なタスク、例えばGPTに法的な論文のチェックを依頼するような場合、(GPTの性能の問題というよりは)ユーザが結果を確認する資格を持つ弁護士であることが必要になるだろう。
AIの活用は、私たちの認知的負荷を軽減してくれる時には、それは良いものとなる。反対に、AIの使用によって私たちの認知的負荷が増えるような時には、その使用は良くないことだ。とはいうものも、GPTを使うことで認知的負荷が少なくなる例は、以下のようにたくさんある。
- 料理のレシピ:感謝祭で作った私のパンプキンパイを食べた人が証言してくれるかもしれないが、広告や個人的な話、その他のくだらないことで肥大化したレシピサイトと比較して、ChatGPTは輝いている。完璧ではないが、このAIは調理タスクを完了するために必要なウェブ閲覧時間と注意力の量を減らせる。
- 技術的な問題とコードレビュー:特定のコードや技術的な問題を解決するために、何年も前の古いサポート問題をウェブサイトから探し出さなければならないのは、時間と多くの精神的エネルギーを要する。GPTに正しい可能性のある回答を提示してもらうことで、専門家を雇う前に認知的負荷を軽減できる。
- テキストの解釈や翻訳の可能性:私はしばしば、ニューロダイバージェントな人々と交流するのに助けを必要としている(※訳注2)。かく言う私自身、ニューロダイバージェントな人間でもある。そんなわけで誰かが書いたEメールやテキストを読む時、私はとても混乱することがある。そうした文章に対してGPTを使うと、それが意味している可能性があることについて理解しやすくなる。
このようなユースケースは、画期的でも革命的でもないように思えるかもしれないが、多くの人にとって非常に価値のあるものであり、AppleがGPTを統合するアプローチをどのように設計したかを説明するのに役立つ。
AppleのAIが認知負荷を軽減する方法
AppleのデバイスへのAI統合は遅きに失したという批判もあるが(※訳注3)、時間をかけて段階的に展開するのは賢明だ。GPTが得意なこと、不得意なこと、そしてすでに使っているiOSアプリの中でより多くの利便性を人々に提供することに関して、Appleが多くの配慮を払ったのは明らかだ。
その一方で、Appleには「他社よりも遅れて技術をリリースし、その後、洗練されたデザインとサービスを巧みなマーケティング・キャンペーンと組み合わせることで、出遅れを克服して新たなトレンドを巻き起こした」歴史があるので、WWDC2024で生成AIに関する発表があれば、同社の市場価値がさらに高まるという市場関係者の見方もあった。
なお、Apple Intelligenceを発表したWWDC2024後の2024年8月5日におけるAppleの株価は209.27米ドルであり、2024年初頭の185.64米ドルを上回っている。
本質的に言えば、Appleはカームテックのようなアプローチで純粋に役立つAIソリューションを作ろうとしている。つまり、アクションを圧縮し、人々がすでに特定のアプリのなかにいる場所にAIツールを導入して、そのアプリの使用に際する認知的過負荷を軽減している。
以上のようなAI活用事例は、具体的には以下のようなものだ。
- Siri:Appleの音声アシスタントは超限定的で、運転中にタスクを実行するために頼ろうとするとちょっと危険だ。しかし、例えば、(文字起こしアプリの)otter.aiを開いてメモを取ったり、電話を録音して要約したりといったように、移動中にGPTに助けてもらうことができるようになったので非常に便利だ。
- メモ:現在、このよく使われているアプリは基本的なメモを取るプログラムだが、GPTによってすぐに強力にアップグレードできる。メモを終了して検索したり、複数のアプリをまたいでコピー&ペーストしたりする代わりに、個々のメモの中で重要なコンテンツを検索してメモに取り込むことができるようになるのは、信じられないほど便利だ。こうした動作によって操作に要する注意力を減らして仕事に没頭しやすくなるので、プロジェクトに取り組んでいるあいだ、注意力を維持できる可能性がはるかに高くなる。
- テキスト/Eメール:ライティングツールを使えば、トーン、一貫性、読みやすさを考慮して書き直せる。英語が母国語でない人や、失読症、神経的ダイバージェンス、その他の課題を持つ人にとって、GPTは変革をもたらす。自分の芸術的感性や魂を平坦なテキストに書き出すための感情的な帯域幅がない時、助成金申請書を書くためにChatGPTを使っているアーティストをわたしはすでに知っている。
Apple Intelligenceの主な機能については、Apple公式サイトの「Apple Intelligence」ページを参照のこと。
「優先通知」のイメージ画像
「写真とビデオの検索」のイメージ画像
批評家の中には、まるでSiriが映画『her/世界でひとつの彼女』の彼女(AIのサマンサ)のようになることを期待していたので、AppleのAI発表に「あーあ」と言って残念がる人もいる。しかし、そのような反応は、「人工知能」の最高の目的を完全に見逃している。その目的とはAIと人類が互いに敵対することなく、連動して働くことで生じる良さを増幅することにあるのだ(※訳注5)。
うまくいけば、AI業界全体が(AIをカームテック的に実装する)Appleのリードに続くだろう。そうなれば、私たちの身近なニーズに合わせて設計されたAIアプリケーションが増える一方で、全人類の変革を約束するような壮大プロジェクトは減るだろう。そのような規模の革命を準備したり、関心を持っていたりする人はほとんどいないのだ。その一方で私たちのほとんどは、パンプキンパイの作り方をもっとうまく教えてくれることを望んでいる。
―
アンバー・ケースはカームテック研究所の創設者であり、この研究所はデザイン/研究会社として、注意をよりよく活用する製品のためのフレームワークや基準を構築することに専念している。MITのシビック・メディア・センター(Center for Civic Media)とハーバードのバークマン・クライン・インターネット&ソサエティ・センター(Berkman Klein Center for Internet & Society)のフェローを歴任しており、『カーム・テクノロジー:邪魔しないデザインのための原則とパターン(邦題『カーム・テクノロジー 生活に溶け込む情報技術のデザイン』)』の著者でもある。
最新情報はカームテック研究所のニュースレターでフォローしてください!
原文
『Apple’s Approach to AI Should Rewrite the Industry’s Expectations for the Technology』
著者
アンバー・ケース(Amber Case)
翻訳
吉本 幸記(フリーライター、JDLA Deep Learning for GENERAL 2019 #1、生成AIパスポート、JDLA Generative AI Test 2023 #2取得)
編集
おざけん