HOME/ AINOW編集部 /GPT-4oはクレイジーだ―思わず言葉を失うような(信じられない)6つの使用例を紹介
2024.07.08

GPT-4oはクレイジーだ―思わず言葉を失うような(信じられない)6つの使用例を紹介

インド在住のライター兼エンジニアのニティン・シャルマ(Nitin Sharma)氏(詳細は同氏LinkedInプロフィールページを参照)がMediumに投稿した記事『GPT-4oはクレイジーだ―思わず言葉を失うような(信じられない)6つの使用例を紹介』では、GPT-4oの実用的な使用例が紹介されています。
シャルマ氏が紹介するGPT-4oの使用例は、以下の表の通りです。

GPT-4oの6つの実用的な使用例

GPT-4o使用事例概要

使用例詳細

カスタマイズしたSiriの作成 iPhoneに実装されたSiriに相当すると同時に凌駕する機能を、GPT-4oによって実現する。例えば、カメラで撮影した被写体を説明できるようにする。
コーディングアシスタント コードの生成と解説をGPT-4oに実行してもらう。コードの実行結果の分析にも対応。これらの機能は、同AIの発表時にOpenAIチームが披露した(以下の本文におけるデモ動画を参照)。
Figma デザインの自動生成 PRD(Product Requirements Document:プロダクト要求仕様書)を入力すると、GPT-4oがデザインツールFigmaを活用したデザインを出力する。
UIデザインのフロントエンドコードへの変換 UIデザイン画像をGPT-4oに入力すると、React + TailwindCSSで記述されたコードに変換する。
気の利いた一言のリストアップ 初デートにおける会話に使えそうな気の利いた一言をリストアップする(具体的な出力は、以下の記事本文を参照)。
リアルタイム通訳 異なる言語(例えばイタリア語と英語)のあいだの会話を通訳する。この機能は、同AIの発表時にOpenAIチームが披露した(以下の本文におけるデモ動画を参照)。

なお、2024年6月に開催されたAppleの開発者会議WWDC 2024において、GPT-4oが2024年内にiOS 18対応iPhoneをはじめとする一部のApple製品で使えるようになることが発表されました。それゆえ、近い将来、Apple製品とGPT-4oが連携する使用例が多数あらわれることでしょう。

なお、以下の記事本文はニティン・シャルマ氏に直接コンタクトをとり、翻訳許可を頂いたうえで翻訳したものです。また、翻訳記事の内容は同氏の見解であり、特定の国や地域ならびに組織や団体を代表するものではなく、翻訳者およびAINOW編集部の主義主張を表明したものでもありません。
以下の翻訳記事を作成するにあたっては、日本語の文章として読み易くするために、意訳やコンテクストを明確にするための補足を行っています。

画像出典:UnsplashJud Mackrillより

GPT-4oがどれほど驚くほど便利なのかを示す、度肝を抜くような使用例をご紹介できることに興奮だ。

まだMediumの有料会員ではない? 私のMediumリンクをクリックすれば、私が書いた全ての記事を読める。

先日、各業界のゲームチャンジャ―となるようなGPT-4oの驚くべき事例をいくつか紹介した。

ゲーム制作や自律エージェントの作成、古い原稿の書き起こしなど、GPT-4oの能力はまさに革命的なものといえる。

しかし、何ということだ。以上の使用例は氷山の一角にすぎないのだ。

今日はGPT-4oが驚くほど役立つ、さらに素晴らしい方法をお伝えできることを嬉しく思う。

GPT-4oがどのように役立つかについてお話ししよう。そうした使用例は以下の通り。

  • 新しいSiriを作成する
  • Figmaのデザインを自動的に生成
  • 初めてのデートのお手伝い
  • コーディングアシスタントとして働く
  • リアルタイムの翻訳機として役立つ
  • UIデザインをフロントエンドコードに変換する

以上に興味を持ってくれただろうか。 それでは紹介を始めよう。

→ GPT-4oを新しいSiriとして使う

前回の記事(※訳注1)では、Be My EyesがGPT-4o のおかげで視覚障がい者の方々の役に立っている例を紹介した。

(※訳注1)この記事の著者シャルマ氏が2024年5月24日に公開したMedium記事『ChatGPT-4oがインターネットを席巻 – あなたの心を揺さぶる(信じられない)使用例がここにある』では、弱視のユーザを対象としたGPT-4oの活用事例を紹介している。
弱視ユーザのためのアプリを開発するBe My Eyesが開発したVirtual Volunteerは、スマホのカメラに写っている光景をユーザに対して言葉で説明している。以下の動画を参照。

今、インターネット上のクリエイターが同じようなことを共有している。

GPT-4oを使ってSiriを作成した方法をTwitterで共有したアルヴァ―ノ・シナトラ(Alvaro Cintas)についてお話しよう。

画像出典:X(旧Twitter)より

具体的には、彼はiPhoneのショートカットをプログラムし、2回タップすると、GPT-4oを使って見ているものをリアルタイムで自動的に説明する仕組みを実現した。

何てクレイジーなんだ。

その後、彼はこの超クールなショートカットを作成したプロセスをすべて共有した。

詳しい内容は、こちらからご覧いただきたい。

(※訳注2)2024年6月10日から5日間にわたり開催されたApple主催の開発者会議WWDC 2024に関連した同社公式ニュース記事『iPhone、iPad、Macの中心にパワフルな生成モデルを据えるパーソナルインテリジェンスシステム、Apple Intelligenceが登場』には、以下のような記述がある。

ChatGPTは、年内にiOS 18、iPadOS 18、macOS Sequoiaで利用できるようになります(GPT-4oモデル)。ユーザーはアカウントを作成しなくても無料でChatGPTにアクセスでき、ChatGPTのサブスクリプション登録者は、自分のアカウントに連携するとこれらの体験から有料機能に直接アクセスできます。

以上のように一部のiPhoneからGPT-4oが利用できるようになるが、この記事で紹介している「カスタマイズされたSiri」の需要はあると考えられる。

・・・

→ GPT-4oはコーディングアシスタントとして機能する

もう1つの例は、OpenAIチームによるものだ。

彼らは ChatGPT-4o を使って、それがコーディングにどのように役立つかを実証した。

彼らはまず、コードをいくつか与え、そのコードが何をするのかを1文で要約するよう求めた。ChatGPT-4oは見事にその要求に応え、正確な説明を提供した。

次に、コード内の特定の機能について質問した。

またしても、ChatGPT-4oは完璧にその部分を説明し、そのコードの部分がどのような機能を持つのかを詳しく説明した。

しかし、彼らはそこで立ち止まらなかった。

OpenAIチームはコードを実行し、その出力を ChatGPT-4o に表示させた後、その出力を分析して洞察を提示するよう求めた。

以上の質問と応答は、本当に印象的だった。

チームは「最も気温が高かった月はいつか?」といった直接的な質問を投げかけ、GPT-4oは出力データを簡単に分析して正しい答えを導き出した。

正直なところ、コードをここまで理解して説明し、結果を検証し、データに関する質問に答えられることに私は本当に驚いた。

まるで、熟練した開発者と分析者の両方がいるかのようだった。

・・・

→ GPT-4oによるFigmaデザインの自動生成

Twitterの別のユーザは、Figmaのデザイン生成を自動化した方法を説明している。

彼は、実際に人間のデザイナーが行うようなデザインを生成できるAI自動化システムを作りたいと考えていた。

そのために彼は昼夜を問わず3か月間かけてそれを可能にした。

しかし、他のデザイン自動化ツールにはどのような問題があったのだろうか。

彼が自作のデザイン自動化ツールを開発した理由は、以下のポストの通りだ。

画像出典:X(旧Twitter)より

(※訳注3)以上のXポストは、以下のように翻訳できる。

私はこのビジョン(Figma デザインの自動生成)を実現するために、2023年5月からGPT-3.5を使用している。

以上を行う動機は、現在市場に出回っているAI2UI製品はすべてテンプレートベースであり、異なる製品要件に対するスケーラビリティに乏しく、人間のデザイナーが持つような要件理解の細やかさを実現できないという点にあった。そこで私は、AIが生成するデザインドラフトの実用性を向上させること(ユーザ自身のデザインシステムを使用してインターフェースを生成すること)を目標に3か月の探索を始め、インターフェース構築プロセス全体に対する画期的なソリューションを発見できるのではないかと期待した。

最初のテストは予想通り非常に粗悪なものだったが、それを改善するために解決すべきさまざまな問題について学んだ。

その後、彼は2回目、3回目、4回目のテストを実施した。

4回目のテストの後、彼は目標の70%を達成したと考えた。

画像出典:X(旧Twitter)より

(※訳注4)以上のXポストは、以下のように翻訳できる。

私は、この結果が目標の70%を達成したと考えている。その理由は、以下の機能を備えているからだ。

  • Ant Design Mobile や Arco Mobile などの中~高品質のデザインシステムを使用するためのサポート。
  • PRD を理解して特定のデータ形式に解析する。
  • ローカルスタイル、カスタムアイコンライブラリ、テキストコンテンツを使用した合理的な埋め込み。
  • デスクトップ・ウェブでのテスト結果は、モバイル・アプリに比べ約30%洗練されていない(当初はモバイルにフォーカスしていたのだが、デスクトップ用のデザインドラフトを作成するぶんには問題ないと思う)。
  • 複数のページ間のインタラクティブなリンクを実現でき、実装のためのパスもすでに存在する。
  • 生成されたデザインドラフトはすべて自動レイアウト(適応的ストレッチをサポート)で、意味的に名付けられたレイヤーを持つ。

以下は、彼が実現した自動で生成されたデザイン成果の一部である。

画像出典:X(旧Twitter)より

画像出典:X(旧Twitter)より

以上の事例についてさらに詳しく知りたい方は、こちらをご覧いただきたい。

・・・

→ UIデザインをフロントエンドコードに変換する

読者諸氏のなかには、私がウェブ開発に関するサービスを提供していることをご存知な人もいるだろう。

そんなわけでクライアントと話し合い、彼らの要望にもとづいてFigma デザインを作成し、デザインを承認してもらってから、React + TailwindCSS でコードを記述している。

通常、以上の作業には多くの時間がかかる。こうした一連の作業は、多くの開発者が従っているのと同じプロセスだ。

しかし、GPT-4oや同様のAIモデルのおかげで、今後はもっと簡単になるだろう。

Twitterのあるクリエイターが、UIデザインをフロントエンドコードに変換するプロセスを共有した。

画像出典:X(旧Twitter)より

彼は実際に、GPT-4oにデザインをReact + TailwindCSSコードに変換するよう依頼した。

驚いたことに、実際に「動作する」コードが生成されたのだ。

正直に言うと、GPT-4oは以前のバージョンのChatGPTよりも優れている。

同様に、次のバージョンはさらに良くなるだろう。 ゆえにChatGPTを使って、より短時間でタスクを完了させてみよう。

・・・

→ GPT-4oは初デートのお手伝いをしてくれる

今度の使用例は、以上の例とは少し異なる。

GPT-4oがさまざまな場面で役立つことを示すために、以上のような使用例を紹介してきた。

ところで、初めてのデートに行くことを想像してみよう。あなたが誰であろうと、スマートで自信に満ちた印象をデート相手に与えたいと思うだろう。

そこで GPT-4o が役に立つ。

ライナス・エケンスタム(Linus Ekenstam)はGPT-4oに20の気の利いた一言をリストアップするよう指示することで、このAIがデートでも役立つことを示した。

そして、そのほとんどがとても良かった。こちらが彼の共有した例である。

私もGPT-4oにいくつか気の利いた一言を探してもらったら、次のようなものが返ってきた。

以上のこの記事の著者シャルマ氏とGPT-4oとの会話は、以下のように翻訳できる。
シャルマ氏:初デートで使える最高に気の利いた一言20選を、表形式でリストアップして
GPT-4o:もちろん、初デートで使える素晴らしい気の利いた一言を20個リストアップします。
# 気の利いた一言
1 一目惚れを信じる?それとも、もう一度君に通りすがったほうがいい?
2 もし君が野菜だったら、キュート・カンバー(かわいいきゅうり)になるね
3 地図を持っている?君の瞳に魅了されて迷子になってしまったので。
4 君はマジシャンなの? 君を見るといつも、他の人がみんな消えてしまうから。
5 君には名前があるの?それとも僕の名前で呼んでもいい?
6 もし日曜の朝、雨の中家で抱き合っていたら、朝食に何を食べる? A) パンケーキ、B) ベーコンエッグ、C) クレープ、D) アサイーボウル、E) それ以外?
7 もし映画の中の登場人物になれるとしたら、誰になりたい?
8 今までで一番衝動的にやったことは何?
9 今、世界中どこでも旅行できるとしたら、どこに行きたい?
10 週末を過ごすのに一番好きな方法は?
11 無人島に流れ着いて、3つだけ持ち込めるとしたら、何を選ぶ?
12 今までに行ったコンサートで最高のものは?
13 カラオケで必ず歌う曲は?
14 生きているか死んでいるかを問わず、3人誰とでも夕食を共にできるとしたら、それは誰?
15 子供の頃の思い出で、一番好きなものは何?
16 もし、あるスキルをすぐに習得できるとしたら、それは何?
17 今までにもらった中で一番嬉しかったプレゼントは何?
18 隠れた才能はある?
19 長い一日を終えた後にリラックスするお気に入りの方法は?
20 どの時代にでも生きられるならば、どの時代を選ぶ?

・・・

→ GPT-4oはリアルタイム翻訳機として動作する

OpenAIチームは、GPT-4oの驚くべき別の使用例を披露した。

今度は、チームメンバーがGPT-4oに英語とイタリア語のリアルタイム翻訳者になってもらうよう頼んだ。

ミラ・ムラティ(Mira Murati)(※訳注6)がイタリア語で話し始めると、同僚は英語で返答した。

(※訳注6)ミラ・ムラティ(Mira Murati)は、OpenAIの現CTO(以上の動画における左側の女性)。ウィキペディアにおける彼女の項目によると、テスラモーターズでシニアプロダクトマネージャー等を歴任後、2018年にOpenAIに入社。同社のサム・アルトマンCEOが突然解任されたいわゆる「OpenAIの乱」では、彼女は暫定CEOに就任していた。

2人の会話が交わされるたびにGPT-4oはそれぞれの言葉を瞬時に別の言語に翻訳していた。その自然な流れには驚かされた。

ミラがイタリア語で何か言うと、GPT-4oがすぐに英語の翻訳を音声で読み上げたのだ。

すると同僚が英語で返答し、すぐにイタリア語訳が返ってくる。2人は、GPT-4oを通訳として、スムーズに2か国語での会話をしていた。

双方向のリアルタイム翻訳をとてもスムーズに処理していることに、私は本当に感心した。

GPT-4oのようなツールは、旅行中の言葉の壁を乗り越えるのに非常に役立つことをこの事例は示している。

翻訳アプリやフレーズブックに頼るのではなく、ChatGPT-4oがすべてを瞬時に翻訳しながら、自然な会話を楽しめるのだ。

GPT-4oを使えばコミュニケーションがぐっと楽になり、まるで現地の人と話しているような感覚になるだろう。以上の使用例だけでも、このAIの実用的な可能性を示している。

・・・

この記事を気に入っていただけると幸いです。

記事をお読みいただき、ありがとうございます。

この長文コンテンツが有益だと感じ、サポートしたい場合は、私にコーヒーをおごってください!また、私のSubstackを購読して、私のデジタル製品をもっと探検してください。


原文
『GPT-4o is Going Insane — Here Are 6 (Incredible) Use Cases That Will Leave You Speechless』

著者
ニティン・シャルマ(Nitin Sharma)

翻訳
吉本 幸記(フリーライター、JDLA Deep Learning for GENERAL 2019 #1、生成AIパスポート、JDLA Generative AI Test 2023 #2取得)

編集
おざけん

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する

あなたにおすすめの記事

Generative AI Japan|産官学連携で世界に通用する競争力の獲得を目指す

生成AI時代の人材育成|海城中学高等学校物理部がAI班を作ったワケ

GPT-4oはクレイジーだ―思わず言葉を失うような(信じられない)6つの使用例を紹介

社内の生成AIにおける「回答精度の低さ」をどう克服する?|株式会社クレディセゾンCTOに訊く

博報堂DYグループの挑戦|Human-Centered AI Institute が問うAIと人間の新しい関係性

“現実と仮想の境界線を越えたエンターテイメントとは?” |川田のロンドン体験レポート

低コストで高性能なAIモデル・MoEモデル開発の舞台裏|カラクリCPO中山氏へインタビュー

あなたにおすすめの記事

Generative AI Japan|産官学連携で世界に通用する競争力の獲得を目指す

生成AI時代の人材育成|海城中学高等学校物理部がAI班を作ったワケ

GPT-4oはクレイジーだ―思わず言葉を失うような(信じられない)6つの使用例を紹介

社内の生成AIにおける「回答精度の低さ」をどう克服する?|株式会社クレディセゾンCTOに訊く

博報堂DYグループの挑戦|Human-Centered AI Institute が問うAIと人間の新しい関係性

“現実と仮想の境界線を越えたエンターテイメントとは?” |川田のロンドン体験レポート

低コストで高性能なAIモデル・MoEモデル開発の舞台裏|カラクリCPO中山氏へインタビュー