最終更新日:
シャルマ氏が紹介するGPT-4oの使用例は、以下の表の通りです。
GPT-4oの6つの実用的な使用例
GPT-4o使用事例概要 |
使用例詳細 |
カスタマイズしたSiriの作成 | iPhoneに実装されたSiriに相当すると同時に凌駕する機能を、GPT-4oによって実現する。例えば、カメラで撮影した被写体を説明できるようにする。 |
コーディングアシスタント | コードの生成と解説をGPT-4oに実行してもらう。コードの実行結果の分析にも対応。これらの機能は、同AIの発表時にOpenAIチームが披露した(以下の本文におけるデモ動画を参照)。 |
Figma デザインの自動生成 | PRD(Product Requirements Document:プロダクト要求仕様書)を入力すると、GPT-4oがデザインツールFigmaを活用したデザインを出力する。 |
UIデザインのフロントエンドコードへの変換 | UIデザイン画像をGPT-4oに入力すると、React + TailwindCSSで記述されたコードに変換する。 |
気の利いた一言のリストアップ | 初デートにおける会話に使えそうな気の利いた一言をリストアップする(具体的な出力は、以下の記事本文を参照)。 |
リアルタイム通訳 | 異なる言語(例えばイタリア語と英語)のあいだの会話を通訳する。この機能は、同AIの発表時にOpenAIチームが披露した(以下の本文におけるデモ動画を参照)。 |
なお、2024年6月に開催されたAppleの開発者会議WWDC 2024において、GPT-4oが2024年内にiOS 18対応iPhoneをはじめとする一部のApple製品で使えるようになることが発表されました。それゆえ、近い将来、Apple製品とGPT-4oが連携する使用例が多数あらわれることでしょう。
なお、以下の記事本文はニティン・シャルマ氏に直接コンタクトをとり、翻訳許可を頂いたうえで翻訳したものです。また、翻訳記事の内容は同氏の見解であり、特定の国や地域ならびに組織や団体を代表するものではなく、翻訳者およびAINOW編集部の主義主張を表明したものでもありません。
以下の翻訳記事を作成するにあたっては、日本語の文章として読み易くするために、意訳やコンテクストを明確にするための補足を行っています。
目次
GPT-4oがどれほど驚くほど便利なのかを示す、度肝を抜くような使用例をご紹介できることに興奮だ。
まだMediumの有料会員ではない? 私のMediumリンクをクリックすれば、私が書いた全ての記事を読める。
先日、各業界のゲームチャンジャ―となるようなGPT-4oの驚くべき事例をいくつか紹介した。
ゲーム制作や自律エージェントの作成、古い原稿の書き起こしなど、GPT-4oの能力はまさに革命的なものといえる。
しかし、何ということだ。以上の使用例は氷山の一角にすぎないのだ。
今日はGPT-4oが驚くほど役立つ、さらに素晴らしい方法をお伝えできることを嬉しく思う。
GPT-4oがどのように役立つかについてお話ししよう。そうした使用例は以下の通り。
- 新しいSiriを作成する
- Figmaのデザインを自動的に生成
- 初めてのデートのお手伝い
- コーディングアシスタントとして働く
- リアルタイムの翻訳機として役立つ
- UIデザインをフロントエンドコードに変換する
以上に興味を持ってくれただろうか。 それでは紹介を始めよう。
→ GPT-4oを新しいSiriとして使う
前回の記事(※訳注1)では、Be My EyesがGPT-4o のおかげで視覚障がい者の方々の役に立っている例を紹介した。
弱視ユーザのためのアプリを開発するBe My Eyesが開発したVirtual Volunteerは、スマホのカメラに写っている光景をユーザに対して言葉で説明している。以下の動画を参照。
今、インターネット上のクリエイターが同じようなことを共有している。
GPT-4oを使ってSiriを作成した方法をTwitterで共有したアルヴァ―ノ・シナトラ(Alvaro Cintas)についてお話しよう。
具体的には、彼はiPhoneのショートカットをプログラムし、2回タップすると、GPT-4oを使って見ているものをリアルタイムで自動的に説明する仕組みを実現した。
何てクレイジーなんだ。
その後、彼はこの超クールなショートカットを作成したプロセスをすべて共有した。
詳しい内容は、こちらからご覧いただきたい。
ChatGPTは、年内にiOS 18、iPadOS 18、macOS Sequoiaで利用できるようになります(GPT-4oモデル)。ユーザーはアカウントを作成しなくても無料でChatGPTにアクセスでき、ChatGPTのサブスクリプション登録者は、自分のアカウントに連携するとこれらの体験から有料機能に直接アクセスできます。
以上のように一部のiPhoneからGPT-4oが利用できるようになるが、この記事で紹介している「カスタマイズされたSiri」の需要はあると考えられる。
・・・
→ GPT-4oはコーディングアシスタントとして機能する
もう1つの例は、OpenAIチームによるものだ。
彼らは ChatGPT-4o を使って、それがコーディングにどのように役立つかを実証した。
彼らはまず、コードをいくつか与え、そのコードが何をするのかを1文で要約するよう求めた。ChatGPT-4oは見事にその要求に応え、正確な説明を提供した。
次に、コード内の特定の機能について質問した。
またしても、ChatGPT-4oは完璧にその部分を説明し、そのコードの部分がどのような機能を持つのかを詳しく説明した。
しかし、彼らはそこで立ち止まらなかった。
OpenAIチームはコードを実行し、その出力を ChatGPT-4o に表示させた後、その出力を分析して洞察を提示するよう求めた。
以上の質問と応答は、本当に印象的だった。
チームは「最も気温が高かった月はいつか?」といった直接的な質問を投げかけ、GPT-4oは出力データを簡単に分析して正しい答えを導き出した。
正直なところ、コードをここまで理解して説明し、結果を検証し、データに関する質問に答えられることに私は本当に驚いた。
まるで、熟練した開発者と分析者の両方がいるかのようだった。
・・・
→ GPT-4oによるFigmaデザインの自動生成
Twitterの別のユーザは、Figmaのデザイン生成を自動化した方法を説明している。
彼は、実際に人間のデザイナーが行うようなデザインを生成できるAI自動化システムを作りたいと考えていた。
そのために彼は昼夜を問わず3か月間かけてそれを可能にした。
しかし、他のデザイン自動化ツールにはどのような問題があったのだろうか。
彼が自作のデザイン自動化ツールを開発した理由は、以下のポストの通りだ。
私はこのビジョン(Figma デザインの自動生成)を実現するために、2023年5月からGPT-3.5を使用している。
以上を行う動機は、現在市場に出回っているAI2UI製品はすべてテンプレートベースであり、異なる製品要件に対するスケーラビリティに乏しく、人間のデザイナーが持つような要件理解の細やかさを実現できないという点にあった。そこで私は、AIが生成するデザインドラフトの実用性を向上させること(ユーザ自身のデザインシステムを使用してインターフェースを生成すること)を目標に3か月の探索を始め、インターフェース構築プロセス全体に対する画期的なソリューションを発見できるのではないかと期待した。
最初のテストは予想通り非常に粗悪なものだったが、それを改善するために解決すべきさまざまな問題について学んだ。
その後、彼は2回目、3回目、4回目のテストを実施した。
4回目のテストの後、彼は目標の70%を達成したと考えた。
私は、この結果が目標の70%を達成したと考えている。その理由は、以下の機能を備えているからだ。
- Ant Design Mobile や Arco Mobile などの中~高品質のデザインシステムを使用するためのサポート。
- PRD を理解して特定のデータ形式に解析する。
- ローカルスタイル、カスタムアイコンライブラリ、テキストコンテンツを使用した合理的な埋め込み。
- デスクトップ・ウェブでのテスト結果は、モバイル・アプリに比べ約30%洗練されていない(当初はモバイルにフォーカスしていたのだが、デスクトップ用のデザインドラフトを作成するぶんには問題ないと思う)。
- 複数のページ間のインタラクティブなリンクを実現でき、実装のためのパスもすでに存在する。
- 生成されたデザインドラフトはすべて自動レイアウト(適応的ストレッチをサポート)で、意味的に名付けられたレイヤーを持つ。
以下は、彼が実現した自動で生成されたデザイン成果の一部である。
以上の事例についてさらに詳しく知りたい方は、こちらをご覧いただきたい。
・・・
→ UIデザインをフロントエンドコードに変換する
読者諸氏のなかには、私がウェブ開発に関するサービスを提供していることをご存知な人もいるだろう。
そんなわけでクライアントと話し合い、彼らの要望にもとづいてFigma デザインを作成し、デザインを承認してもらってから、React + TailwindCSS でコードを記述している。
通常、以上の作業には多くの時間がかかる。こうした一連の作業は、多くの開発者が従っているのと同じプロセスだ。
しかし、GPT-4oや同様のAIモデルのおかげで、今後はもっと簡単になるだろう。
Twitterのあるクリエイターが、UIデザインをフロントエンドコードに変換するプロセスを共有した。
彼は実際に、GPT-4oにデザインをReact + TailwindCSSコードに変換するよう依頼した。
驚いたことに、実際に「動作する」コードが生成されたのだ。
正直に言うと、GPT-4oは以前のバージョンのChatGPTよりも優れている。
同様に、次のバージョンはさらに良くなるだろう。 ゆえにChatGPTを使って、より短時間でタスクを完了させてみよう。
・・・
→ GPT-4oは初デートのお手伝いをしてくれる
今度の使用例は、以上の例とは少し異なる。
GPT-4oがさまざまな場面で役立つことを示すために、以上のような使用例を紹介してきた。
ところで、初めてのデートに行くことを想像してみよう。あなたが誰であろうと、スマートで自信に満ちた印象をデート相手に与えたいと思うだろう。
そこで GPT-4o が役に立つ。
ライナス・エケンスタム(Linus Ekenstam)はGPT-4oに20の気の利いた一言をリストアップするよう指示することで、このAIがデートでも役立つことを示した。
そして、そのほとんどがとても良かった。こちらが彼の共有した例である。
私もGPT-4oにいくつか気の利いた一言を探してもらったら、次のようなものが返ってきた。
シャルマ氏:初デートで使える最高に気の利いた一言20選を、表形式でリストアップして |
GPT-4o:もちろん、初デートで使える素晴らしい気の利いた一言を20個リストアップします。
|
・・・
→ GPT-4oはリアルタイム翻訳機として動作する
OpenAIチームは、GPT-4oの驚くべき別の使用例を披露した。
今度は、チームメンバーがGPT-4oに英語とイタリア語のリアルタイム翻訳者になってもらうよう頼んだ。
ミラ・ムラティ(Mira Murati)(※訳注6)がイタリア語で話し始めると、同僚は英語で返答した。
2人の会話が交わされるたびにGPT-4oはそれぞれの言葉を瞬時に別の言語に翻訳していた。その自然な流れには驚かされた。
ミラがイタリア語で何か言うと、GPT-4oがすぐに英語の翻訳を音声で読み上げたのだ。
すると同僚が英語で返答し、すぐにイタリア語訳が返ってくる。2人は、GPT-4oを通訳として、スムーズに2か国語での会話をしていた。
双方向のリアルタイム翻訳をとてもスムーズに処理していることに、私は本当に感心した。
GPT-4oのようなツールは、旅行中の言葉の壁を乗り越えるのに非常に役立つことをこの事例は示している。
翻訳アプリやフレーズブックに頼るのではなく、ChatGPT-4oがすべてを瞬時に翻訳しながら、自然な会話を楽しめるのだ。
GPT-4oを使えばコミュニケーションがぐっと楽になり、まるで現地の人と話しているような感覚になるだろう。以上の使用例だけでも、このAIの実用的な可能性を示している。
・・・
この記事を気に入っていただけると幸いです。
記事をお読みいただき、ありがとうございます。
この長文コンテンツが有益だと感じ、サポートしたい場合は、私にコーヒーをおごってください!また、私のSubstackを購読して、私のデジタル製品をもっと探検してください。
原文
『GPT-4o is Going Insane — Here Are 6 (Incredible) Use Cases That Will Leave You Speechless』
著者
ニティン・シャルマ(Nitin Sharma)
翻訳
吉本 幸記(フリーライター、JDLA Deep Learning for GENERAL 2019 #1、生成AIパスポート、JDLA Generative AI Test 2023 #2取得)
編集
おざけん