やっぱ世界を変えそうな感じしかしない…。
2023年11月7日未明、OpenAIの開発者向けカンファレンス「DevDay」がスタート、基調講演がYouTubeで配信されました。発表内容をまとめます。
一般ユーザーに関係する内容
要点をまとめると以下のようになります。
1. GPT-4が最新の知識をもつように
新モデル「GPT-4 Turbo」が登場します。

これまでは2021年9月までの知識しかなかった(一部知識が古かった)のですが、2023年4月までの情報に基づいて回答できるように。
2. ChatGPT Plusの全追加機能が同時に使えるように
ブラウジング機能・プラグイン機能・Advanced Data Analysis・画像生成をすべて併用できるようになりました。

インターネット検索機能で調べた内容やAdvanced Data Analysisで画像や資料を解析にかけて得られた情報に基づいて画像生成とかはかなり強力かも。
Advanced Data AnalysisはExcelやらPDF、画像をアップして分析・回答させる機能です。
3. 「カスタムChatGPT」が気軽に使えるようになる
GPTs are a new way for anyone to create a tailored version of ChatGPT to be more helpful in their daily life, at specific tasks, at work, or at home — and then share that creation with others. No code required. https://t.co/SPV4TcMiQwpic.twitter.com/PcmorZwtMF
— OpenAI (@OpenAI) November 6, 2023
これから「特定の課題の解決に特化したChatGPT」が使えるようになっていきます。OpenAIは犬を飼っている人の疑問に回答できるChatGPTをデモしていました。関心の深い人にも的確な回答を。そんな方向性です。
こういったカスタムChatGPTは「GPTs」と呼ばれ、今月末にオープンになる「GPT Store」から利用できるようになります。
4. 無課金ユーザー向けのアップデートはなし
ここまでの話は課金が前提です。約3,000円と高価なのネックですが、「利用価値はどんどん増しているのでそろそろ課金して使ってくださいね」ということかと…。
開発者に関連する内容
今回は開発者向けカンファレンスでの発表ということもあり、アプリなどを開発する人にとって使い出のあるアップデート・機能も多く発表されました(詳細はOpenAIのこのページとこのページをご覧ください)。
1. GPT-4 Turboは超長文プロンプトOK

GPT-4が進化してGPT-4 Turboとなりますが、増えるのは知識だけではありません。扱えるトークン数が128Kに。実に300ページ分のテキストを1つのプロンプトに入れられます。

利用料金も割安です。
2. ひとつのプロンプトで複数の行動を実現できるように

ユーザーが用意した機能(関数)を適宜判断して呼び出してくれる機能「Function Calling」も強化され、ひとつのプロンプトで複数の行動を実現できるように。以前は複数の操作が必要だった「クルマの窓を開けてエアコンをオフに」も1発だそうです。
3. 出力をより制御しやすく

JSONモードが実装され、JSONで細かい指示を出せるようにもなります。
SEED値を設定できる機能(β)もくるそうです。
4. 「ユーザーが欲しい情報をいい感じに出力するAIアプリ」が作れる
デモで紹介されていた旅アプリ「Wanderlust」が非常に便利そうでした。

このアプリは「予定の行き先でするといいことは?」と聞くと、それらを挙げるだけでなく「どこでできるか」を地図上に表示して返していました。

その後、航空機のチケットやホテルの予約票をアップロードすると…

ユーザーが必要な情報をまとめたPDF(旅のしおり)まで出力していました。行き先の場所をまとめた地図も、フライトや宿泊先の情報も綺麗にレイアウトされています。
ユーザーはたった数回の入力を行っただけ、AIがいい感じに判断してそこまでやってくれたのです。

この高度なAIアプリを実現したのが「Assistants API」。コード実行・ファイルアップロード・API呼び出しをAIに行なわせるといった機能群です。
・Code Interpreter:Pythonコードを実行して図表などを出力できる機能
・Retrieval:製品情報などをまとめたドキュメントなどの外部ファイルを読み込んでAIで処理できるようにする機能
・Function Calling:指定した機能を適宜呼び出して処理を行ない、ユーザーに対する返答に結果を返す機能
5. 高度な画像認識・テキスト出力を活用したアプリが作れる

デモで視覚障害のある方向けの「世界を見て伝えるアプリ」が紹介されていました。GPT-4 Turboは画像認識にも対応しており、画像を読み解き、文章で表現できます。現状最高鋒の推論能力とマルチモーダルのかけあわせ、です。
6. DALL·E 3で画像生成できるアプリも作れるように

先日、ChatGPT Plusで開放された画像生成AI「DALL·E 3」もAPI利用が可能に。自らのアプリに組み込めるようになりました。
7. GPT Builderで「カスタムChatGPT」を作ろう

先に紹介した、特定の目的に特化した「カスタムChatGPT」はGPT Builderというツールを用いて自ら製作することも可能です。手持ちのデータを読み込ませるなどして、専門知識を補ったりもできる模様。
作ったカスタムChatGPTはGPT Storeで共有できるそうなんですが…GPT Storeにはレベニューシェアがあるようです(詳細はこれからアナウンス)。作ったカスタムChatGPTを収益化できたり…しちゃうんでしょうか?
高度なAPI利用がどんどん開放されており、ソフトウェア開発がガラっと変わる可能性があるかなと。もし今後ユーザーに浸透するアプリが“ChatGPTアプリ”になるなら…ChatGPTの影響力はすさまじいことになりそうです。
今はまだ、必ずしもみんなが活用しているわけではないChatGPT。来年には誰もがそれと知らずに当たり前のように使っている、そんな状態になっているかもしれません。
Source: YouTube, OpenAI (1, 2), X
2023年11月7日9:00:抜け落ちていた情報の参照元や説明を補うとともに、Function Callingの説明に含まれていた誤りを修正いたしました。