OpenAI Codex App Server公開:汎用エージェントハーネスの登場

OpenAI Codex App Server:コーディングエージェントの新しい標準

  • OpenAIがCodex App Serverアーキテクチャを公開
  • JSON-RPC 2.0ベースの双方向通信プロトコル
  • 100万人以上の開発者がすでにCodexを使用中

何が起きたのか?

OpenAIがCodexのコアインフラであるApp Serverアーキテクチャを詳細に公開した。Codex App Serverは、VS Code拡張機能のようなリッチクライアントを駆動するインターフェースだ。[OpenAI Developers]認証、会話履歴、承認プロセス、ストリーミングエージェントイベントを統合管理する。

プロトコルはJSON-RPC 2.0をベースとし、stdioを通じてJSONL形式で双方向通信する。[OpenAI Developers]Thread(会話)、Turn(単一リクエスト-レスポンス)、Item(メッセージ、コマンド、ファイル変更)の3つのコア概念で構成される。

なぜ重要なのか?

Codexを「プログラマー向けツールに偽装した汎用エージェントハーネス」と呼ぶのには理由がある。[Simon Willison]App Serverが公開されたことで、開発者は自社製品にCodexを深く統合できるようになった。既存のCLIや単純なAPI呼び出しを超えて、リアルタイムエージェントイベントストリーミングと承認フローを直接実装できる。

GPT-5.2-Codexのリリース以降、Codex全体の使用量は2倍に増加し、過去1ヶ月で100万人以上の開発者がCodexを使用した。[Simon Willison]macOSアプリのリリースとともに、複数エージェントの並列実行、自動化スケジューリング機能が追加され、エージェントコーディングワークフローが本格化した。

今後どうなるか?

App Server v2はすでにコラボレーションツール呼び出しをターンストリームのアイテムイベントとして放送している。spawn_agentでエージェントロールプリセットを指定し、send_inputで実行中のエージェントを中断できる。マルチエージェントコラボレーションがより精巧になる見込みだ。

現在、自動化機能はローカル実行が必要だが、クラウドベースバージョンが予告されている。WindowsサポートもElectronベースで準備中だが、OSレベルのサンドボックス制限により遅延している。MCP(Model Context Protocol)統合とOAuthログインフローサポートにより、外部サービス連携が拡大する見通しだ。

よくある質問(FAQ)

Q: Codex App Serverは無料で使用できるか?

A: 現在、ChatGPTの無料および有料ユーザーの両方がCodex機能を利用できる。Plus、Pro、Business、Enterprise、Eduユーザーは一時的にリクエスト制限が2倍に引き上げられた。オープンソース実装はGitHub(openai/codex/codex-rs/app-server)で確認できる。

Q: 既存のCodex CLIとApp Serverの違いは?

A: CLIはターミナルで単一セッションを処理するのに対し、App Serverは認証、会話履歴、承認フロー、リアルタイムイベントストリーミングを含むエージェントエコシステム全体を管理する。自社製品にCodexを統合するにはApp Serverを使用すべきだ。

Q: App Serverでどんな製品を作れるか?

A: VS Code拡張機能のようなIDE統合、カスタムコーディングエージェントプラットフォーム、自動化コードレビューシステムなどを構築できる。Thread/Turn/Itemベースのプロトコルで会話状態管理が体系的であり、承認システムでエージェントのファイル修正やコマンド実行を制御できる。


この記事が役に立ったら、AI Digesterを購読してください。

参考資料

コメントする