GPT-5.4 と GPT-5.4 Pro 徹底解説
OpenAI 2026年3月最新フラッグシップモデル — ネイティブComputer Use、Tool Search、設定可能な推論、Claude Opus 4.6との本格比較
GPT-5.4 主要ハイライト
SWE-bench Verifiedで約80.0%、HumanEval 95.1%を達成 — Claude Opus 4.6に匹敵。
初のネイティブコンピュータ操作対応汎用モデル。OSWorld-Verifiedで75%、人間のベースラインを超越。
標準272K、APIモードで1Mトークンのコンテキストウィンドウ — Claude Opus 4.6と同等。
新しいツール呼び出しシステムにより、ツール集約型ワークフローでトークンを47%節約、コストを大幅削減。
GPT-5.4の新機能
2026年3月5日リリースのGPT-5.4は、OpenAI初のネイティブComputer Use対応汎用モデル。OSWorldで75%を達成し、人間のベースラインを超越。
GPT-5.4 Proはエンタープライズ向けディープ推論版で、料金は$30/$180(入力/出力)。922K入力 + 128K出力の超長コンテキストに対応。両方ともQCode.ccで利用可能。
設定可能な推論レベル
5段階の推論レベル(low/medium/highなど)で、推論の深さとコストのバランスを柔軟に制御。
中間修正機能
Mid-response Course Correction — 生成中に自己修正、GPT-5.2比で虚偽主張を33%削減。
Codex Security
2026-03-06リリースのAIセキュリティエージェント。120万コミットをスキャンし10,561件の高重要度問題を発見、誤検出50%+削減。
Codex CLI統合
GPT-5.4がCodexのデフォルトモデルに。CLIターミナル、Slack統合、サブエージェントなど複数のワークモードに対応。
GPT-5.4 モデルファミリー
| モデル | リリース日 | コンテキスト | ポジショニング |
|---|---|---|---|
| GPT-5.4 | 2026-03 | 1M tokens | フラッグシップ汎用($2.50/$15) |
| GPT-5.3 Instant | 2026-03 | 128K tokens | 日常使用 |
| GPT-5.3-Codex | 2026-02 | 400K tokens | コーディング最適化(Codexデフォルト) |
| GPT-5.2 Thinking | 2025-12 | 400K tokens | ディープ推論($30/$180) |
GPT-5.4 vs Claude Opus 4.6
GPT-5.4は目覚ましい進歩を遂げましたが、Claude Opus 4.6はコーディングシナリオで複数の優位性を維持。客観的な比較:
GPT-5.4
- 入力料金が安い($2.50 vs $5)、標準タスクでのコスト優位性
- ネイティブComputer Use対応、自動化機能がより成熟
- Tool Searchでトークンを47%節約、ツール多用シナリオでより経済的
- Copilot + GitHubエコシステムとの深い統合でエンタープライズワークフローに最適
Claude Opus 4.6 / Sonnet 4.6
- SWE-bench 80.8%(GPT-5.4は~80.0%)— コーディングベンチマークでわずかにリード
- 1Mコンテキスト + Adaptive Thinkingによる柔軟な推論
- ネイティブClaude Code CLI + Agent Teamsマルチエージェント協調
- コードベース理解の深さは業界最高、中国語コーディングにも優れる
2026年3月のAIコーディングツール市場は成熟期に — Claude Opus 4.6はコーディング推論の深さとコードベース理解でリードし、GPT-5.4は料金とツール呼び出しで優位性を持つ。QCode.ccなら、ClaudeとCodexの両モデルファミリーに一括アクセスし、タスクに最適なツールを選択可能。
Codex CLI v0.104:Rust書き直しとMCP統合
2026年3月、OpenAIがCodex CLI v0.104をリリース。Rustで書き直しパフォーマンスを向上、MCP統合とWeb検索を追加。
Rust構築
Node.jsからRustへ移行、起動速度とメモリ効率が大幅向上
MCP統合
~/.codex/config.tomlでMCPサーバーを設定可能
Web検索
内蔵Web検索、自動キャッシュで最新情報を取得