2026年4月23日(日本時間同日深夜)、OpenAIが新モデル「GPT-5.5」をChatGPTとCodexに展開した。公式の表現は「a new class of intelligence for real work」——ベンチマーク競争よりも実際の業務での精度向上を前面に出したリリースだ。
GPT-5.4から6週間でのリリースとなる。コードネームは「Spud」。
GPT-5.5で何が変わったか
中心的な改善は3点だ。
1つ目はマルチステップタスクの処理精度。単発の質問への回答精度ではなく、複数ステップにわたる計画・実行・自己検証のサイクルが改善されている。Greg Brockmanは「より少ないガイダンスでより多くのことができる」と述べており、ユーザーが細かく指示しなくても意図をつかんで動ける設計になってきていることを強調した。
2つ目はCodexとの統合強化。コーディング支援ツール「Codex」との連携が深まり、コードの生成・レビュー・デバッグをより自律的に行えるようになった。Plus以上のプランでCodexも同時に利用可能で、コンテキストウィンドウは最大400Kに対応している。
3つ目はトークン効率の向上。GPT-5.4と同等以上の結果をより少ないトークンで実現するという設計になっている。APIの入力単価は$5.00/1Mトークン、出力は$30.00/1Mトークンと前モデルの2倍になっているが、実質コストはトークン効率向上で抑えられるという考え方だ。
ベンチマークスコア
主要なエージェント系タスクで高いスコアを記録している。
| ベンチマーク | スコア |
|---|---|
| GDPval | 84.9% |
| OSWorld-Verified | 78.7% |
| Tau2-bench Telecom | 98.0% |
OSWorldはコンピュータ操作タスクの評価で、実際のGUIをAIが操作して目標を達成できるかを測る。78.7%という数字はコンピュータ操作エージェントとしての実用水準に踏み込んできたことを示している。
利用できるプランと機能

GPT-5.5はPlusプラン($20/月)から利用できる。より高性能な「GPT-5.5 Pro」はProプラン($200/月)以上が対象だ。コーディング支援のCodexはPlus以上の全プランで統合されている。
APIの提供は「very soon」とされており、リリース時点ではまだ直接APIからのアクセスはできない状態だが、数日以内の対応が見込まれる。
リリース前から日本のXで動きがあった
正式発表の数日前から、日本のAIコミュニティでもGPT-5.5への期待を示す投稿が出始めていた。
「早期アクセスで試した方が5.4とそんな大差ない」という冷静な評価も混じっていた。実際のところ、ベンチマーク上の改善幅はGPT-5からGPT-5.4ほどの飛躍ではなく、段階的な洗練という印象に近い。
リリース直前には「今週出る」という情報が広まり、OpenRouterのモデルリストに gpt-5.5 gpt-5.5-pro が事前に掲載されるなど、発表前からリーク情報が出回っていた。
「NS41」(Base64デコードで"5.5")という暗号めいた投稿からOpenAIの公式Devsがリリースを示唆したことも話題になった。
「事前学習の手法を全く変えた」という噂もあり、「なぜGPT-6ではないのか」という疑問も上がっていた。OpenAIはバージョニングの理由について公式には説明していない。
GPT-5.4との違いをどう見るか
GPT-5.4が出たのは2026年3月。そこから6週間でGPT-5.5というペースは、OpenAIのモデルリリースサイクルが短期化していることを示している。
OpenAIは安全性の強化も強調しており、「最強の安全策(strongest safeguards to date)」として、サイバー攻撃の指示を防ぐ仕組みや悪用防止機能が加えられているという。金融機関のCIOからは「幻覚(ハルシネーション)耐性が大幅に改善された」という評価も出ている。
一方、ユーザー側からは「改善が細かすぎてGPT-5.4との違いがわかりにくい」という声もある。GPT-5という大きなジャンプを経験した後では、0.1刻みの改善は感覚的につかみにくい。
まとめ
GPT-5.5は性能の大幅なジャンプというより、実務での信頼性・自律性・効率の積み上げという位置づけのリリースだ。エージェント型タスクやCodexを使ったコーディング支援に関心があるユーザーは試してみる価値がある。
APIは近日公開予定のため、自社サービスへの組み込みを検討している開発者はタイミングをチェックしておきたい。


