AI知識まとめノート
CodexがネイティブブラウザとPC操作を統合。Claude Code・Gemini CLIとの現時点の実力差も整理する

CodexがネイティブブラウザとPC操作を統合。Claude Code・Gemini CLIとの現時点の実力差も整理する

OpenAIは2026年4月16日、Codexに「Codex for (almost) everything」と名付けた大型アップデートを展開した。コーディングアシスタントとして登場したCodexが、ブラウザ操作・PC全操作・画像生成・長期タスク自動化まで対応する汎用エージェントへと大きく進化した。


今回のアップデートで何が変わったか

最も話題になっているのがネイティブブラウザの統合だ。Codexデスクトップアプリにインアップブラウザが搭載され、ローカルの開発サーバーや公開ページを開きながら作業できるようになった。

操作方法は直感的だ。ブラウザ内のページを表示しながら直接コメントを書き込み、「ここのレイアウトを直して」「このボタンが押せない」と指示するとCodexがその箇所を認識して修正コードを生成する。これまではスクリーンショットを撮って貼り付けるか、URLとエラー内容を言語で説明する必要があったが、視覚的に指示できるようになった。

BrowserプラグインをオンにするとCodexがこの組み込みブラウザを自律的に操作できる。クリック・テキスト入力・DOMの状態確認・スクリーンショット撮影といった操作をAIが行いながら、UIバグの修正確認や動作テストを自動で進めることができる。

コードエディタとブラウザをAIが跨いで操作するCodexの新しい開発体験


PCの全アプリを操作できる「コンピュータ使用」機能

ブラウザ統合と同時に、PC全体の操作機能も追加された。Codexが自分専用のカーソルを持ち、スクリーンを見ながらクリック・タイピングを行える。Figmaで開いているデザインを確認しながらコードを書いたり、Excelのデータを読み取りながら処理スクリプトを書くといった作業が一つの流れでできるようになる。


90以上の新プラグイン

今回のアップデートで追加されたプラグインは90種類以上。主なものを挙げると、Atlassian Rovo、CircleCI、CodeRabbit、GitLab Issues、Microsoft Suite(Word/Excel/PowerPoint)、Neon by Databricks、Render、Remotionなどが含まれる。開発ワークフローで使うツールをCodexから直接操作できるようになった。


画像生成と長期タスクの自動化

画像生成もCodexの中に組み込まれた。gpt-image-1.5を使って、コードと組み合わせた形でUIモックアップや製品コンセプト画像、ゲームのビジュアルを同じワークフロー内で生成できる。

自動化機能も拡張された。既存の会話スレッドを再利用してタスクを続けたり、Codexが自分でスケジュールを設定して数日・数週間にわたる長期タスクを自律的にこなしたりすることができるようになった。

その他、GitHubのレビューコメントへの対応、複数ターミナルタブの同時操作、SSH経由のリモート開発ボックス接続、PDF・スプレッドシート・スライドのリッチプレビューなども追加されている。モデルはGPT-5.5が使えるようになった。


Claude Code・Gemini CLIとの実力比較

今回のアップデートを受けて、主要3ツールの現時点での立ち位置を整理する。

Codex・Claude Code・Gemini CLIの3ツール比較

コードの品質と精度ではClaude Codeがリードしている。SWE-bench Verifiedで80.9%というスコアは3ツール中最高で、複雑な複数ファイルにまたがる編集の初回正解率は約92%とされる。コードレビューや大規模リファクタリングでの安定感が際立つ。

コンテキストの広さではGemini CLIが強い。Gemini 2.5 Proを使った1M以上のトークン処理で、中規模リポジトリ全体を1回のセッションに収めることができる。大きなコードベースを一気に見渡したい場合や、リサーチと実装を一気に進めたい場合に向いている。無料枠が充実している点もGemini CLIの特徴だ。

Codexはブラウザ・PC操作・プラグインエコシステムという新しい軸で存在感を高めている。単一ファイルや意図ベースのタスク、UIバグ修正のような視覚的なフィードバックが必要な作業ではCodexの体験が際立つ。ChatGPTのサブスクリプションがあれば追加コストなしで使える点も評価されている。


どれを選ぶか

使い分けの目安は次のように整理できる。

複雑なリファクタリングやコードレビュー重視ならClaude Code。大きなコードベースを一括で扱いたい、または無料で始めたいならGemini CLI。UIのビジュアル確認や複数ツール連携・PC操作まで含めたエージェント体験を試したいならCodex。

3ツールとも急速に機能が重なってきており、明確な序列をつけることが難しくなっている。目的に合わせて試してみることが現実的な判断軸になる。


まとめ

「Codex for (almost) everything」というアップデート名は誇張ではない。コーディングのみに特化したツールではなく、開発全体のワークフローを一手に引き受ける方向に大きく舵を切った。ブラウザとPCを跨いだ操作体験はこれまでのコーディングエージェントにはなかったもので、Claude CodeやGemini CLIとは異なる価値を提供しはじめている。

参考リンク

関連記事