2026年4月21日、OpenAIが次世代画像生成モデル「GPT-Image-2」を正式公開した。APIモデル名は gpt-image-2、ChatGPT上での名称は「ChatGPT Images 2.0」。リリースから12時間でImage Arenaのリーダーボード3部門(Text-to-Image・Single-Image Edit・Multi-Image Edit)すべてを1位に塗り替えた。
日本のX(旧Twitter)でも正式リリース前から多くのクリエイターが先行テストの報告を上げており、正式公開後もさまざまな作例・感想・比較が飛び交っている。今回は、盛り上がった投稿を15件まとめて紹介する。
GPT-Image-2がDALL-E 3から変わったこと
まず前提として、何が変わったかを整理しておく。

日本語ユーザーにとって最も大きいのはテキスト精度の改善だ。DALL-E 3では漢字・ひらがな・カタカナが混在する日本語テキストの描画が難しく、文字化けや意味不明な字形が出ることが多かった。GPT-Image-2では99%超の精度を目標に設計されており、日本語テキストをプロンプトに含めても崩れないという声が多数出ている。
解像度は最大2K(2048px)に対応し、APIではさらに4Kのベータ提供も始まっている。アスペクト比も3:1から1:3まで対応するため、SNSバナーから縦型コンテンツまで幅広い用途に使える。
正式リリース前から話題になっていた
GPT-Image-2が最初に注目されたのは、正式発表より前のことだった。AIモデル比較サービス「arena.ai(LM Arena)」に「maskingtape-alpha」「duct-tape-1」「duct-tape-2」などのコードネームで登場し、日本のAIコミュニティがその正体に気づいた。
先行公開の段階から「テキスト描画の精度が異次元」「写実性が大幅向上」という評価が広まっていた。
「日本語の描画がうまくなってほしい」という期待の声も早くから上がっていた。これが後に実際に実現されることになる。
arena.aiで試した人たちの反応
コードネームを特定したコミュニティの間で、arena.aiで試す方法が共有され始めた。
「サムを生成させるとバージョンがわかる」という判別方法が話題になった。
「image1.5とimage2.0でこうも違うのか」という驚きの声が続いた。日本語描写の質がNano Banana Proに引けを取らないという評価も出始めた。
現時点での最強モデルとして定着していたNano Banana Proを超えるかどうかが話題の焦点になっていった。
コードネーム解読が盛んになった
コードネームの一覧をまとめる投稿が多数出た。コミュニティが協力してどのコードネームがGPT-Image-2に対応しているかを解析する動きが活発になった。
arena.aiでの引き当て手順を解説した投稿も大きく拡散された。ランダム性があるため何度も試す必要があるが、当たったときの作例は品質が高いという声が相次いだ。
無料で試す方法を紹介する投稿も登場した。特に日本語テキストの忠実度の高さが驚きをもって受け止められた。
キャラクターシートや広告への応用
キャラクターシートの生成クオリティを評価する投稿が目立った。これまで「プロンプトに書いても表示されない」とされていた細かい設定が、実際に画像に反映されるようになっているという。
GPT-Image-2 vs Nano Banana Proの比較実験を行ったクリエイターは「GPT-Image-2は完璧だが、好きなものを勝手に追加してくる」と評した。
正式リリース後の反応
正式リリース後、これまでA/Bテストでしか体験できなかったユーザーへの展開が進んだ。「日本語テキストの文字化けがほぼ直った」という声が多く上がった。
広告画像の生成を試したユーザーからも高い評価の声が届いた。
「1枚の画像で4種類の広告を生成した」というデザイナーの投稿は特に大きな反響を呼んだ。「ワクワクなのか恐れなのかわからない」という複雑な感情を吐露するコメントも印象的だった。
全ユーザーへのロールアウト報告
全ユーザーへの展開が始まったことを伝える投稿が出てきたのもこのタイミングだ。
料金の目安
APIで使う場合の料金は1枚あたりで以下のとおり。
| 品質 | 料金(1024×1024換算) |
|---|---|
| Low | $0.006(約1円) |
| Medium | $0.053(約8円) |
| High | $0.211(約32円) |
ChatGPTで使う場合はFreeプランでも制限付きで利用できる。Plusプラン($20/月)でThinking Modeにも対応する。
なお、DALL-E 2 / DALL-E 3は2026年5月12日に退役が予定されており、APIを利用している開発者はGPT-Image-2への移行が必要になる。
まとめ
日本のXでの反応を見ると、最も大きなテーマは「日本語テキスト崩れの解消」だった。これはそれまでのChatGPT画像生成の弱点として長年指摘されてきたものであり、ユーザーの期待が高かった分、改善されたときの反響も大きかった。
デザイナー・クリエイター層からは広告制作への実務活用を意識した投稿が目立ち、「制作時間が半分以下になる」という期待の声も出ている。一方で、AIの進化に純粋に感動しながらも「ワクワクと恐れが混じっている」という複雑な感情を吐露する声も散見された。
正式リリースから間もないが、すでにImage Arenaで最強モデルの評価を得ており、しばらくは日本語クリエイターにとってもっとも注目すべき画像生成AIの一つであり続けそうだ。


