Arenaに現れた3つの謎のモデル
2026年4月4日から5日にかけて、AI評価プラットフォームのArena(旧LMArena)に正体不明のモデルが3つ現れた。コードネームは maskingtape-alpha、gaffertape-alpha、packingtape-alpha。発見から数時間以内に姿を消したため、リリース前のグレースケールテスト(限定A/Bテスト)だったとみられている。
業界の見立てでは、これらは GPT Image 2の3バリアント——標準品質・高品質・高速低コスト——にそれぞれ対応している。名前がぜんぶ「テープ」なのはなんとも地味なコードネームだが、中身はそう地味ではない。
OpenAIは2026年4月17日時点で、GPT Image 2について公式ブログ・APIドキュメント・モデルページのいずれも出していない。情報の大半はテスターの報告と業界レポートに依存している点は念頭に置いておきたい。
なぜ今これが重要なのか
GPT Image 2のリーク自体は「へえ、すごいね」で終わる話かもしれない。だが同時進行で、開発者にとってより切実な締め切りが迫っている。
DALL-E 2とDALL-E 3のAPIが、2026年5月12日に廃止される。
OpenAIが告知したのは2025年11月14日。つまり半年近く前に予告されていた。それでも今この記事を読んでいる方の中には「そういえばまだ移行してない」という人が一定数いるはずだ。残り約3週間は、決して余裕のあるスケジュールではない。
GPT Image 2の5大アップグレード:数字で見る進化
リーク情報と業界レポートをもとに整理すると、GPT Image 1.5からの主な改善点は以下の5つだ。
1. テキスト描画精度:90〜95% → 99%超
複数単語の看板・製品ラベル・広告コピーで誤字がほぼなくなるレベルとされている。テキスト入り画像の生成精度は実務でよく問題になる部分なので、ここの改善は地味に効く。
2. カラーキャスト(黄みがかり)の解消
GPT Image 1.5でよく報告されていた「イエローキャスト」が解消されたとのこと。ブラインド比較でGoogle Nano Banana Proに対しても高評価を獲得したと伝えられている。
3. ワールドナレッジの大幅向上
著名な建物・製品・ブランドを「それとわかる形で描画できる」ようになったという評価が複数ある。固有名詞への対応精度は、マーケティング用途では特に響く改善だ。
4. 独立アーキテクチャ(自己回帰生成)
GPT Image 1.5はGPT-4oのマルチモーダル機能の一部として画像生成を行っていた。GPT Image 2はそこから独立し、言語モデル内部での自己回帰生成(autoregressive generation)を採用しているとされる。
5. 解像度:最大2048×2048〜4Kレベル
GPT Image 1.5の上限が1536×1024だったのに対し、2048×2048以上への対応が予想されている。商用印刷やOOH広告への活用可能性が広がる。
AIおじさんの見方:「自己回帰生成」という構造変化の意味
5つの改善点のうち、個人的に一番注目しているのは4番目の「独立アーキテクチャ」だ。
これまでのGPT-4oの画像生成は、いわば「言語モデルのついでの機能」という位置づけだった。GPT Image 2が本当に自己回帰生成を独立した形で実装しているなら、テキストと画像の統合がより深くなる。具体的には、長い説明文や複雑な指示を画像に反映する能力が上がりやすい構造になる。
DALL-Eのような拡散モデルとは根本的に違うアプローチだ。拡散モデルがノイズから画像を「引き算」で生成するのに対し、自己回帰生成はトークンを「足し算」で積み上げていく。テキスト描画精度が99%超まで上がったとされる背景にも、この構造変化が関係している可能性が高い。
もっとも、これはあくまでリーク情報の解釈だ。正式発表が出るまでは確定事項として扱わないほうがいい。
実務的な移行手順:今すぐ確認すべきコードの差分
GPT Image 2の正式リリースは2026年4月末〜5月中旬と見込まれているが、DALL-Eの廃止は5月12日。タイミングが重なる可能性があり、移行は今すぐ始めるべきだ。
移行先の選び方
| 移行元 | 推奨移行先 | 備考 |
|---|---|---|
| DALL-E 3(高品質用途) | gpt-image-1.5 | 現行フラッグシップ |
| DALL-E 3(コスト重視) | gpt-image-1-mini | $0.005/画像〜 |
| DALL-E 2 | gpt-image-1-mini | コスト互換性 |
DALL-E 3からgpt-image-1.5への移行コード
from openai import OpenAI
client = OpenAI()
# 移行後: gpt-image-1.5
response = client.images.generate(
model="gpt-image-1.5",
prompt="A futuristic cityscape at night",
size="1024x1024",
quality="high", # "low" / "medium" / "high" / "auto"
n=1,
)
image_url = response.data[0].url
print(image_url)
最大の注意点は qualityパラメータの値が変わること。DALL-E 3では "standard" / "hd" だったが、gpt-image-1.5では "low" / "medium" / "high" / "auto" になる。ここを変え忘れるとエラーになるので、移行時には必ずチェックしてほしい。
料金の目安(gpt-image-1.5、2026年4月時点)
| サイズ | Low | Medium | High |
|---|---|---|---|
| 1024×1024 | $0.009 | $0.034 | $0.133 |
| 1024×1536 | $0.013 | $0.050 | $0.200 |
| 1536×1024 | $0.013 | $0.050 | $0.200 |
トークンベースの料金では、入力$8/1Mトークン・出力$32/1Mトークン。gpt-image-1比で約20%安いとされている。
また、Arena Eloスコアは1,264(2026年2月時点)で業界トップクラスの評価を得ている。数字として把握しておくと、社内や顧客への説明がしやすい。
まとめ:GPT Image 2を待ちながら今できることをやる
GPT Image 2の正式発表はまだない。リーク情報は面白いが、確定情報として扱うのは時期尚早だ。
ただ、DALL-Eの廃止は確定している。5月12日まで3週間を切っている。「GPT Image 2が出てから考えよう」という判断は、廃止後に何も使えなくなるリスクと隣り合わせだ。
今すぐgpt-image-1.5かgpt-image-1-miniへの移行を進めておき、GPT Image 2が出たらそこからアップグレードする——それが現時点での最も堅実な動き方だと思っている。
元記事の詳細なコードサンプルや料金表はQiitaの原文(kai_kouさんの記事)で確認を。