OpenAI、GPT-5.2をリリース:Google Gemini 3に対抗し、推論と低遅延を強化

AI開発競争が激化する中、OpenAIはGPT-5.2を発表。GPT-5.1からわずか1ヶ月で、遅延低減と推論能力向上を実現し、知識作業を強化する進化版として注目を集めている。
シリーズ5内の進化版
GPT-5.2はGPT-5.1の直接的な進化として位置づけられ、コーディング、ビジョン、文書分析、多段階プロジェクトで知識作業を推進。OpenAIによると、長いコンテキストの管理向上、エラー低減、ツール調整能力の強化が図られている。
使用レイヤーの差別化
従来の3バリエーション(Thinking、Pro、Instant)が改善を反映し、より明確に差別化。
- Thinking:推論、長文書類処理、ツール調整で大幅進化。
- Pro:コードや技術計算の専門タスクで基準向上。
- Instant:安定した説明とエラー低減で日常タスクに適応。
これにより、日常業務、複雑作業、専門ニーズの区別が明確になる。
多様な評価で顕著な改善
OpenAIはGPT-5.2がGPT-5.1を上回るデータを公開。科学的推論からプログラミング、知識タスクまで優位。
| 評価ベンチマーク | 成果 |
|---|---|
| GDPval(44職業の指定作業) | 70.9%(人間専門家に対する勝利・引き分け) |
| GPQA Diamond | 92.4% |
| AIME 2025 | 100% |
| FrontierMath | 前バージョン比向上 |
| ARC-AGI | 前バージョン比向上 |
日常タスクでも顕著で、財務アナリストの3状態モデル作成やレバレッジド・バイアウトシミュレーションでThinkingの平均スコアが59.1%から68.4%へ向上。スプレッドシート・プレゼン生成も構造化され、Notion、Box、Shopify、Harveyなどの企業が長期的推論とツール使用の改善を報告。
開発者向けの安定環境
GPT-5.2 Thinkingはソフトウェアテストで高性能を発揮、特に実プロジェクトの完全・一貫した変更適用で優れる。OpenAIはステップシーケンスの調整向上を内部評価とWindsurf、Charlie Labsのフィードバックで確認。
エラー低減と安定性向上
OpenAIはGPT-5.2 ThinkingがGPT-5.1比でエラー発生を約30%相対低減と主張。安定した推論と最終応答前の欠陥検知によるもの。感情的不快やメンタルヘルス関連の敏感状況管理も進化したが、モデルは依然不完全。
利用可能場所と価格
GPT-5.2はChatGPTの有料プラン(Plus、Pro、Go、Business、Enterprise)で順次展開。APIではgpt-5.2(Thinking)とgpt-5.2-chat-latest(Instant)として利用可能。GPT-5.1は有料プランで3ヶ月維持。価格は入力トークン1Mあたり1.75ドル、出力14ドルで前バージョンより高めだが、高負荷タスクでの効率向上により最終コスト低減とOpenAIは説明。





