デジ未来
AI (エーアイ)
OpenAI、GPT-5.2をリリース：Google Gemini 3に対抗し、推論と低遅延を強化

OpenAI、GPT-5.2をリリース：Google Gemini 3に対抗し、推論と低遅延を強化

X (Twitter) Facebook Pinterest LinkedIn Email

AI開発競争が激化する中、OpenAIはGPT-5.2を発表。GPT-5.1からわずか1ヶ月で、遅延低減と推論能力向上を実現し、知識作業を強化する進化版として注目を集めている。

シリーズ5内の進化版

GPT-5.2はGPT-5.1の直接的な進化として位置づけられ、コーディング、ビジョン、文書分析、多段階プロジェクトで知識作業を推進。OpenAIによると、長いコンテキストの管理向上、エラー低減、ツール調整能力の強化が図られている。

使用レイヤーの差別化

従来の3バリエーション（Thinking、Pro、Instant）が改善を反映し、より明確に差別化。

Thinking：推論、長文書類処理、ツール調整で大幅進化。
Pro：コードや技術計算の専門タスクで基準向上。
Instant：安定した説明とエラー低減で日常タスクに適応。

これにより、日常業務、複雑作業、専門ニーズの区別が明確になる。

多様な評価で顕著な改善

OpenAIはGPT-5.2がGPT-5.1を上回るデータを公開。科学的推論からプログラミング、知識タスクまで優位。

評価ベンチマーク	成果
GDPval（44職業の指定作業）	70.9%（人間専門家に対する勝利・引き分け）
GPQA Diamond	92.4%
AIME 2025	100%
FrontierMath	前バージョン比向上
ARC-AGI	前バージョン比向上

日常タスクでも顕著で、財務アナリストの3状態モデル作成やレバレッジド・バイアウトシミュレーションでThinkingの平均スコアが59.1%から68.4%へ向上。スプレッドシート・プレゼン生成も構造化され、Notion、Box、Shopify、Harveyなどの企業が長期的推論とツール使用の改善を報告。

開発者向けの安定環境

GPT-5.2 Thinkingはソフトウェアテストで高性能を発揮、特に実プロジェクトの完全・一貫した変更適用で優れる。OpenAIはステップシーケンスの調整向上を内部評価とWindsurf、Charlie Labsのフィードバックで確認。

エラー低減と安定性向上

OpenAIはGPT-5.2 ThinkingがGPT-5.1比でエラー発生を約30%相対低減と主張。安定した推論と最終応答前の欠陥検知によるもの。感情的不快やメンタルヘルス関連の敏感状況管理も進化したが、モデルは依然不完全。

利用可能場所と価格

GPT-5.2はChatGPTの有料プラン（Plus、Pro、Go、Business、Enterprise）で順次展開。APIではgpt-5.2（Thinking）とgpt-5.2-chat-latest（Instant）として利用可能。GPT-5.1は有料プランで3ヶ月維持。価格は入力トークン1Mあたり1.75ドル、出力14ドルで前バージョンより高めだが、高負荷タスクでの効率向上により最終コスト低減とOpenAIは説明。