OpenAI、GPT-5.2をリリース:Google Gemini 3に対抗し、推論と低遅延を強化

AI開発競争が激化する中、OpenAIはGPT-5.2を発表。GPT-5.1からわずか1ヶ月で、遅延低減と推論能力向上を実現し、知識作業を強化する進化版として注目を集めている。

シリーズ5内の進化版

GPT-5.2GPT-5.1の直接的な進化として位置づけられ、コーディング、ビジョン、文書分析、多段階プロジェクトで知識作業を推進。OpenAIによると、長いコンテキストの管理向上、エラー低減、ツール調整能力の強化が図られている。

使用レイヤーの差別化

従来の3バリエーション(Thinking、Pro、Instant)が改善を反映し、より明確に差別化。

  • Thinking:推論、長文書類処理、ツール調整で大幅進化。
  • Pro:コードや技術計算の専門タスクで基準向上。
  • Instant:安定した説明とエラー低減で日常タスクに適応。

これにより、日常業務、複雑作業、専門ニーズの区別が明確になる。

多様な評価で顕著な改善

OpenAIはGPT-5.2GPT-5.1を上回るデータを公開。科学的推論からプログラミング、知識タスクまで優位。

評価ベンチマーク成果
GDPval(44職業の指定作業)70.9%(人間専門家に対する勝利・引き分け)
GPQA Diamond92.4%
AIME 2025100%
FrontierMath前バージョン比向上
ARC-AGI前バージョン比向上

日常タスクでも顕著で、財務アナリストの3状態モデル作成やレバレッジド・バイアウトシミュレーションでThinkingの平均スコアが59.1%から68.4%へ向上。スプレッドシート・プレゼン生成も構造化され、Notion、Box、Shopify、Harveyなどの企業が長期的推論とツール使用の改善を報告。

開発者向けの安定環境

GPT-5.2 Thinkingはソフトウェアテストで高性能を発揮、特に実プロジェクトの完全・一貫した変更適用で優れる。OpenAIはステップシーケンスの調整向上を内部評価とWindsurf、Charlie Labsのフィードバックで確認。

エラー低減と安定性向上

OpenAIはGPT-5.2 ThinkingGPT-5.1比でエラー発生を約30%相対低減と主張。安定した推論と最終応答前の欠陥検知によるもの。感情的不快やメンタルヘルス関連の敏感状況管理も進化したが、モデルは依然不完全。

利用可能場所と価格

GPT-5.2はChatGPTの有料プラン(Plus、Pro、Go、Business、Enterprise)で順次展開。APIではgpt-5.2(Thinking)とgpt-5.2-chat-latest(Instant)として利用可能。GPT-5.1は有料プランで3ヶ月維持。価格は入力トークン1Mあたり1.75ドル、出力14ドルで前バージョンより高めだが、高負荷タスクでの効率向上により最終コスト低減とOpenAIは説明。

Anzai Hotaka

10 年の経験を持つコンピュータ エンジニア。Linux コンピュータ システム管理者、Web プログラマー、システム エンジニア。