GoogleがGemini 3.1 Proをリリース、推論能力で競合を圧倒

GoogleはGemini 3.1 Proを発表した。このモデルはGemini 3 Pro3か月後のアップデートだ。抽象的推論で大幅向上し、AnthropicやOpenAIを上回る。

Gemini 3.1 Proとは何ですか?

GoogleはGemini 3 Proから3か月Gemini 3.1 Proを公開した。

この.1アップデートは見た目以上に影響大だ。

前モデルより推論能力が大幅改善した。Gemini 3 Deep Thinkの基盤でもある。

どこで利用可能ですか?

本日よりGeminiアプリで利用できる。

NotebookLM(Pro/Ultraプラン)、AI Studio経由のAPI、Vertex AIで企業利用可能だ。

  • Geminiアプリ:即時アクセス
  • NotebookLM:有料プラン限定
  • API:開発者向け
  • Vertex AI:企業環境

ベンチマークでどれだけ優位ですか?

ARC-AGI-277.1%を達成した。新規論理パターンを解くテストだ。

比較:Gemini 3 Pro31.1%Claude Sonnet 4.658.3%Opus 4.668.8%

モデルARC-AGI-2スコア
Gemini 3.1 Pro77.1%
Gemini 3 Pro31.1%
Claude Sonnet 4.658.3%
Opus 4.668.8%

中間アップデートでこれほど進化は前例なしだ。

他のベンチマークはどうですか?

発表の表で多数首位だ。

  • Humanity’s Last Exam(ツールなし): 44.4%
  • GPQA Diamond94.3%
  • APEX-Agents:前モデルの2倍
  • MCP AtlasBrowseCompMMMLUで優位

GDPval-AA EloではClaude Sonnet 4.6(1,633)が上回る(1,317)。

SWE-Bench VerifiedではOpus 4.6(80.8%)が僅差で勝る(80.6%)。

全体ではGemini 3.1 Proが優勢だ。

Arena LeaderboardではClaude Opus 4.6がテキスト/コードで先行するが、主観評価だ。

Googleの競争優位性は何ですか?

Googleの強みはモデル性能だけではない。

SearchGmailYouTubeAndroidDocsなどに統合済みだ。

OpenAIやAnthropicは専用アプリが必要。Googleは日常ツールに既に存在する。

価格とアクセスはどうですか?

Google AI Plus/Pro/Ultraで利用可能。無料プランでも限定試用可。

現在プレビュー版だ。エコシステム全体+ストレージ込みで競争力高い。

開発者APIも低価格だ。

今後の展望は?

GoogleはAI競争に遅れを取ったが、1年で挽回した。

Gemini 3から3.1の推論向上はライバル超えだ。

インターネット入口を支配。収益化が課題だが、勢いづいている。

Anzai Hotaka

10 年の経験を持つコンピュータ エンジニア。Linux コンピュータ システム管理者、Web プログラマー、システム エンジニア。