GoogleがGemini 3.1 Proをリリース、推論能力で競合を圧倒

GoogleはGemini 3.1 Proを発表した。このモデルはGemini 3 Proの3か月後のアップデートだ。抽象的推論で大幅向上し、AnthropicやOpenAIを上回る。
Gemini 3.1 Proとは何ですか?
GoogleはGemini 3 Proから3か月でGemini 3.1 Proを公開した。
この.1アップデートは見た目以上に影響大だ。
前モデルより推論能力が大幅改善した。Gemini 3 Deep Thinkの基盤でもある。
どこで利用可能ですか?
本日よりGeminiアプリで利用できる。
NotebookLM(Pro/Ultraプラン)、AI Studio経由のAPI、Vertex AIで企業利用可能だ。
- Geminiアプリ:即時アクセス
- NotebookLM:有料プラン限定
- API:開発者向け
- Vertex AI:企業環境
ベンチマークでどれだけ優位ですか?
ARC-AGI-2で77.1%を達成した。新規論理パターンを解くテストだ。
比較:Gemini 3 Proは31.1%、Claude Sonnet 4.6は58.3%、Opus 4.6は68.8%。
| モデル | ARC-AGI-2スコア |
|---|---|
| Gemini 3.1 Pro | 77.1% |
| Gemini 3 Pro | 31.1% |
| Claude Sonnet 4.6 | 58.3% |
| Opus 4.6 | 68.8% |
中間アップデートでこれほど進化は前例なしだ。
他のベンチマークはどうですか?
発表の表で多数首位だ。
- Humanity’s Last Exam(ツールなし): 44.4%
- GPQA Diamond: 94.3%
- APEX-Agents:前モデルの2倍
- MCP Atlas、BrowseComp、MMMLUで優位
GDPval-AA EloではClaude Sonnet 4.6(1,633)が上回る(1,317)。
SWE-Bench VerifiedではOpus 4.6(80.8%)が僅差で勝る(80.6%)。
全体ではGemini 3.1 Proが優勢だ。
Arena LeaderboardではClaude Opus 4.6がテキスト/コードで先行するが、主観評価だ。
Googleの競争優位性は何ですか?
Googleの強みはモデル性能だけではない。
Search、Gmail、YouTube、Android、Docsなどに統合済みだ。
OpenAIやAnthropicは専用アプリが必要。Googleは日常ツールに既に存在する。
価格とアクセスはどうですか?
Google AI Plus/Pro/Ultraで利用可能。無料プランでも限定試用可。
現在プレビュー版だ。エコシステム全体+ストレージ込みで競争力高い。
開発者APIも低価格だ。
今後の展望は?
GoogleはAI競争に遅れを取ったが、1年で挽回した。
Gemini 3から3.1の推論向上はライバル超えだ。
インターネット入口を支配。収益化が課題だが、勢いづいている。





