Meta、Muse Sparkを発表:AI戦略を再構築しスーパーインテリジェンスへ

MetaはScale AI創業者Alexandr Wangを招聘し、143億ドルを投じてAI戦略をゼロから再構築した。初の成果としてMuse Sparkを公開。Meta SuperIntelligence Labsの基盤モデルで、meta.aiで試用可能だ。
Muse Sparkとは何か?
MetaはAIプロジェクトの全アーキテクチャを再設計した。Muse SparkはLlama 4 Maverickを上回る性能を発揮する。
計算容量は10倍少ないで達成した。効率向上が目覚ましい。
ベンチマークでどこまで競争力があるか?
Metaのベンチマーク表が性能を示す。Muse SparkはOpus 4.6、Gemini 3.1 Pro、GPT 5.4と互角だ。
| 領域 | 強み | 弱み |
|---|---|---|
| マルチモーダル推論 | Claude Opus 4.6、GPT-5.4を上回る | – |
| 健康分野 | 強い | – |
| 抽象的思考 (ARC-AGI 2) | – | 競合に劣る |
| エージェントプログラミング | まし | 競合に後れを取る |
Artificial Analysisの総合ランキングで4位。ベンチマークは参考値で、実際の使用感が重要だ。
「瞑想モード」の革新性は?
モード contemplativo(瞑想モード)が新機能。Wang氏によると、「複数のエージェントが並行推論し、複雑な科学・推論タスクに適する」。
従来は単一エージェントが長く考える。Muse Sparkは複数エージェントが同時协作する。
Metaのレイテンシーグラフで確認。16エージェント並行でHumanity’s Last Examの精度59%を、低レイテンシーで達成した。
ベンチマークの信頼性はどうか?
Llama 4発表(1年前)でベンチマーク不正が発覚した。Metaは教訓を生かしたはずだ。
しかし、François Chollet氏が指摘。「Muse Sparkはベンチマーク過最適化で実用性が低い」。
「公的ベンチマークの数字に過最適化。他のすべてを犠牲にしている。実用性との相関評価がAIラボの核心だ」。
オープンソースからプロプライエタリへ移行?
Muse Sparkは閉鎖モデル。Llamaのオープンウェイト戦略を変更した。
Metaは将来のオープン版を検討中。 Ethan Mollick氏は「オープンウェイトなしでは価値予測が難しい」と述べる。
ハイパーパーソナライズの強みは?
スーパーインテリジェンス個人化が差別化。WhatsApp、Instagram、Facebookのデータを活用。
10年間の会話、写真、好みを学習。Zuckerbergが日常使用中だ。
- 食事写真で栄養分析。
- 運動で筋肉活性化を検知。
- 画像からインタラクティブゲーム作成。
- 視覚・音声で家事問題解決。
- 1,000人の医師協力で健康推論強化。
安全性はどう評価されるか?
独立コンサルが評価。Muse Sparkは「評価意識率」が最高だ。
生化学兵器開発支援を98%拒否。Opus 4.6(95.4%)、GPT 5.4(74.7%)、Gemini 3.1 Pro(61.5%)を上回る。
MetaのAI復帰は成功するか?
9ヶ月間の成果がMuse Spark。発表後、Meta株は6.5%上昇した。
性能で競合に劣るが、効率とパーソナライズで差別化。競争の激しいAIレースで勝てるか、時間が示す。





