シャオミがロボット向けオープンソースAIモデル「Xiaomi-Robotics-0」を発表

中国のシャオミが、視覚・言語・動作を統合したロボットAIモデルXiaomi-Robotics-0を公開した。このモデルはリアルタイム実行に最適化され、オープンソースで利用可能だ。ロボットの知能向上に革新をもたらす。
Xiaomi-Robotics-0とは何か?
Xiaomi-Robotics-0はオープンソースモデルだ。GitHubとHuggingFaceでコードが公開されている。
企業は「高い性能、速度、リアルタイム実行の滑らかさ」を強調する。ロボットが周囲を理解し、最適な決定を下すことを可能にする。
ロボットAIの課題は何?
ロボットAIは単なる移動ではない。物体ごとに力を調整する必要がある。
例: れんがを強く握るが、猫には優しくする。視覚理解→物体認識→動作実行の流れだ。
ベンチマーク結果はどう?
Xiaomi-Robotics-0は優れた成績を収めた。主なベンチマークは以下の通り。
- LIBERO: 知識転移を測定。
- SimplerEnv: リアルシミュレーション性能を評価。
- CALVIN: 言語条件付きタスクをテスト。
企業によると、「LEGO分解とタオル折りの両手タスクで高い成功率と頑健性を達成」した。
トレーニングデータは?
モデルは47億パラメータを持つ。データセットは以下の通り。
| 種類 | 詳細 |
|---|---|
| ロボット軌跡 | 2億ステップ |
| 視覚-言語データ | 8,000万サンプル |
| LEGO分解ビデオ | 338時間 |
| タオル折りビデオ | 400時間 |
実際の成果はどう?
モデルは20ピースの複雑LEGOを分解する。リアルタイムで把持を調整し、失敗を防ぐ。
タオルでは片手で整え折る。2枚拾ったら1枚を置き、もう1枚だけ折る。
産業・家庭での応用は?
モデルは複雑形状や柔軟物体に対応する。タオルの「柔らかい物理」を理解する。
医療では組織操作、災害では瓦礫除去に有用だ。
従来ロボットとの違いは?
- 従来: 固定座標でA点からB点へ移動。
- Xiaomi-Robotics-0: タスクを学習し適応。
家庭ロボットでは物体識別し、慎重に移動・清掃する。
よくある質問 (FAQ)
- モデルはいつ公開? 直近でGitHub/HuggingFaceにアップロード。
- 主な強みは? リアルタイム動作と両手タスク。
- 用途例は? 産業ロボット、家庭用、医療支援。





