シャオミがロボット向けオープンソースAIモデル「Xiaomi-Robotics-0」を発表

中国のシャオミが、視覚・言語・動作を統合したロボットAIモデルXiaomi-Robotics-0を公開した。このモデルはリアルタイム実行に最適化され、オープンソースで利用可能だ。ロボットの知能向上に革新をもたらす。

Xiaomi-Robotics-0とは何か?

Xiaomi-Robotics-0オープンソースモデルだ。GitHubHuggingFaceでコードが公開されている。

企業は「高い性能、速度、リアルタイム実行の滑らかさ」を強調する。ロボットが周囲を理解し、最適な決定を下すことを可能にする。

ロボットAIの課題は何?

ロボットAIは単なる移動ではない。物体ごとに力を調整する必要がある。

例: れんがを強く握るが、猫には優しくする。視覚理解→物体認識→動作実行の流れだ。

ベンチマーク結果はどう?

Xiaomi-Robotics-0は優れた成績を収めた。主なベンチマークは以下の通り。

  • LIBERO: 知識転移を測定。
  • SimplerEnv: リアルシミュレーション性能を評価。
  • CALVIN: 言語条件付きタスクをテスト。

企業によると、「LEGO分解タオル折りの両手タスクで高い成功率と頑健性を達成」した。

トレーニングデータは?

モデルは47億パラメータを持つ。データセットは以下の通り。

種類詳細
ロボット軌跡2億ステップ
視覚-言語データ8,000万サンプル
LEGO分解ビデオ338時間
タオル折りビデオ400時間

実際の成果はどう?

モデルは20ピースの複雑LEGOを分解する。リアルタイムで把持を調整し、失敗を防ぐ。

タオルでは片手で整え折る。2枚拾ったら1枚を置き、もう1枚だけ折る。

産業・家庭での応用は?

モデルは複雑形状や柔軟物体に対応する。タオルの「柔らかい物理」を理解する。

医療では組織操作、災害では瓦礫除去に有用だ。

従来ロボットとの違いは?

  • 従来: 固定座標でA点からB点へ移動。
  • Xiaomi-Robotics-0: タスクを学習し適応。

家庭ロボットでは物体識別し、慎重に移動・清掃する。

よくある質問 (FAQ)

  • モデルはいつ公開? 直近でGitHub/HuggingFaceにアップロード。
  • 主な強みは? リアルタイム動作と両手タスク。
  • 用途例は? 産業ロボット、家庭用、医療支援。
Anzai Hotaka

10 年の経験を持つコンピュータ エンジニア。Linux コンピュータ システム管理者、Web プログラマー、システム エンジニア。