シャオミがロボット向けオープンソースAIモデル「Xiaomi-Robotics-0」を発表

中国のシャオミが、視覚・言語・動作を統合したロボットAIモデルXiaomi-Robotics-0を公開した。このモデルはリアルタイム実行に最適化され、オープンソースで利用可能だ。ロボットの知能向上に革新をもたらす。

Xiaomi-Robotics-0とは何か？

Xiaomi-Robotics-0はオープンソースモデルだ。GitHubとHuggingFaceでコードが公開されている。

企業は「高い性能、速度、リアルタイム実行の滑らかさ」を強調する。ロボットが周囲を理解し、最適な決定を下すことを可能にする。

ロボットAIは単なる移動ではない。物体ごとに力を調整する必要がある。

例: れんがを強く握るが、猫には優しくする。視覚理解→物体認識→動作実行の流れだ。

Xiaomi-Robotics-0は優れた成績を収めた。主なベンチマークは以下の通り。

企業によると、「LEGO分解とタオル折りの両手タスクで高い成功率と頑健性を達成」した。

モデルは47億パラメータを持つ。データセットは以下の通り。

モデルは20ピースの複雑LEGOを分解する。リアルタイムで把持を調整し、失敗を防ぐ。

タオルでは片手で整え折る。2枚拾ったら1枚を置き、もう1枚だけ折る。

モデルは複雑形状や柔軟物体に対応する。タオルの「柔らかい物理」を理解する。

医療では組織操作、災害では瓦礫除去に有用だ。

家庭ロボットでは物体識別し、慎重に移動・清掃する。