輝達CMU新研究!機器人跳APT舞驚豔全網 「人形機器人」奧運會2030年可期
鉅亨網編譯陳韋廷 綜合報導 2025-02-05 17:30
![cover image of news article](/_next/image?url=https%3A%2F%2Fcimg.cnyes.cool%2Fprod%2Fnews%2F5851739%2Fl%2F6717f6426a922bf1fb1b81b8ae6f9711.jpg&w=3840&q=75)
機器人版的柯比布萊恩 (Kobe Bryant)、詹皇(LeBron James)、C 羅 Cristiano Ronaldo 真的來了,而這一切全拜卡內基美隆大學(CMU) 和輝達(NVDA-US) 所提出的一個 real2sim2real 模型 Aligning Simulation and Real Physics(ASAP),ASAP 能讓人形機器人掌握非常流暢且動感的全身控制動作,就連跳時下最紅的 APT 也相當流暢。
中國智能資訊社交平台《新智元》報導,市場可以期待在 2030 年看到人形機器人奧運會盛宴,CMU 與輝達提出的 ASAP 專案包含預訓練和後訓練兩大階段。在第一個階段中,透過重定向的人體數據,在模擬環境中預訓練運動追蹤策略,第二階段將這些策略部署到現實世界,並收集真實數據來訓練一個「殘差」動作模型,用來彌補模型與真實世界物理動態之間的差距。
然後,ASAP 把這個 delta 動作模型整合到模擬器中,對預訓練策略進行微調,讓它和現實世界的動力學更匹配。具體步驟分為四步,分別是運動跟蹤預訓練與真實軌跡收集、差異動作模型訓練、策略微調以及真實世界部署。
研究人員在三個遷移場景中評估了 ASAP 的效果。從 IsaacGym 到 IsaacSim、從 IsaacGym 到 Genesis,以及從 IsaacGym 到真實世界,使用的機器人則是中國廠商宇樹的 G1 人形機器人。
最後,研究者藉助 delta 動作模型對預訓練的策略進行微調,使其能夠更好地適應真實世界的物理環境,從而實現更穩定、敏捷的運動控制。
sim2real 一直是實現空間與具身智慧的主要路徑之一,被廣泛應用在機器人模擬評估當中,而 real2sim2real 直接打破了繁瑣的動作微調的難題,彌合 sim2real 的差距,讓機器人能夠模仿各種類人的動作。
輝達資深研究科學家 Jim Fan 興奮地表示,透過 RL 讓人形機器人成功模仿 C 羅、詹皇和科比!
報導指出,CMU 跟輝達的研究有四大貢獻。第一個是提出 ASAP 框架,運用強化學習和真實世界的數據來訓練 delta 動作模型,有效縮小了模擬與現實之間的差距。其次,成功在真實環境部署全身控制策略,實現了不少以前人形機器人難以做到的動作。
第三大貢獻則是 ASAP 能有效減少動力學不匹配問題,讓機器人做出高度敏捷的動作,同時顯著降低運動跟蹤誤差。最後,研究者開發並開源了一個多模擬器訓練與評估代碼庫,以促進不同模擬器之間的平滑遷移,並加快後續研究。
專案位址:
https://agile.human2humanoid.com/
- 如何發揮多重資產策略的最大優勢?
- 掌握全球財經資訊點我下載APP
上一篇
下一篇