Figure AI推出Helix 模型 賦予機器人「秒懂」世界的能力
鉅亨網新聞中心 2025-02-21 13:40

美國新創公司 Figure AI 近日正式發布了名為 Helix 的全新雙系統 AI 架構,該模型旨在使機器人能夠像人類一樣理解世界並執行任務,而無需針對每個物體進行特定的預訓練或編程。此舉被視為 Figure AI 在機器人技術領域的一項重大突破,並可能加速人形機器人在家庭和商業環境中的應用。
與 OpenAI 分道揚鑣轉自主研發
Figure AI 在不久前才剛宣布與 OpenAI 徹底結束合作關係。Figure AI 首席執行長 Brett Adcock 表示,Helix 在機器人智慧方面的突破,讓公司不再需要與 OpenAI 合作. 據報導,兩家公司於去年宣布合作,當時 Figure AI 還完成了一輪 6.75 億美元的融資,估值達到 26 億美元,以推動其 Figure 02 機器人的開發。
Helix 模型是一種視覺 - 語言 - 動作 (Vision-Language-Action, VLA) 模型,它統一了感知、語言理解和學習控制能力,使其能夠進行泛化應用。與傳統機器人必須針對每項新任務進行大量編程或示範學習不同,Helix 模型結合了高級推理系統和即時運動控制系統。這兩個系統有效地彌合了語義理解 (知道物體是什麼) 與運動控制 (知道如何操控物體) 之間的差距。
報導稱,Figure 的目標是發展家庭機器人,因此其內部的 AI 需要具備類似人類的推理能力,以應對任何家庭用品。
Helix 目前主要用於 Figure 機器人的上半身控制,包括手腕、頭部、單個手指甚至軀幹,能夠以高速率執行複雜任務。只需一句話,機器人就能拿起任何物品。例如,當被要求「拾起沙漠物品」時,Helix 能夠識別出玩具仙人掌,選擇最近的手臂,並執行精確的電機指令以牢固地抓住它。此外,Helix 還能夠處理生活中的各種小物件,如金屬鏈、帽子、玩具等,並能夠將物品放置在冰箱等地方。
值得一提的是,Helix 是首款同時操控兩台機器人的 VLA,使它們能夠解決共同的、長序列操作任務,即使是處理從未見過的物品。這一功能讓機器人在家庭環境中更具實用性,因為家庭中充滿了無數物品,每個物品都有不可預測的形狀、尺寸、顏色和質地。
Helix 的另一大亮點是其採用單一神經網絡權重學習所有行為,無需任何特定的微調。此外,它是首款完全在嵌入式低功耗 GPU 上運行的 VLA,這意味著未來商業部署甚至進入家庭已經近在咫尺
Helix 的主要突破
據官方文件,Helix 的突破在於其雙系統架構,模仿人類認知。「系統 2」視覺 - 語言模型 (VLM):擁有 70 億參數,運行頻率為 7-9Hz(即每秒更新 9 次),處理高階理解能力,用於結構化和複雜任務的推理,相當於「深思熟慮」。
「系統 1」視覺 - 運動控制策略:擁有 8000 萬參數,運行頻率為 200Hz(即每秒更新 200 次),將指令轉化為精確的物理動作,相當於「直覺反應」。
為了展示 Helix 模型的技術能力,Figure AI 發布了一段影片,展示兩台 Figure 機器人協作整理雜貨。影片中,一台機器人遞物品,另一台機器人則將物品放入抽屜和冰箱。Figure AI 聲稱,這兩台機器人此前並不知道它們正在處理的物品,但仍然能夠識別哪些應該存放在冰箱裡,哪些需要保持乾燥存放。
Figure AI 的未來展望
Figure AI 透露,已與 BMW 製造部門以及一家未披露的美國主要客戶達成合作。該公司預計,這些合作將為未來四年內部署 10 萬台機器人奠定基礎. 此外, Figure AI 正尋求額外 15 億美元融資,如果成功,其估值將飆升至 395 億美元。
除了 Figure AI 之外,其他公司也正在積極開發人形機器人技術。Meta 正在建立一個新部門,將創建 AI 驅動的人形機器人。Apptronik 籌集了 3.5 億美元,其投資者和合作夥伴之一是 Google DeepMind。Tesla 也在開發其 「Optimus」 機器人。有傳言稱 Apple 也可能進入該領域。
- 如何發揮多重資產策略的最大優勢?
- 掌握全球財經資訊點我下載APP
延伸閱讀
上一篇
下一篇