界面新聞記者 | 李如嘉
界面新聞編輯 | 文姝琪
4月2日,智元機器人公布了兩項新動向。
其一是官宣具身智能領域的國際學者羅劍嵐近期已正式加入公司,出任首席科學家并牽頭組建“智元具身智能研究中心”。據其介紹,智元具身研究中心專注于具身大小腦、空間智能、強化學習等方面的研究,覆蓋AI及機器人核心技術,主導前沿算法研發與工程化落地。
羅劍嵐畢業于加州大學伯克利分校,曾在Google X、Google DeepMind從事研究工作。在伯克利人工智能實驗室(BAIR)擔任博士后期間,羅劍嵐領導開發的世界上首個超人類的機器人真機強化學習系統SERL/HIL-SERL,首次實現將任務成功率提升到100%, 在全球范圍內被廣泛應用。
另外一個動向是智元宣布與國際具身智能公司 Physical Intelligence(Pi)達成合作伙伴關系,雙方將圍繞動態環境下的長周期復雜任務,在具身智能領域展開深度技術合作。這一合作將由羅劍嵐帶頭推進。
Pi是去年3月官宣成立的美國明星創業公司,羅劍嵐博士后研究期間的導師Sergey Levine是聯合創始人之一。去年11月,這家公司完成了4億美元的A輪融資,融資后估值為20億美元,主要投資者包括亞馬遜創始人貝索斯、OpenAI、Thrive Capital等知名公司或投資機構。
“我們認為具身智能的復雜性讓單一公司很難承擔全部鏈條,所以我們強調開放協同,做效率和資源的合理分布。聯合外部公司可以互相提供不同的視角和能力。”羅劍嵐對界面新聞表示。
智元表示,目前與Pi的合作已經初具成效,可以實現一個通用模型根據不同的指令輸入執行多個任務,也可以適配多種末端執行器,包括靈巧手、平行夾爪和旋轉夾爪,同時可以兼容魚眼和針孔相機等多種傳感器。
在智元發布的合作成果視頻中,展示了機器人在鏡子前戴上圍巾、換垃圾袋,將物品從傳送帶移入物流箱等覆蓋家庭和工業場景的多元復雜任務。
作為具身智能領域的知名學者,羅劍嵐的工作被評價為“讓強化學習真正跑起來”,推動了強化學習在工業自動化、柔性生產等具身智能場景的落地。
“機器人領域過去十年的進步很多都是受到了其他領域新突破的啟發產生,比如CV和NLP。順著這個邏輯,現在具身智能的主流路線是大模型和強化學習的結合。”羅劍嵐告訴界面新聞,大模型可以使用大量數據對機器人進行預訓練,幫助機器人有上手機會,做一些粗略的基本動作。這樣訓練出來的機器人可能有百分之七八十的成功率。強化學習則負責打磨最后的百分之二三十,最后通過試錯做到最終的完善。
他表示,未來智元可能還會研發世界模型,根據云端的模型去預測下一步環境會發生什么。不過羅劍嵐也提到,這些都是工具,具身智能本質上需要解決的,是怎樣在開放數據鏈構建具有魯棒性的策略,感知、預測、行為生成這一整套機制的泛化能力才是最核心、最關鍵的。
羅劍嵐認為,現在許多爭議存在的原因都是因為缺少數據。不過樂觀來看,機器人部署到真實世界的難度小于智能駕駛,因為車在安全性等各方面要求非常嚴格。而機器人可以從一些封閉空間、半封閉空間先開始部署。隨著越來越多的機器人在真實世界部署,也會有越來越多的真實數據回傳。屆時研究者對于算法會有更好的認知,軟件硬件將同步進行迭代,最終收斂到幾個方案。
他表示,具身智能的研發是一項系統性的工程,包括算法、硬件、數據和場景等方面都需要聯合迭代,最終走向通用性,這也是智元布局具身智能全棧的原因。