文|李睿、真梓
前有英偉達創始人黃仁勛帶火“具身智能”概念,后有斯坦福教授李飛飛發布“具身智能”新成果,將大模型接入機器人。不少行業人士認為,ChatGPT之后,通用機器人將開啟通用AI的下一站。甚至還有觀點表示,機器人,是人工智能的最終解決方案。
“機器人領域的前輩在定義機器人時,就將智能和通識這兩點與機器人緊密綁定。通用機器人是所有機器人從業者都希望去做的一件事情。”「千訣科技」創始人兼CEO高海川告訴36氪。
(資料圖)
「千訣科技」是一家專注于機器人決策大模型研發的高科技公司,希望使不同類型的機器人都具備持續學習、適應多變環境的通用智能。
創始人高海川在清華大學自動化系讀博期間便萌生了讓機器人具有“通識”的想法,為此他創建了VIPlab機器人組,主要研究通用智能在機器人領域的落地。在5年研究中,高海川和團隊的學術成果包括:提出新型分布式強化學習框架、仿真現實遷移強化學習方法、機器人技能分層持續學習框架、開發語言引導的技能分層強化學習技術、面向部分可觀測場景的因果推理強化學習技術。其團隊所研發的“通識”機器人決策模型,正是產學研結合的產物。
高海川認為,以往“通識”機器人最大的門檻在于決策系統缺乏通識。也就是說,機器人的硬件形態和算法、模型很難從一個任務遷移到另一個任務,這也是現在機器人市場的痛點所在。而近年AI大模型通過豐富語料訓練獲得了認知和推理的通用能力,如果能將這種認知通用性落到對機器人的運動控制上,會突破長期以來機器人的通用性問題。
關于如何將大語言模型的通用性遷移至機器人,高海川介紹:“機器人所面對的新環境和新任務,對大語言模型而言,都是已經見過的老環境、老任務,所以一個好想法是用語言模型打造機器人的決策系統,將其通用認知能力賦予機器人。直觀上來說,就是讓機器人與語言模型對話咨詢,當機器人不知道怎么做時,詢問語言模型以獲取指導,例如在導航任務中,機器人可以在未建立環境地圖的情況下,咨詢語言模型應該往哪個方向導航。”
高海川表示,“通識”機器人決策模型的技術核心是“動態規劃與大模型相結合,將機器人感知、運動和操作映射到統一的語言空間,讓機器人通過自我問答和樹搜索等方式形成決策閉環”。
針對決策閉環這一設計,高海川給出了進一步闡述。他表示,通識機器人融合語言模型的認知鏈條與機器人的技能和感知鏈條,將團隊自研的機器人多模態感知模型所偵測到的機器人周圍的視覺信息、機器人的硬件及技能信息、機器人的工作環境以及歷史記憶都翻譯成語句,輸入到團隊自研的機器人垂類語言模型。之后,再將語言模型的輸出翻譯成機器人可執行的指令。機器人執行指令后,再反饋環境信息給語言模型,讓另一個負責評估的語言模型基于機器人決策效果對決策語言進行打分進而實現決策模型的進化。“這樣通過語言空間作為橋梁,連接語言模型的認知鏈條和機器人的技能鏈條,進而實現決策系統的閉環。”他說。
高海川提供的視頻展示了“通識”機器人的具體工作流程:
“通識”機器人工作流程
在商業規劃上,高海川提出“通識”機器人的產品落地將分為三條線。
第一條線是開發“通識”機器人腦塢,在一張顯卡中內置面向機器人行業的通用決策模型。該接口產品可以連接不同品牌和類型的機器人,為其提供語言理解和決策能力,相當于為機器人提供一個可即插即用的通用機器人大腦。團隊第一代腦塢產品圍繞靈汐科技的新款“天機”類腦芯片打造,包括ANN-Transformer和Spiking-Transformer兩種異構神經網絡,供多種具身智能領域開發者使用。
“通識機器人腦塢是公司最核心的產品形態”,高海川介紹,“因為機器人行業的硬件千奇百怪,如果只針對某一款機器人硬件去做開發,它可能只能在某一些場景中做應用,而我們希望能夠做一個面向機器人全行業的核心關鍵部件。”
第二條線是建立“通識”機器人共享平臺,提供機器人“共享決策”云平臺、云服務。不同行業的用戶可以在線輸入機器人形態和參數,共享通用決策系統。據介紹,這個平臺可以快速積累多樣性數據,促進決策模型的迭代更新。在這一方面,近期,千訣團隊與兩家科教型機器人公司建立合作,將團隊所研發的機器人垂類決策模型以license的形式與每臺售出的機器人綁定。高海川表示:“該模型在決策魯棒性方面優于GPT-4,并額外學習過很多本土化的產品,相關論文處于預發表階段。算力方面也有同為清華系的清醒異構為我們模型訓練提供支持。”
第三條線是開發簡易版的低成本通用雙臂機器人,并結合通用決策大腦做一套軟硬件系統。機器人手臂操作精度相對較低,僅執行日常生活中諸如抓、擰、拿、推、舉等簡單操作。高海川認為,“通識”機器人主打通用而非操作精度,更像是一只聰明的機械寵物,對于所交待的任何事情都會努力去做,但不一定要把每件事都做好,成本也可比掃地機器人更低。
另外他還表示,以通識決策模型為大腦,以機器人雙臂操作技能為小腦,進而實現“通識”機器人系統的搭建,可以覆蓋基本民用需求以及典型終端需求,潛在應用場景包括咖啡/餐廳、老人社區、辦公室、公園、康養旅游等。
團隊方面,高海川介紹,「千訣科技」核心團隊由清華大學自動化系的3名博士和2名碩士組成。團隊研究覆蓋強化學習、機器人學習控制、多任務泛化等多個方向,在相關領域的頂級會議和期刊上發表過多篇論文,并在國際競賽中獲獎。近期,團隊也在持續吸引多名機器人業界人才加入。
關鍵詞: