谷歌DeepMind高級總監(jiān)兼機器人主管透露,“該模型獨立于數(shù)據(jù)網(wǎng)絡運行,因此它對延遲敏感的應用很有幫助,并確保在間歇性斷網(wǎng)或無網(wǎng)絡連接的環(huán)境中,依舊穩(wěn)定運行。”

另外,谷歌明確表示,Gemini Robotics On-Device是基于3月份推出的Gemini Robotics升級改進而來,專為“雙臂機器人”而設計,旨在提高靈巧應對復雜任務的適應能力。

2.jpg

在此前的一次演示中,該團隊展示了運行這種本地模型的機器人,它們可以輕松執(zhí)行拉開拉鏈和折疊衣服等基本動作。

谷歌表示,雖然該模型是為ALOHA機器人而訓練,但后來他們對其進行了調(diào)整,使其適用于雙臂Franka FR3機器人和Apollo人形機器人。

3.jpg

與此同時,谷歌DeepMind還發(fā)布了Gemini Robotics SDK。該公司表示,開發(fā)人員可以在MuJoCo高級物理模擬器上使用這些模型,允許向機器人展示50到100個任務演示,以訓練它們完成任務。

相比單純的“大語言模型”,這些機器人AI需要面對更多問題,因為機器人不僅存在于物理世界中,還會改變其環(huán)境。谷歌DeepMind機器人技術負責人表示,“Gemini能夠生成文本、寫詩、總結(jié)一篇文章,甚至編寫代碼,現(xiàn)在,它還可以生成機器人動作。”也就是說,谷歌認為他們的機器人模型已經(jīng)可以通過大數(shù)據(jù)訓練各種動作,在快速迭代中面對各種物理世界的問題。

4.jpg

另一個擔憂是,相比對話型AI,這種機器人AI更需要關注安全問題,畢竟“終結(jié)者”這種恐怖橋段更容易成為現(xiàn)實。谷歌方面表示,為了保障Gemini Robotics的安全,他們采用了多層限制的辦法。具體來說,控制機器人的是一個底層VLA模型,在其之上還有一個VLA上級模型,該上級模型用推理模型的方案來判斷什么指令是安全的。簡而言之,用“AI管理AI”的方式來確保安全。

毫無疑問,機器人AI又是一個新賽道,包括Nvidia在內(nèi)的很多公司都在秘密研究自己的機器人項目,相信國內(nèi)也有很多企業(yè)在這條賽道上默默前行,讓我們拭目以待新一場AI大戰(zhàn)的揭幕吧。


點個贊404
分享到:

發(fā)表評論注冊|