谷歌DeepMind高級(jí)總監(jiān)兼機(jī)器人主管透露，“該模型獨(dú)立于數(shù)據(jù)網(wǎng)絡(luò)運(yùn)行，因此它對(duì)延遲敏感的應(yīng)用很有幫助，并確保在間歇性斷網(wǎng)或無(wú)網(wǎng)絡(luò)連接的環(huán)境中，依舊穩(wěn)定運(yùn)行?！?/p>

另外，谷歌明確表示，Gemini Robotics On-Device是基于3月份推出的Gemini Robotics升級(jí)改進(jìn)而來(lái)，專為“雙臂機(jī)器人”而設(shè)計(jì)，旨在提高靈巧應(yīng)對(duì)復(fù)雜任務(wù)的適應(yīng)能力。

在此前的一次演示中，該團(tuán)隊(duì)展示了運(yùn)行這種本地模型的機(jī)器人，它們可以輕松執(zhí)行拉開(kāi)拉鏈和折疊衣服等基本動(dòng)作。

谷歌表示，雖然該模型是為ALOHA機(jī)器人而訓(xùn)練，但后來(lái)他們對(duì)其進(jìn)行了調(diào)整，使其適用于雙臂Franka FR3機(jī)器人和Apollo人形機(jī)器人。

與此同時(shí)，谷歌DeepMind還發(fā)布了Gemini Robotics SDK。該公司表示，開(kāi)發(fā)人員可以在MuJoCo高級(jí)物理模擬器上使用這些模型，允許向機(jī)器人展示50到100個(gè)任務(wù)演示，以訓(xùn)練它們完成任務(wù)。

相比單純的“大語(yǔ)言模型”，這些機(jī)器人AI需要面對(duì)更多問(wèn)題，因?yàn)闄C(jī)器人不僅存在于物理世界中，還會(huì)改變其環(huán)境。谷歌DeepMind機(jī)器人技術(shù)負(fù)責(zé)人表示，“Gemini能夠生成文本、寫詩(shī)、總結(jié)一篇文章，甚至編寫代碼，現(xiàn)在，它還可以生成機(jī)器人動(dòng)作?！币簿褪钦f(shuō)，谷歌認(rèn)為他們的機(jī)器人模型已經(jīng)可以通過(guò)大數(shù)據(jù)訓(xùn)練各種動(dòng)作，在快速迭代中面對(duì)各種物理世界的問(wèn)題。

另一個(gè)擔(dān)憂是，相比對(duì)話型AI，這種機(jī)器人AI更需要關(guān)注安全問(wèn)題，畢竟“終結(jié)者”這種恐怖橋段更容易成為現(xiàn)實(shí)。谷歌方面表示，為了保障Gemini Robotics的安全，他們采用了多層限制的辦法。具體來(lái)說(shuō)，控制機(jī)器人的是一個(gè)底層VLA模型，在其之上還有一個(gè)VLA上級(jí)模型，該上級(jí)模型用推理模型的方案來(lái)判斷什么指令是安全的。簡(jiǎn)而言之，用“AI管理AI”的方式來(lái)確保安全。

毫無(wú)疑問(wèn)，機(jī)器人AI又是一個(gè)新賽道，包括Nvidia在內(nèi)的很多公司都在秘密研究自己的機(jī)器人項(xiàng)目，相信國(guó)內(nèi)也有很多企業(yè)在這條賽道上默默前行，讓我們拭目以待新一場(chǎng)AI大戰(zhàn)的揭幕吧。

點(diǎn)個(gè)贊371