一区二区三区在线免费视频_国产成人亚洲在线观看_无码少妇一区二区三区浪潮AV_国产色久_av色伊人久久?合一区二区_嗯啊ww免费视频网站

GO-1大模型 × ADC對抗式數(shù)采:具身落地新范式 發(fā)布時間:2025-03-19 14:55:56

導(dǎo) 言 

在具身智能領(lǐng)域,智元啟元大模型GO-1 依靠先進(jìn)的模型架構(gòu)和高質(zhì)量的海量真機(jī)數(shù)據(jù),展現(xiàn)出了通用的感知理解、動作執(zhí)行等能力。如今,我們進(jìn)一步提出一種全新的數(shù)據(jù)采集范式ADC (Adversarial Data Collection, 對抗數(shù)據(jù)采集),大幅提升了數(shù)據(jù)的信息密度和多樣性,降低了后訓(xùn)練所需的數(shù)據(jù)量、壓縮了訓(xùn)練成本,且提升了模型的魯棒性和泛化性,與傳統(tǒng)范式相比,使用20%數(shù)據(jù)量達(dá)到其2.7倍的效果。


20250318-181605.png


論文地址: 

https://arxiv.org/abs/2503.11646

項(xiàng)目地址:

https://sites.google.com/view/adc-robot/home


01 ADC: 突破性的對抗式數(shù)據(jù)采集方案 


傳統(tǒng)的數(shù)據(jù)采集采用單次重復(fù)范式,存在視覺冗余、語言指令重復(fù)及動作相似的問題,導(dǎo)致數(shù)據(jù)的多樣性和有效性不足。盡管存在仿真等技術(shù)豐富數(shù)據(jù)的多樣性,但卻面臨Sim2real域間差異等問題,難以實(shí)現(xiàn)在復(fù)雜真實(shí)環(huán)境中快速高效擴(kuò)展。


為了解決上述問題,智元推出了一種全新的數(shù)據(jù)采集方法——對抗式數(shù)據(jù)采集ADC,在數(shù)據(jù)采集過程中增加人為動態(tài)擾動,包括視覺和指令對抗,從而:

  • 提升單條數(shù)據(jù)的信息密度與多樣性

  • 減少后訓(xùn)練數(shù)據(jù)需求量和模型訓(xùn)練成本

  • 增強(qiáng)模型的泛化能力與魯棒性


如下圖所示,研究團(tuán)隊(duì)對比分析了機(jī)器人操作中真實(shí)數(shù)據(jù)采集的兩種流程:

  • (a) 傳統(tǒng)方法: 遠(yuǎn)程操作者在靜態(tài)視覺環(huán)境中,依據(jù)固定語言指令執(zhí)行任務(wù)。數(shù)據(jù)采集局限于單一場景,缺乏多樣性。

  • (b) 對抗式數(shù)據(jù)采集(ADC)框架: 采用“雙人協(xié)同”模式,新增一名對抗操作員,在采集數(shù)據(jù)時,對抗采集員通過動態(tài)擾動改變視覺元素(如背景、物體位置/姿態(tài))及語言指令(如任務(wù)目標(biāo)),提升信息密度和多樣性。


2.png


02 ADC如何提升數(shù)據(jù)信息密度和多樣性 


ADC通過在單次示范中注入多層次、跨模態(tài)的擾動,大幅提升數(shù)據(jù)的信息密度與多樣性:

  • 視覺擾動: 動態(tài)調(diào)整物體位置、姿態(tài)及背景;

  • 語言擾動: 實(shí)時修改任務(wù)目標(biāo)或換用不同表達(dá)方式;

  • 失敗恢復(fù): 采集中自然融入錯誤應(yīng)對策略;

  • 信息壓縮:單次ADC演采集≈?jǐn)?shù)百次傳統(tǒng)采集的信息量。


3.png

其中,傳統(tǒng)數(shù)據(jù)采集方案與ADC數(shù)據(jù)采集方案對比視頻如下所示:



03 少數(shù)據(jù),強(qiáng)性能,更魯棒


為了驗(yàn)證ADC設(shè)計(jì)的有效性,研究團(tuán)隊(duì)在智元精靈G1機(jī)器人平臺上開展了實(shí)驗(yàn),設(shè)計(jì)了“水果分類放置”任務(wù)作為驗(yàn)證場景。我們分別用傳統(tǒng)范式和ADC新范式采集了大致相當(dāng)幀數(shù)的數(shù)據(jù)。由于ADC采集過程中無需頻繁重置場景,采集相同幀數(shù)的有效數(shù)據(jù)所需采集時間基本和傳統(tǒng)方式一致。


在靜態(tài)環(huán)境測試中,相比傳統(tǒng)數(shù)據(jù)采集訓(xùn)練的模型,ADC采集的訓(xùn)練數(shù)據(jù)使模型在任務(wù)中表現(xiàn)出突出的準(zhǔn)確性與可靠性,平均成功率在3組不同測試條件下分別提升了53%、70%、59%。


5.png

在靜態(tài)環(huán)境下的性能評測


在動態(tài)環(huán)境測試中(例如物體位置或語言指令動態(tài)變化),傳統(tǒng)方法訓(xùn)練的模型表現(xiàn)完全失效,成功率全部為0而ADC訓(xùn)練的模型能夠應(yīng)對視覺和語言擾動,展現(xiàn)出更高的魯棒性。


14.png

動態(tài)環(huán)境下對抗視覺擾動的性能評測


15.png

動態(tài)環(huán)境下對抗語言干擾的性能評測


為了驗(yàn)證ADC數(shù)據(jù)的高信息密度特性,我們分別使用傳統(tǒng)采集方式的全量數(shù)據(jù)和ADC方式20%/50%/100%的數(shù)據(jù)進(jìn)行了模型訓(xùn)練,實(shí)驗(yàn)結(jié)果表明,僅使用20%的ADC采集數(shù)據(jù),模型性能就達(dá)到全量傳統(tǒng)數(shù)據(jù)的2.7倍。


11.png

不同數(shù)據(jù)配比下的模型性能評測


還有比較驚喜的是,ADC數(shù)據(jù)訓(xùn)練的模型在模擬“傳感器失效”(屏蔽機(jī)器人某些攝像頭輸入)的場景中,依然表現(xiàn)出強(qiáng)大的抗干擾能力。從注意力熱力圖中可以觀察到,ADC訓(xùn)練的模型能夠動態(tài)將注意力集中在有效輸入上,而非分散在無關(guān)區(qū)域。對于這種情況,我們認(rèn)為是由于ADC數(shù)據(jù)采集過程中,有更多的被遮擋或者部分可觀的數(shù)據(jù)情況,提升了模型對目標(biāo)物體的觀察全面性,從而提高模型的視覺表征能力,這進(jìn)一步驗(yàn)證了ADC采集數(shù)據(jù)的多樣性。


8.png


9.png10.png


此外,通過ADC采集的數(shù)據(jù),訓(xùn)練出的模型展現(xiàn)了動態(tài)人機(jī)協(xié)同適應(yīng)錯誤恢復(fù)的能力。例如,在抓取失敗后,機(jī)器人能夠自動調(diào)整姿態(tài)并重新規(guī)劃路徑完成任務(wù)。


12.png

13.png


04 結(jié)語


ADC 技術(shù)以數(shù)據(jù)高信息密度與多樣性為核心,重新定義了具身智能的數(shù)據(jù)采集方式。通過GO-1 × ADC的新范式,大幅降低了具身智能的落地門檻,賦能千行百業(yè)。



主站蜘蛛池模板: 日韩美女视频一区 | 91精品国产乱码久久桃 | 麻豆亚洲AV成人无码久久精品 | 皇色在线视频 | 精品久久久在线观看 | 91资源在线观看 | 欧美三根一起进三p视频 | 欧美高清视频手机在在线 | 高潮A片揉搓乳尖乱颤视频 欧美不卡视频 | 欧美高清x| 国产高清女同学巨大乳在线观看 | 国产精品一区在线播放 | 亚洲成国产人片在线观看 | 国产饥渴妇女在线 | 亚洲性一区 | 18school第一次破苞摘花 | 久久婷婷五月综合色情 | 99热这里只有精品久久 | 嫩草影院中文字幕 | 性夜影院爽黄A爽AV 在线黄色国产 | 日韩视频一二三 | 天天插天天操 | 嫩草嫩草嫩草嫩草嫩草 | 国产精品国产三级囯产AV中文 | 欧美精品一国产成人综合久久 | 狠狠综合久久久久综合网址 | 黄色免费在线视频网站 | 亚洲热久久 | 久久精品国产亚洲av不卡 | 久久久久av综合网成人 | 99久久国语露脸精品国产 | 日韩精品一| 老子影院午夜伦手机不卡 | 在线观看高清黄网站免费 | 成人亚洲欧美成αⅴ人在线观看 | 激情成人综合网 | 久操免费在线视频 | 靠比久久久 | 国产一级A片无码免费奶水 国产精品亚洲五色 | 日本女人一级片 | 国产cao视频在线观看 |