日韩高清一区_国产亚洲一区二区三区四区_亚洲国产一二三_久热精品视频

登錄
首頁(yè) > 智駕游記 > 未來(lái)AI造的不僅是投石機(jī),而是能奔跑、搬運(yùn)、協(xié)作的各種復(fù)雜結(jié)構(gòu)——讓語(yǔ)言模型真正具備“造出會(huì)動(dòng)的東西”的能力

未來(lái)AI造的不僅是投石機(jī),而是能奔跑、搬運(yùn)、協(xié)作的各種復(fù)雜結(jié)構(gòu)——讓語(yǔ)言模型真正具備“造出會(huì)動(dòng)的東西”的能力

發(fā)布時(shí)間:2025-10-24 15:58:23

讓LLM扔塊石頭,結(jié)果它發(fā)明了投石機(jī)?

大模型接到任務(wù):“造一個(gè)能把石頭扔遠(yuǎn)的結(jié)構(gòu)。”

誰(shuí)成想,它真的開(kāi)始動(dòng)手造了,在一個(gè)真實(shí)的物理仿真世界里,一邊搭零件,一邊看效果,一邊修改。

最后,它造的投石機(jī),把石頭扔了出去。

這就是來(lái)自港中大(深圳)、港中大的研究團(tuán)隊(duì)(Wenqian Zhang, Weiyang Liu, Zhen Liu)帶來(lái)的最新研究——《Agentic Design of Compositional Machines》

他們推出了一個(gè)叫BesiegeField的新平臺(tái),它就像一個(gè)給大模型的“機(jī)械工程師訓(xùn)練場(chǎng)”,專門(mén)測(cè)試AI能不能像人一樣,從零開(kāi)始設(shè)計(jì)并造出能動(dòng)的、有功能的復(fù)雜機(jī)器。

這還沒(méi)完。BesiegeField支持上百次的并行實(shí)驗(yàn),一旦引入強(qiáng)化學(xué)習(xí)(Reinforcement Learning),大模型就能“自我進(jìn)化”:從反饋中調(diào)整策略,逐步學(xué)會(huì)結(jié)構(gòu)設(shè)計(jì)的物理邏輯,最終學(xué)會(huì)如何“造出能動(dòng)的結(jié)構(gòu)”

大模型怎么寫(xiě)出一個(gè)機(jī)械結(jié)構(gòu)

首先得明確,這不是讓大模型去畫(huà)CAD圖,它也控制不了三維細(xì)節(jié)。研究者提出了一種叫“組合式機(jī)械設(shè)計(jì)”(Compositional Machine Design)的方法。

說(shuō)白了,就是把機(jī)械結(jié)構(gòu)限定在“用標(biāo)準(zhǔn)零件組裝”這個(gè)范圍里。每個(gè)零件(比如支架、關(guān)節(jié))都有標(biāo)準(zhǔn)尺寸和接口,大模型只需要決定:

用哪些零件

它們之間怎么連

這樣,復(fù)雜的設(shè)計(jì)就被簡(jiǎn)化成一個(gè)“離散結(jié)構(gòu)組合問(wèn)題”。到底好不好用?能不能動(dòng)?穩(wěn)不穩(wěn)?交給物理仿真去驗(yàn)證。

為了讓模型好理解和修改,研究者用了一種類似XML的“結(jié)構(gòu)化表示機(jī)制”,設(shè)計(jì)機(jī)械就變成了一種語(yǔ)言模型擅長(zhǎng)的結(jié)構(gòu)生成任務(wù)。

一個(gè)自進(jìn)化訓(xùn)練場(chǎng)

上面說(shuō)的這一切,都發(fā)生在BesiegeField這個(gè)仿真平臺(tái)里。它跑在Linux集群上,能同時(shí)跑幾百個(gè)機(jī)械實(shí)驗(yàn),并給到完整的物理反饋——比如速度、受力、能量變化、投擲距離、穩(wěn)不穩(wěn)定、機(jī)械損壞度等等。

這些反饋不僅能驗(yàn)證設(shè)計(jì),還能作為強(qiáng)化學(xué)習(xí)的“獎(jiǎng)勵(lì)信號(hào)”,指導(dǎo)模型改進(jìn)策略。

在這個(gè)平臺(tái)里,模型的設(shè)計(jì)形成了閉環(huán):生成 → 仿真 → 拿反饋 → 調(diào)整 → 再來(lái)一次

就算不更新模型參數(shù),它也能靠反饋優(yōu)化輸出;如果引入強(qiáng)化學(xué)習(xí),模型就能通過(guò)這些量化的獎(jiǎng)勵(lì)信號(hào),系統(tǒng)性地提升設(shè)計(jì)能力和成功率。

平臺(tái)還設(shè)計(jì)了一系列從易到難的任務(wù),比如直線行駛、投擲、抓取,甚至還有過(guò)障礙、地形坡度、穿環(huán)投擲等更復(fù)雜的場(chǎng)景,構(gòu)成了一個(gè)多樣化的實(shí)驗(yàn)空間。

為什么造機(jī)器這么難

造機(jī)器的挑戰(zhàn),不在于零件多少,而在于它們能不能“在動(dòng)態(tài)中協(xié)同工作”來(lái)完成復(fù)雜功能。

拿投石機(jī)來(lái)說(shuō),配重、支點(diǎn)、發(fā)射臂必須在關(guān)鍵時(shí)刻協(xié)同發(fā)力,才能把能量精準(zhǔn)地扔出去。

只要一個(gè)地方偏差,整個(gè)機(jī)器就可能失效:沒(méi)配重,打不出去;缺支點(diǎn),原地轉(zhuǎn)圈;少了杠桿,石頭飛不起來(lái)。

這些問(wèn)題,只有在真實(shí)仿真中才能被發(fā)現(xiàn),也只有這樣,模型才能一步步搞懂“結(jié)構(gòu)到底是怎么動(dòng)起來(lái)的”

差距有多大?人類設(shè)計(jì)的投石機(jī)能投近200米,而大模型設(shè)計(jì)的,常常連30米都到不了。

這其中,差距就在于對(duì)“結(jié)構(gòu)協(xié)同”和“發(fā)力效率”的理解。

這也是BesiegeField要解決的核心問(wèn)題——讓它懂得結(jié)構(gòu)之間“如何協(xié)同去完成任務(wù)”。

模型真學(xué)會(huì)造結(jié)構(gòu)了嗎

為了解決單個(gè)模型“想不明白”的難題,研究團(tuán)隊(duì)構(gòu)建了一套“智能體工作流”(Agentic Workflow),讓多個(gè)AI協(xié)作。

這套系統(tǒng)里有不同角色:

總設(shè)計(jì)師(Meta-Designer): 負(fù)責(zé)拆解任務(wù)。

結(jié)構(gòu)設(shè)計(jì)師(Designer): 搭建初始方案。

審查員(Inspector + Refiner): 檢查結(jié)構(gòu)和連通性。

反饋查詢員(Active Env Querier): 跑仿真并從大量反饋數(shù)據(jù)內(nèi)抽取對(duì)任務(wù)最有用的信息報(bào)告。

分析/優(yōu)化員(Refiner): 解讀反饋,提出修改。

團(tuán)隊(duì)測(cè)試了多個(gè)主流模型,發(fā)現(xiàn)在這套工作流下,Gemini 2.5 Pro的表現(xiàn)很突出。

比如在優(yōu)化投石機(jī)時(shí),Gemini 2.5 Pro能根據(jù)仿真反饋,識(shí)別出“底座太小導(dǎo)致結(jié)構(gòu)失衡”、“旋轉(zhuǎn)軸方向錯(cuò)誤導(dǎo)致無(wú)法發(fā)力”等問(wèn)題,并提出“移除舊底座”、“重新定位手臂和容器”、“構(gòu)建新底座”等修改方案。

對(duì)比表格顯示,這套“多角色分層設(shè)計(jì)”(Hierarchical Design)策略,在投石機(jī)(Catapult)和小車(Car)任務(wù)上,其平均分(Mean)和最高分(Max)都顯著優(yōu)于以Gemini為代表的部分“單一模型”或簡(jiǎn)單的“迭代修改”策略。

關(guān)鍵這些成果是模型自己在真實(shí)反饋里逐步學(xué)會(huì)調(diào)整的

怎么讓AI越造越聰明?

有了工作流還不夠,還得讓模型能“自我進(jìn)化”。研究團(tuán)隊(duì)引入了強(qiáng)化學(xué)習(xí)(RL),具體用了一種叫RLVR(基于可驗(yàn)證反饋的強(qiáng)化學(xué)習(xí))的策略。

BesiegeField的仿真反饋就是現(xiàn)成的“獎(jiǎng)勵(lì)信號(hào)”(Reward):比如投擲距離多遠(yuǎn)?能不能成功執(zhí)行任務(wù)?能運(yùn)行多久?

研究團(tuán)隊(duì)用了Pass@k Training方法(即在k次嘗試中選獎(jiǎng)勵(lì)最大的那個(gè)樣本作為訓(xùn)練信號(hào)),對(duì)Qwen2.5-14B-Instruct這個(gè)模型進(jìn)行持續(xù)微調(diào)。

效果很明顯。隨著迭代次數(shù)增加,模型設(shè)計(jì)的結(jié)構(gòu)越來(lái)越好,投擲距離也越來(lái)越遠(yuǎn)。

定量數(shù)據(jù)也顯示,在“Cold-Start + RL”(用少量好例子啟動(dòng)+強(qiáng)化學(xué)習(xí))的策略下,模型在小車任務(wù)上的最高分達(dá)到了45.72,投石機(jī)任務(wù)的平均分和最高分也都是最優(yōu)的。

這是首次證明,LLM確實(shí)能借助RL,在仿真反饋中持續(xù)提升機(jī)械設(shè)計(jì)能力

AI創(chuàng)造力的新邊界

總的來(lái)說(shuō),BesiegeField帶來(lái)的不只是一個(gè)仿真平臺(tái),更像是一種新的“結(jié)構(gòu)創(chuàng)造范式”

它把復(fù)雜的機(jī)械設(shè)計(jì),轉(zhuǎn)變成了一個(gè)AI擅長(zhǎng)的“結(jié)構(gòu)化語(yǔ)言生成任務(wù)”;

它提供了一個(gè)閉環(huán),讓模型能在真實(shí)的物理反饋中,學(xué)會(huì)理解力學(xué)規(guī)律和結(jié)構(gòu)協(xié)同;

它支持任務(wù)難度可控、流程模塊化、結(jié)果可定量評(píng)估;

更重要的是,它提供了一個(gè)觀察AI如何獲得“空間智能”和“物理智能”的起點(diǎn)。

研究團(tuán)隊(duì)期待,未來(lái)AI造的不僅是投石機(jī),而是能奔跑、搬運(yùn)、協(xié)作的各種復(fù)雜結(jié)構(gòu)——讓語(yǔ)言模型真正具備“造出會(huì)動(dòng)的東西”的能力

Copyright 2017-2025 新車測(cè)評(píng)網(wǎng) 版權(quán)所有  ICP備18049689號(hào)-30
日韩高清一区_国产亚洲一区二区三区四区_亚洲国产一二三_久热精品视频
国内精品亚洲| 国产精品久久91| 久久成人综合视频| 一本色道久久综合狠狠躁篇怎么玩| 亚洲欧洲精品一区二区三区不卡 | 久久精品水蜜桃av综合天堂| 欧美一区二区免费| 久久国产主播精品| 久久人人爽国产| 欧美 日韩 国产 一区| 久久国产精彩视频| 老司机一区二区三区| 欧美高清视频一二三区| 欧美日韩精品中文字幕| 国产精品免费福利| 国产视频精品va久久久久久| 狠狠操狠狠色综合网| 亚洲丰满在线| 一本色道久久综合| 午夜精品久久久久久99热软件| 久久国产精品色婷婷| 欧美中文字幕视频在线观看| 久久都是精品| 欧美黄色影院| 国产精品电影观看| 国产一区二区三区成人欧美日韩在线观看| 国内精品一区二区| 亚洲久久在线| 午夜伦欧美伦电影理论片| 久久在线免费观看视频| 欧美日韩不卡视频| 国产日韩欧美一区二区三区在线观看| 精品1区2区3区4区| 一区二区三区www| 久久精品免费播放| 欧美日韩国产区一| 亚洲欧美资源在线| 久久精品日产第一区二区三区| 免费成人激情视频| 国产精品区二区三区日本| 在线精品高清中文字幕| 在线视频精品一| 久久久久久午夜| 欧美视频一区二区三区| 韩国久久久久| 亚洲视频专区在线| 玖玖精品视频| 欧美日韩亚洲精品内裤| 国产精品久久久久aaaa| 在线看片成人| 亚洲免费视频在线观看| 欧美mv日韩mv国产网站app| 国产精品日韩专区| 亚洲人成在线免费观看| 欧美一区二区三区四区在线观看| 欧美精品麻豆| 合欧美一区二区三区| 亚洲视频碰碰| 免费欧美日韩国产三级电影| 欧美日韩系列| 亚洲国产日韩在线一区模特| 香蕉久久a毛片| 欧美日韩蜜桃| 在线看日韩欧美| 欧美一区二区三区视频免费播放| 欧美噜噜久久久xxx| 一区精品在线| 午夜精品久久久久久久久| 欧美激情第六页| 国产亚洲精品一区二555| 亚洲天堂av图片| 久久躁狠狠躁夜夜爽| 国产精品国产三级国产普通话蜜臀| 亚洲国产日韩一区| 久久久99国产精品免费| 国产精品久久久久久妇女6080 | 老司机精品视频一区二区三区| 国产精品久久久久久久久久久久久久| 一区二区视频在线观看| 欧美一区二区精品在线| 国产精品久久久久久久久免费| 亚洲人成在线播放| 美日韩在线观看| 激情欧美一区二区三区| 久久精品99无色码中文字幕| 国产精品久久久一区二区三区| 亚洲狼人综合| 你懂的国产精品永久在线| 国产在线欧美| 欧美在线www| 欧美视频在线观看一区二区| 亚洲精品视频在线观看免费| 欧美91福利在线观看| 亚洲国产成人精品久久久国产成人一区| 久久精品中文字幕免费mv| 国产午夜精品久久久久久免费视 | 亚洲高清资源| 久久综合久久88| 尹人成人综合网| 久久最新视频| 在线国产精品播放| 久久一区亚洲| 亚洲福利视频一区二区| 欧美1区2区视频| 亚洲第一视频| 欧美成人在线免费视频| 亚洲国产精品99久久久久久久久| 久久久综合香蕉尹人综合网| 狠狠色狠狠色综合日日小说| 久久精品首页| 在线日本欧美| 久久精品国产欧美亚洲人人爽| 亚洲欧美不卡| 亚洲免费在线视频| 国内自拍亚洲| 好看的亚洲午夜视频在线| 欧美激情视频一区二区三区免费| 国产日产精品一区二区三区四区的观看方式| 麻豆国产精品va在线观看不卡| 欧美暴力喷水在线| 久热精品视频在线| 久久久久久有精品国产| 国产精品福利在线| 亚洲精品在线视频观看| 欧美中文在线观看| 亚洲欧洲日夜超级视频| 最新亚洲一区| 亚洲国产欧美一区| 亚洲在线国产日韩欧美| 久久九九有精品国产23| 欧美成人午夜视频| 国产日韩欧美一二三区| 欧美xart系列在线观看| 亚洲一区精彩视频| 在线观看的日韩av| 欧美视频一区二区三区在线观看| 久久精品国产99精品国产亚洲性色| 亚洲人成人77777线观看| 国产精品久久久久aaaa樱花| 久久久久国内| 精东粉嫩av免费一区二区三区| 日韩视频一区二区在线观看 | 久久频这里精品99香蕉| 亚洲精品一区在线| 国产欧美日韩综合| 欧美黑人一区二区三区| 翔田千里一区二区| 99伊人成综合| 一色屋精品视频在线看| 国产精品推荐精品| 欧美成人精品在线| 欧美在线在线| 亚洲午夜女主播在线直播| 国产偷久久久精品专区| 亚洲国产欧美在线| 一区二区三区波多野结衣在线观看| 中文在线资源观看网站视频免费不卡 | 亚洲中无吗在线| 影音先锋成人资源站| 欧美性猛交xxxx乱大交蜜桃| 看片网站欧美日韩| 午夜精品剧场| 中国女人久久久| 亚洲国产老妈| 国产日韩在线看片| 欧美色中文字幕| 欧美粗暴jizz性欧美20| 久久久99免费视频| 欧美一区二区在线视频| 亚洲一区免费网站| 一本色道久久精品| 亚洲精品乱码久久久久久日本蜜臀 | 国产精品视频免费一区| 欧美日韩精品在线视频| 欧美福利影院| 久久伊人精品天天| 久久精品国产一区二区电影| 亚洲欧美综合另类中字| 宅男噜噜噜66一区二区66| 亚洲另类一区二区| 亚洲日本黄色| 亚洲黄一区二区三区| 在线视频成人| 精品动漫一区二区| 精品成人一区| 国内精品久久久久久久影视麻豆| 国产嫩草一区二区三区在线观看| 国产精品第2页| 欧美香蕉视频| 国产精品porn| 国产精品伦理| 国产精品你懂的在线欣赏| 国产精品成人一区二区三区夜夜夜| 欧美日韩国产综合新一区| 欧美精品1区2区| 欧美日韩国产精品| 欧美日韩免费观看一区| 欧美日韩 国产精品| 欧美日韩ab| 欧美视频在线观看| 国产精品久久久久9999| 欧美专区第一页| 久久精精品视频| 久久久综合网站|