具身智能與智能機器人的發(fā)展態(tài)勢如何?2025年人工智能在工業(yè)制造領(lǐng)域的應用將迎來(lái)怎樣的重大突破?據市場(chǎng)調研機構MarketsandMarkets預測,全球垂類(lèi)AI應用市場(chǎng)規模將在2030年突破471億美元,其中工業(yè)制造作為關(guān)鍵領(lǐng)域,正在加速向智能化生產(chǎn)與全流程自動(dòng)化方向迭代,同時(shí)具身智能與智能機器人技術(shù)正在與傳統工業(yè)制造領(lǐng)域深度融合。2025年將是具身智能從實(shí)驗室邁向工廠(chǎng)的關(guān)鍵轉折點(diǎn),而人形機器人作為高階形態(tài),則有望在工業(yè)領(lǐng)域率先實(shí)現商用突破,重塑全球制造業(yè)競爭格局。
近日,中國工程院院士、博士生導師 ,中國科學(xué)院沈陽(yáng)自動(dòng)化研究所研究員,機器人與智能系統全國重點(diǎn)實(shí)驗室主任于海斌,在沈陽(yáng)市高新技術(shù)企業(yè)協(xié)會(huì )主辦的“創(chuàng )新聚沈·向陽(yáng)而行”大會(huì )上圍繞具身智能與智能機器人展開(kāi)深度分享。
人工智能的歷史脈絡(luò )與具身智能的誕生
人工智能(AI)自1956年達特茅斯會(huì )議正式提出以來(lái),經(jīng)歷了數次技術(shù)浪潮與寒冬。于海斌院士指出,AI的發(fā)展可分為四個(gè)階段:
· 符號邏輯推理階段(1950s-1980s):以知識表達和專(zhuān)家系統為核心,但受限于知識獲取的困難,最終因實(shí)用性不足進(jìn)入第一次寒冬。
· 神經(jīng)網(wǎng)絡(luò )連接階段(1980s-2000s):辛頓(Geoffrey Hinton)等人提出反向傳播算法,推動(dòng)神經(jīng)網(wǎng)絡(luò )發(fā)展,但受限于算力和數據,應用場(chǎng)景有限。
· 深度學(xué)習階段(2010s至今):以卷積神經(jīng)網(wǎng)絡(luò )(CNN)和斯坦福大學(xué)李飛飛團隊構建的ImageNet數據庫為標志,AI在圖像識別等領(lǐng)域實(shí)現突破,識別率從60%提升至超越人類(lèi)水平。
· 具身智能(Embodied AI)階段(2020s起):AI從純數據驅動(dòng)轉向與物理世界交互,強調智能體通過(guò)身體、環(huán)境與任務(wù)的協(xié)同實(shí)現認知與行為進(jìn)化。
圖靈早在計算機理論初期即提出兩種智能路徑——“離身智能”(如ChatGPT依賴(lài)純數據推理)與“具身智能”(需與物理設備結合)。然而,具身智能因技術(shù)復雜度高長(cháng)期滯后,直到機器人學(xué)、神經(jīng)科學(xué)和心理學(xué)的交叉融合為其提供了新思路。
具身智能的核心內涵與科學(xué)依據
環(huán)境交互與智能發(fā)育的必然性:于海斌院士例舉了一項科學(xué)實(shí)驗,來(lái)印證環(huán)境交互與智能發(fā)育呈現正相關(guān)性,該實(shí)驗反饋了智能的成長(cháng)依賴(lài)與環(huán)境的動(dòng)態(tài)互動(dòng)作用。
來(lái)自麻省理工學(xué)院兩位研究人員,把兩只小貓放進(jìn)了一個(gè)圓桶內,兩只小貓都在圓筒內部繞圈運動(dòng)。第一只小貓是白己走的;第二只小貓則被放在與柱體中心軸相連的小盒子里。兩只小貓看到的東西完全相同。結果顯示只有靠自己身體運動(dòng)的小貓發(fā)育出了正常的視力。這進(jìn)一步印證了“心靈手巧”的逆向邏輯——肢體動(dòng)作的靈活性(如操作工具)會(huì )反向促進(jìn)認知能力的提升。
具身智能三位一體的智能框架:具身智能強調“大腦-身體-環(huán)境”三位一體。其中大腦負責高層決策與意圖理解(如大語(yǔ)言模型),身體通過(guò)傳感器與執行器實(shí)現物理交互(如機械臂、仿生關(guān)節),環(huán)境提供動(dòng)態(tài)反饋與訓練場(chǎng)景(如仿真平臺、真實(shí)物理空間)。三者協(xié)同構成閉環(huán),使智能體能夠通過(guò)試錯學(xué)習適應復雜任務(wù)。
從“感知智能”到“行動(dòng)智能”的跨越:傳統AI擅長(cháng)靜態(tài)感知(如圖像識別),但缺乏對物理世界的動(dòng)態(tài)響應能力。波士頓動(dòng)力(Boston Dynamics)的Atlas機器人通過(guò)深度學(xué)習與強化學(xué)習結合,實(shí)現了翻越障礙、適應地形變化等復雜動(dòng)作,標志著(zhù)具身智能在運動(dòng)控制領(lǐng)域的突破。
圍繞具身智能四大熱點(diǎn)的思考與技術(shù)挑戰:
數字人:中國通用人工智能研究院開(kāi)發(fā)的“數字人通通”模擬人類(lèi)從嬰兒期開(kāi)始的成長(cháng)過(guò)程,通過(guò)與虛擬環(huán)境的交互(如聽(tīng)覺(jué)、觸覺(jué)反饋)實(shí)現認知進(jìn)化。這一嘗試為研究人類(lèi)智能發(fā)育提供了新范式,但也引發(fā)倫理爭議——若機器人通過(guò)環(huán)境交互自主進(jìn)化,人類(lèi)是否可能失去控制?
機械臂與大語(yǔ)言模型的融合:谷歌RT-X平臺將大語(yǔ)言模型(LLM)與機器人操作結合,使機械臂能夠理解自然語(yǔ)言指令(如“整理房間”),并自主分解任務(wù)步驟(識別雜物、分類(lèi)歸置)。這一技術(shù)已在疊衣服、精細裝配等場(chǎng)景中展現潛力,但其泛化能力仍受限于物理規則與數據多樣性。
人形機器人的爭議與前景:馬斯克力推的Optimus人形機器人引發(fā)兩極評價(jià)。支持者認為人形是通用化的終極形態(tài),可適配人類(lèi)環(huán)境(如樓梯、工具),而質(zhì)疑者指出其成本高昂、技術(shù)冗余(如多關(guān)節驅動(dòng)難題)。
于海斌院士認為,人形機器人的核心價(jià)值在于“本體硬件”與“智能算法”的協(xié)同突破。例如,開(kāi)源算法(如波士頓動(dòng)力的運動(dòng)控制模型)大幅降低了本體研發(fā)門(mén)檻,而黃仁勛(英偉達CEO)布局的具身智能訓練平臺,或將推動(dòng)行業(yè)標準化。
智能駕駛與低空經(jīng)濟:盡管全無(wú)人駕駛面臨地面環(huán)境的極端復雜性(如突發(fā)行人、不規則道路),但網(wǎng)聯(lián)汽車(chē)的輔助駕駛(如車(chē)道保持、自動(dòng)泊車(chē))和低空經(jīng)濟(無(wú)人機物流、巡檢)已成為更可行的商業(yè)化方向。
技術(shù)路徑:肢體、小腦與大腦的協(xié)同進(jìn)化
在機器人技術(shù)路徑未來(lái)發(fā)展趨勢探討方面,于海斌院士表示未來(lái)人形機器人肢體部分有很大的提升空間,如基于高能量密度的仿生驅動(dòng)肢體。仿照人類(lèi)心臟的高效供能機制,研發(fā)微型液壓驅動(dòng)與仿生肌肉,如德國費斯托的氣動(dòng)機械臂就是一個(gè)很好的參考方向,該機械臂核心優(yōu)勢在于其高精度控制與仿生設計的融合,擁有12個(gè)自由度,動(dòng)作柔性且穩定,部分型號搭載AI技術(shù)實(shí)現自我學(xué)習優(yōu)化,電磁閥壽命超3000萬(wàn)次,具備良好的性能和耐用性。
此外,生物融合也是未來(lái)機器人發(fā)展趨勢。未來(lái),我們可以通過(guò)培養生物細胞構建具有感知與驅動(dòng)能力的“類(lèi)器官”產(chǎn)品,盡管其生存環(huán)境要求苛刻,但為軟體機器人提供了新思路。
小腦主要作用在于提升人形機器人的運動(dòng)協(xié)調能力,運動(dòng)控制依賴(lài)海量物理數據,而真實(shí)環(huán)境訓練成本過(guò)高。目前國內已經(jīng)有相對成熟的平臺進(jìn)行機器人的模擬訓練,如國家地方共建人形機器人創(chuàng )新中心開(kāi)發(fā)的,異構人形機器人訓練場(chǎng)通過(guò)“虛擬-現實(shí)”遷移學(xué)習(Sim2Real),使機器人能在低成本場(chǎng)景中預訓練動(dòng)作(如行走、跳躍),再遷移至真實(shí)環(huán)境微調。
大腦提供決策模型與機器人的認知能力,目前多模態(tài)感知技術(shù)是主要方案,該方案融合視覺(jué)、觸覺(jué)、力覺(jué)傳感器,提升環(huán)境理解的全面性。在具體案例方面,北京大學(xué)電子學(xué)院程翔教授團隊提出的“機器聯(lián)覺(jué)”系統,通過(guò)智能融合通信與多模態(tài)感知信息,有效提升了機器人在復雜環(huán)境中的感知、決策與通信能力。
此外,于海斌院士也提到了如何解決大模型“災難性遺忘”問(wèn)題,實(shí)現機器人的終身學(xué)習方式。愛(ài)丁堡大學(xué)提出的增量強化學(xué)習框架是一個(gè)很好的解決“災難性遺忘”的解決方案。它能夠在保持已有知識的基礎上,通過(guò)逐步增量式地更新策略,快速適應新環(huán)境或新任務(wù),從而顯著(zhù)提升機器人在動(dòng)態(tài)變化環(huán)境中的學(xué)習效率和性能表現,無(wú)需從頭開(kāi)始重新訓練整個(gè)模型。
未來(lái)十年技術(shù)趨勢研判與產(chǎn)業(yè)啟示:
于海斌院士預測,未來(lái)十年,具身智能的算法與訓練平臺將快速發(fā)展,而硬件(如高精度傳感器、仿生關(guān)節)受限于材料與工藝,進(jìn)步速度相對緩慢。企業(yè)需優(yōu)先布局軟件生態(tài)(如仿真平臺、數據鏈),而非盲目投入硬件研發(fā)。
此外具身智能缺乏統一理論體系(如認知科學(xué)的世界模型),但場(chǎng)景驅動(dòng)的工程化應用(如倉儲機器人、醫療外骨骼)將率先落地。國家需推動(dòng)跨機構協(xié)作,解決數據確權與模型共享難題。
在通用終端的終極形態(tài)方面,于海斌院士認為人形機器人未必是唯一答案,具身智能可能通過(guò)“一腦多機”模式賦能多樣化設備(如工業(yè)機床、家用電器)。例如,同一AI核心可同時(shí)調度無(wú)人機群與地面機器人,實(shí)現任務(wù)協(xié)同。
在倫理與安全方面,于海斌院士認為,若具身智能體通過(guò)環(huán)境交互自主進(jìn)化,可能超出人類(lèi)預設的邊界。行業(yè)需提前建立倫理規范(如行為約束算法、人機權責界定),避免技術(shù)失控風(fēng)險。
結語(yǔ)與未來(lái):
具身智能正在讓AI從“虛擬大腦”向“物理實(shí)體”迭代,在技術(shù)演化的道路上,需要更加關(guān)注技術(shù)創(chuàng )新的有效性與產(chǎn)業(yè)化的可落地性。正如于海斌院士所言:“藍海的意義在于未知,而未知需要勇氣與智慧并存?!睂Ξa(chǎn)業(yè)從業(yè)者而言,打破學(xué)科壁壘、深化理論突破,聚焦場(chǎng)景剛需、參與生態(tài)共建或將成為搶占先機的關(guān)鍵。
來(lái)源:騰訊網(wǎng)