
2025年7月26-29日,以“智能時代 同球共濟”為主題的世界人工智能大會(WAIC2025)在上海舉行,具身智能作為“AI如何走出屏幕”的現(xiàn)實命題備受關(guān)注。本次大會涵蓋40余款大模型、60余款智能機器人,以及80余款“全球首發(fā)”或“中國首秀”的新品,規(guī)模創(chuàng)歷屆之最。與上屆大會相比,具身智能在技術(shù)方面從單模型向多模態(tài)躍遷,產(chǎn)品泛化能力和垂直應(yīng)用均有提升,標準穩(wěn)步建立,生態(tài)不斷優(yōu)化,但此次大會也暴露出具身智能仍面臨:數(shù)據(jù)基礎(chǔ)不佳、產(chǎn)業(yè)卡點淤塞、標準仍不健全的問題。我宜豐富訓(xùn)練數(shù)據(jù),規(guī)范數(shù)據(jù)安全;突破腦、肢卡點,完善標準,力爭成為全球產(chǎn)業(yè)主導(dǎo)者。
大會關(guān)于具身智能的變化分析
(一)技術(shù)能力持續(xù)演進。一是多模態(tài)融合成為主流。2024大會上,具身智能技術(shù)焦點還是以單一感知和單一任務(wù)為主。2025年,具身智能技術(shù)向視覺、語言、觸覺等多源信息感知整合演進,能夠?qū)崿F(xiàn)對復(fù)雜、動態(tài)環(huán)境理解與實時響應(yīng)。如商湯科技展出的多模態(tài)交互“具身智能大腦”,能讓傅利葉GRx機器人通過融合圖像、視頻、語音和文本等信息理解環(huán)境,進行思考與表達。二是在機器人感知、控制與決策等關(guān)鍵技術(shù)環(huán)節(jié)不斷突破。如深謀科技重點展示新一代人形機器人“美猴王”五大核心技術(shù)突破,包括業(yè)界獨創(chuàng)的OmniSense聲表面波感知系統(tǒng)、腦電控制方案Mindmover、國內(nèi)首個“彈起”壓電式六維力傳感器、具類人動態(tài)視覺理解能力的6D姿態(tài)視覺伺服系統(tǒng)等。
(二)產(chǎn)品由“可展示”走向“可應(yīng)用”。一是智能水平持續(xù)躍升。2024年展品以語音交互和基礎(chǔ)動作控制為主,多數(shù)仿人機器人仍處于概念驗證階段。2025年大批產(chǎn)品搭載VLA(視覺-語言-動作)模型,具備復(fù)雜指令理解、環(huán)境感知與動作協(xié)調(diào)能力,智能化程度顯著提升。如特斯拉人形機器人Tesla Bot不僅能夠完成清潔桌面、吸塵、拉窗簾等基礎(chǔ)任務(wù),還能執(zhí)行精細化抓取、焊接、裝卸等復(fù)雜任務(wù)。二是產(chǎn)品形態(tài)及應(yīng)用場景加速拓展。2024年展品大多聚焦于家庭清潔等單一任務(wù)執(zhí)行場景。2025年展品涵蓋人形機器人、工業(yè)機械臂、物流機器人等多種類型,應(yīng)用場景也擴展至多個行業(yè)。如國地中心首發(fā)的全尺寸通用青龍V3.0人形機器人,具備36自由度和3m/s直膝行走能力,廣泛應(yīng)用于安保巡邏與特種作業(yè)等復(fù)雜場景。賽博格機器人能夠在高危、高負荷環(huán)境中執(zhí)行工具切換、電網(wǎng)測試等任務(wù)。
(三)協(xié)同創(chuàng)新生態(tài)及資本助推進一步深化。一是產(chǎn)學(xué)研各創(chuàng)新主體加速融合。大會期間,智元機器人正式發(fā)布“智元靈渠 OS”開源計劃,通過開源模式攜手產(chǎn)業(yè)界共同構(gòu)建具身智能操作系統(tǒng)生態(tài),解決當前機器人操作系統(tǒng)碎片化、適配成本高、智能體服務(wù)難協(xié)同等行業(yè)痛點。二是產(chǎn)業(yè)資本加速涌入。2025年上半年,我國具身智能行業(yè)的投資事件共計91起,已經(jīng)超過2024年全年的77起,總投資金額達到110.37億元。具身智能明星公司宇樹科技于今年6月完成C輪融資,估值超100億,由中國移動旗下基金、騰訊、錦秋基金、阿里等共同領(lǐng)投。
具身智能產(chǎn)業(yè)發(fā)展仍面臨三大挑戰(zhàn)
(一)數(shù)據(jù)基礎(chǔ)不佳,導(dǎo)致產(chǎn)業(yè)基底不穩(wěn)。一是具身智能訓(xùn)練數(shù)據(jù)缺口大。具身智能需要上億條訓(xùn)練數(shù)據(jù)方能達到完全自主水平,但現(xiàn)有公開數(shù)據(jù)集最大僅在百萬量級,需通過軟件仿真模擬、真實數(shù)據(jù)采集等方式補充訓(xùn)練數(shù)據(jù),但兩種方案各有不足:一方面,仿真數(shù)據(jù)的保真度有限,難以滿足復(fù)雜任務(wù)需求。斯坦福大學(xué)研究表明,仿真數(shù)據(jù)訓(xùn)練簡單任務(wù)的成功率可達80%,但訓(xùn)練復(fù)雜任務(wù)時成功率僅40%。另一方面,真實數(shù)據(jù)的采集成本高昂。例如,據(jù)國地中心測算,特斯拉為使具身智能機器人勝任工廠工作,需花費至少5億美元采集數(shù)據(jù)。二是具身智能仍存數(shù)據(jù)隱私安全風(fēng)險。具身智能為滿足多樣化任務(wù)需求,需持續(xù)采集環(huán)境信息、運動軌跡等數(shù)據(jù),信息獲取呈現(xiàn)全息化、持續(xù)化特征,但普遍缺乏有效的篩選、脫敏與授權(quán)機制。一旦設(shè)備操作系統(tǒng)異?;蛟馐芫W(wǎng)絡(luò)攻擊,極易引發(fā)敏感數(shù)據(jù)大規(guī)模泄露。如MIT研究團隊發(fā)現(xiàn)Roomba J7系列機器人在構(gòu)建地圖過程中自動采集接觸人員的圖像,涉及敏感場景且未經(jīng)用戶知情同意便將數(shù)據(jù)上傳用于訓(xùn)練第三方AI模型。
(二)關(guān)鍵環(huán)節(jié)仍有卡頓,導(dǎo)致產(chǎn)業(yè)發(fā)展受限。一是具身智能關(guān)鍵技術(shù)仍待突破?!按竽X”方面,對物理世界的深度感知與適應(yīng)能力不足。我國大模型在空間感知、復(fù)雜現(xiàn)實環(huán)境認知能力等方面仍處于起步階段,難以滿足具身智能與三維現(xiàn)實世界交互的需求?!靶∧X”方面,全球小腦對動作控制的成功率還未達產(chǎn)業(yè)化落地水平。根據(jù)高盛研究顯示,在操控層面,國際領(lǐng)先的技術(shù)成熟度為40%,而中國僅為20%。二是核心零部件精度不足。在高端具身智能,特別是人形機器人高精度零部件方面仍需依賴進口。四肢部分,決定關(guān)節(jié)精準度的行星滾柱絲杠,國外企業(yè)占80%市場份額,我國面臨較高的加工工藝壁壘。傳感器部分,六維力矩傳感器和扭矩傳感器,美國均占最大市場份額,且技術(shù)全面、成熟。動力部分,影響動力傳輸?shù)臒o框力矩電機由美國科爾摩根、德國威騰斯坦等主導(dǎo)。
(三)具身智能的標準體系尚未完善,制約產(chǎn)業(yè)協(xié)同發(fā)展效率。一是具身智能系統(tǒng)性標準制定進程緩慢。雖然2025年4月我國已發(fā)布《人形機器人標準體系框架》,確立了基礎(chǔ)共性、關(guān)鍵技術(shù)、部組件、整機與系統(tǒng)和應(yīng)用等五大維度的標準架構(gòu),但具體細分標準的制定進展緩慢,目前僅零散出臺了《腿式機器人性能及試驗方法》《人形機器人數(shù)據(jù)集數(shù)據(jù)標注》等個別標準,關(guān)鍵的數(shù)據(jù)采集、運動控制、接口規(guī)范等標準仍處于缺失狀態(tài)。二是規(guī)范缺失制約跨品牌機器人協(xié)同作業(yè)。由于硬件接口、通信協(xié)議、數(shù)據(jù)格式、操作系統(tǒng)等缺乏統(tǒng)一規(guī)范,可復(fù)用的通用組件和開發(fā)工具不足,多數(shù)科技公司被迫各自從零搭建基礎(chǔ)設(shè)施,造成技術(shù)路線碎片化,嚴重制約產(chǎn)業(yè)生態(tài)協(xié)同發(fā)展。例如宇樹科技基于開源ROS框架開發(fā)了實時操作系統(tǒng)(RTOS),而優(yōu)必選則采用自研的ROSA系統(tǒng),兩者的底層通信協(xié)議、接口標準和開發(fā)工具鏈互不兼容。
多舉并用,突破具身智能產(chǎn)業(yè)發(fā)展初期困境
一是豐富訓(xùn)練數(shù)據(jù),完善算力體系。一方面強化高質(zhì)量數(shù)據(jù)采集,推動場景化數(shù)據(jù)積累。另一方面健全數(shù)據(jù)處理規(guī)范體系,防范隱私泄露風(fēng)險;二是突破腦肢傳動技術(shù),優(yōu)化供應(yīng)鏈。一方面提升研發(fā)能力,實現(xiàn)端到端突破;另一方面復(fù)用同類產(chǎn)業(yè)制造能力,擴大零部件性價比優(yōu)勢。三是完善隱私安全法律體系。一方面借鑒地方及成熟領(lǐng)域的標準,完善國家級具身智能標準體系;另一方面二是以示范試點推動關(guān)鍵場景標準落地,促進產(chǎn)業(yè)生態(tài)協(xié)同發(fā)展
2025年世界人工智能大會讓我們共同見證了具身智能領(lǐng)域的非凡進展,從人形機器人的靈敏動作到數(shù)字孿生技術(shù)的無縫銜接,再到多模態(tài)感知的突破性應(yīng)用,具身智能正以前所未有的速度改變我們的世界。各種市場數(shù)據(jù)表明,具身智能正以驚人速度增長,亞太地區(qū)尤為突出。展望未來,具身智能將通過更強大的算力、完善的法律體系和全球合作,開啟智能化社會新篇章。
