今年,具身智能的概念可謂炙手可熱。如果說身著花襖、手持手絹,在“蛇年春晚”上驚艷亮相的機器人們是將這一事物引入了大眾視野,那么2025年政府工作報告首次將其列為未來產(chǎn)業(yè)培育方向,則標志著具身智能正式上升為國家戰(zhàn)略高度,成為與生物制造、量子科技、6G等技術(shù)并列的重點行業(yè)。
在展廳里,機器人們上得了廳堂、下得了廚房早已不是新鮮事。但要讓具身智能真正走出“秀場”,走進工廠、商店、家庭等現(xiàn)實場景,仍面臨諸多挑戰(zhàn)。2025年,被普遍認為是智能機器人量產(chǎn)元年,我們不禁要問:具身智能將如何突破技術(shù)瓶頸,重塑人類的生產(chǎn)生活方式?
機器人在春晚舞臺上表演
應(yīng)用場景百花齊放
伴隨著具身智能概念的大火,2025年涌現(xiàn)出多個“首次”應(yīng)用:首屆人形機器人半程馬拉松賽事、首個具身智能康復示范基地、首家具身智能4S店……具身智能“落地為王”的時代已然開啟。
智元機器人研究院執(zhí)行院長、具身業(yè)務(wù)部總裁姚卯青表示,具身智能的特點在于更多強調(diào)一種反饋式的閉環(huán)控制。機器人將具備強大的推理規(guī)劃和柔性能力,在執(zhí)行任務(wù)時能實時調(diào)整規(guī)劃,甚至在出錯時可以自主糾錯和重新規(guī)劃。
換言之,具身智能機器人不僅能執(zhí)行任務(wù),還能適應(yīng)變化、主動思考,有時甚至能完成人類難以完成的工作。目前,具身智能已在制造業(yè)、服務(wù)業(yè)和居家生活等多個場景內(nèi)悄然展開應(yīng)用。
在工業(yè)場景中,傳統(tǒng)機器人更適應(yīng)標準化、大批量的生產(chǎn)模式,而面對定制化任務(wù)時常捉襟見肘。以造船業(yè)為例,船舶的部件各不相同,傳統(tǒng)機器人需要頻繁調(diào)試程序,導致效率大幅降低。同時,柔性生產(chǎn)場景也是傳統(tǒng)機器人的盲區(qū),配天機器人CTO郭濤表示,具身智能已經(jīng)可以在焊接、噴涂等基礎(chǔ)的工業(yè)場景中發(fā)揮作用,有效緩解了招工難、人才培養(yǎng)難的問題,提高了生產(chǎn)質(zhì)量。
在商業(yè)場景中,具身智能機器人猶如“全能員工”。在近期舉辦的世界人工智能大會上,智元機器人遠征A2進行了擊鼓、舞龍、書法等傳統(tǒng)文化技能表演;擎朗智能XMAN-F1機器人扮演“小食店服務(wù)生”,流暢地完成了爆米花和飲品制作工作;商湯科技機器人作為“講解員”,講解“長安的荔枝”PPT內(nèi)容,能回答問題并進行階段性總結(jié)。
在家庭場景中,具身智能正在“飛入尋常百姓家”,科沃斯公關(guān)總監(jiān)馬憲彬表示,做飯和做家務(wù)是家庭生活的瑣碎問題,也是具身智能機器人在居家生活中著重探索的方向。而樂享科技、鹿明機器人等公司對家庭陪伴型機器人的開發(fā),則將機器人的意義從提供工具價值進一步拓展至提供情感價值。
落地模式各有側(cè)重
目前,具身智能機器人行業(yè)仍處于從概念驗證到早期商用的過渡階段,大規(guī)模商業(yè)落地尚未實現(xiàn),“具身智能將在哪個場景率先落地”成為業(yè)界人士熱議的話題。
馬憲彬指出,目前具身智能機器人技術(shù)尚不成熟,應(yīng)用主要集中在演示性場景和容錯率較高的場景。郭濤認為,未來的機器人將從應(yīng)對簡單場景向解決復雜問題過渡,能夠在工業(yè)、服務(wù)、家庭等多個領(lǐng)域中發(fā)揮重要作用。
商超值守機器人(圖源:銀河通用)
有專家認為,工業(yè)場景或?qū)⒃诼涞剡M程中“先人一步”。姚卯青認為,工業(yè)場景的優(yōu)勢在于任務(wù)明確,環(huán)境也相對結(jié)構(gòu)化。郭濤也認為,工業(yè)應(yīng)用相對可控,對機器人泛化能力的要求較低,工業(yè)機器人憑借成熟的硬件基礎(chǔ)和豐富的應(yīng)用經(jīng)驗,其與具身人工智能的結(jié)合,將成為快速打開大規(guī)模下游場景的最佳路徑。但也有專家表示,工業(yè)場景對機器人的應(yīng)用精度和適配程度要求較高,其實際應(yīng)用價值尚不明確,相比其他場景落地難度更大。
無論秉持何種觀點,專家們普遍認可的是,具身智能機器人應(yīng)用終將在家庭場景中爆發(fā)。對于具身智能進入普通家庭的時間,馬憲彬認為,短則三年,長則十年,關(guān)鍵在于資本市場對具身智能上游實體產(chǎn)業(yè)的投資與耐心。他指出,具身智能進入家庭還需解決兩個問題,其一是安全,包括信息安全和使用安全;其二是能力,機器人需要比人更有性價比。
值得注意的是,人形機器人被視為具身智能的關(guān)鍵載體之一,但具身智能機器人的最終落地形態(tài)并不一定是人形,而是跟隨場景與需求靈活變動。以工業(yè)場景為例,大部分機器人是非人形的,制約其發(fā)展的也并非硬件條件,而是智能化程度。
大規(guī)模推廣任重道遠
盡管具身智能機器人在落地模式上已有多元探索,不同場景的應(yīng)用雛形也逐步顯現(xiàn),但要真正突破“小眾應(yīng)用”的局限,實現(xiàn)大規(guī)模推廣,仍面臨技術(shù)、成本、環(huán)境適配等多重挑戰(zhàn)。
從技術(shù)核心來看,樂聚機器人董事長冷曉琨認為,具身智能機器人產(chǎn)業(yè)的發(fā)展是大腦、小腦、本體三者的深度融合,其中,大腦+小腦的“+”會是更為核心的問題。騰訊首席科學家、Robotics X實驗室主任、福田實驗室主任張正友也指出,機器人硬件與具身智能的共生關(guān)系,不是簡單拼裝,而是從傳感器到大小腦再到執(zhí)行器的系統(tǒng)級融合創(chuàng)新。
在實際運行中,機器人的大小腦技術(shù)均尚不成熟,走跑跳、抓握遞等動作控制能力,多由小腦控制。走進智元新創(chuàng)技術(shù)有限公司,記者看到,從貨架上取商品、把外賣交給顧客、在廚房烹飪、進臥室疊衣服……種種人類容易完成的動作,要想讓機器人效仿,需要數(shù)據(jù)采集員帶領(lǐng)機器人重復數(shù)百次、上千次,甚至更多才能實現(xiàn)。
在大腦訓練層面,具身“大腦”主要負責AI大模型驅(qū)動的任務(wù)規(guī)劃,具備自然交互、空間感知、意圖理解、分層規(guī)劃和錯誤反思等能力?!熬呱碇悄軝C器人使用的大模型技術(shù)不同于日常所說的大語言模型,還涉及多模態(tài)融合、實時交互等技術(shù),要困難得多。”郭濤表示,“目前業(yè)界尚未形成統(tǒng)一的技術(shù)路徑,不可能突然端上來一個什么都會干的機器人,這是不符合客觀規(guī)律的?!?/span>
機器人學習疊衣服(圖源:智元機器人)
具身智能機器人發(fā)展還面臨數(shù)據(jù)瓶頸。業(yè)內(nèi)專家普遍表示,虛擬仿真技術(shù)雖能緩解部分數(shù)據(jù)不足的問題,但現(xiàn)實空間往往更為復雜和多樣,使得機器人在陌生環(huán)境中容易“水土不服”;同時,跨語言數(shù)據(jù)獲取難,也制約了海內(nèi)外市場的聯(lián)動效率。
除此之外,動力挑戰(zhàn)也不容忽視。具身智能機器人的精細動作控制、端側(cè)AI運算等功能需消耗大量能量,但機器人體積受限,無法配備過大電池,設(shè)計需平衡容量、穩(wěn)定性、便攜性及安全性問題。
針對上述問題,行業(yè)推出了多種解決方案。例如,建立具身智能數(shù)據(jù)工廠、推出通用具身基座大模型、探索感知類模型的復用機制等,助力具身智能機器人加速落地。郭濤認為,中國完整的制造業(yè)體系、豐富的應(yīng)用場景、龐大的從業(yè)群體,以及深厚的數(shù)據(jù)基礎(chǔ),將持續(xù)推動具身智能產(chǎn)業(yè)實現(xiàn)跨越式發(fā)展。
(審核編輯: 光光)
分享