◎記者 劉逸鵬
2025年,對(duì)于人形機(jī)器人產(chǎn)業(yè)來(lái)說(shuō),注定是不能忘卻的一年。
從央視春晚舞臺(tái)的“秀場(chǎng)勁舞”,到各類展臺(tái)的“頻頻握手”,仿佛一夜之間,人形機(jī)器人已經(jīng)走到人們?nèi)粘I畹摹拔枧_(tái)”中央,人類與機(jī)器人未來(lái)如何共處的話題——無(wú)論是欣喜還是焦慮——到處充斥。
在“未知”成為“已知”之前,是資本“狂歡”的大好時(shí)機(jī)——
這一年,人形機(jī)器人概念板塊隨風(fēng)起舞,稍微沾上概念,便飛騰而起;
這一年,人形機(jī)器人產(chǎn)業(yè)鏈公司備受追捧,資本瞅準(zhǔn)時(shí)機(jī),便推門而入;
這一年,人形機(jī)器人上下游企業(yè)瞄準(zhǔn)上市,只要一有機(jī)會(huì),便一躍而上……
公開(kāi)數(shù)據(jù)顯示,截至2025年11月19日,今年以來(lái)中國(guó)人形機(jī)器人領(lǐng)域已發(fā)生162起融資事件,披露金額超400億元,大幅超過(guò)2024年全年。2025年以來(lái),有近30家機(jī)器人產(chǎn)業(yè)鏈企業(yè)遞表港交所。
與此同時(shí),部分人形機(jī)器人創(chuàng)業(yè)公司卻在資本的“狂歡”中黯然倒閉,有關(guān)產(chǎn)業(yè)泡沫的爭(zhēng)議也撲面而來(lái)。“冰與火”之下,人形機(jī)器人未來(lái)究竟幾何?
上海證券報(bào)記者調(diào)研采訪了解到,當(dāng)下,人形機(jī)器人從秀技舞臺(tái)到商業(yè)場(chǎng)景的跨越,或許要比想象的更為漫長(zhǎng)。行業(yè)也在形成一種共識(shí)——人形機(jī)器人表演只是序章,而非終局;真正的競(jìng)賽,是始于對(duì)物理世界復(fù)雜性的敬畏,成于對(duì)數(shù)據(jù)、算法與硬件的扎實(shí)閉環(huán)。
“快進(jìn)”與“慢行”
快進(jìn)——這是RoboScience創(chuàng)始人田野為2025年人形機(jī)器人產(chǎn)業(yè)選定的關(guān)鍵詞。
這家成立未滿一年的具身智能公司,發(fā)展節(jié)奏快得驚人。“2024年底回國(guó),同步完成公司注冊(cè);2025年3月正式運(yùn)營(yíng),截至7月已完成近2億元融資;投資方包括京東、招商局創(chuàng)投、商湯國(guó)香資本、零一創(chuàng)投。”在田野的敘述中,過(guò)去不到一年的時(shí)間里,他的每一天都被分割成若干個(gè)半小時(shí)。
這種“加速感”,幾乎貫穿了整個(gè)人形機(jī)器人產(chǎn)業(yè)。據(jù)高工機(jī)器人產(chǎn)業(yè)研究所統(tǒng)計(jì),2025年上半年,具身智能產(chǎn)業(yè)鏈上下游總計(jì)發(fā)生144次融資事件,融資金額達(dá)195億元,遠(yuǎn)超2024年全年。
11月15日,中國(guó)證監(jiān)會(huì)輔導(dǎo)驗(yàn)收公示顯示,宇樹(shù)科技已完成IPO上市輔導(dǎo),并正式具備境內(nèi)IPO申報(bào)資格,從7月7日簽署輔導(dǎo)協(xié)議至完成輔導(dǎo),歷時(shí)僅132天,創(chuàng)下年內(nèi)具身智能類企業(yè)輔導(dǎo)時(shí)間的最快紀(jì)錄。
業(yè)內(nèi)人士分析稱,若宇樹(shù)科技IPO順利推進(jìn),將成為近年來(lái)中國(guó)規(guī)模最大、關(guān)注度最高的本土科技企業(yè)上市項(xiàng)目之一。
以宇樹(shù)科技為代表的人形機(jī)器人產(chǎn)業(yè)資本化浪潮,促使許多媒體在相關(guān)報(bào)道中將2025年定義為“人形機(jī)器人商業(yè)化元年”或“具身智能機(jī)器人產(chǎn)業(yè)的量產(chǎn)元年”。
現(xiàn)實(shí)卻呈現(xiàn)兩種敘事:一邊是舞臺(tái)、展臺(tái)上的人形機(jī)器人頻秀“新招”,引發(fā)喝彩;另一邊,在具體的應(yīng)用場(chǎng)景中,它們?nèi)噪y以精準(zhǔn)“補(bǔ)位”。
宇樹(shù)科技此前披露的收入結(jié)構(gòu)顯示,2024年,四足機(jī)器人、人形機(jī)器人和組件產(chǎn)品的銷售額分別占約65%、30%和5%。其中,約80%的四足機(jī)器人被應(yīng)用于研究、教育和消費(fèi)領(lǐng)域,剩余的20%則被用于工業(yè)領(lǐng)域,如檢查與消防;人形機(jī)器人則完全用于研究、教育和消費(fèi)領(lǐng)域。
“年初,我們預(yù)測(cè)行業(yè)會(huì)從‘跳舞’轉(zhuǎn)向‘進(jìn)廠’,但現(xiàn)實(shí)是‘跳舞’的熱度不減反增。真正進(jìn)入工業(yè)場(chǎng)景落地的進(jìn)程,比我想象的要慢一點(diǎn)。不過(guò),我們也看到,工業(yè)制造、倉(cāng)儲(chǔ)物流、家庭康養(yǎng)等應(yīng)用場(chǎng)景對(duì)機(jī)器人的需求更加明確。”提起對(duì)2025年人形機(jī)器人產(chǎn)業(yè)的預(yù)期與現(xiàn)實(shí),帕西尼感知科技聯(lián)合創(chuàng)始人、CTO張恒第既有無(wú)奈又有期待。
“商業(yè)化”與“秀場(chǎng)”
2025年,能否被真正定義為“人形機(jī)器人商業(yè)化元年”或“具身智能機(jī)器人產(chǎn)業(yè)的量產(chǎn)元年”?
記者采訪獲悉,國(guó)內(nèi)某頭部公司年出貨量累計(jì)已達(dá)數(shù)千臺(tái),整個(gè)國(guó)內(nèi)市場(chǎng)年出貨量在1萬(wàn)臺(tái)至2萬(wàn)臺(tái)之間。
與傳統(tǒng)制造業(yè)相比,這一數(shù)字雖微不足道,卻標(biāo)志著一個(gè)從無(wú)到有的變化——人形機(jī)器人的基本技術(shù)障礙已被清除,產(chǎn)品能夠穩(wěn)定生產(chǎn)。
多位受訪者表示,若將“表演型場(chǎng)景”視為合理細(xì)分市場(chǎng),人形機(jī)器人確已實(shí)現(xiàn)初步量產(chǎn)交付;但若以“解決人的實(shí)際需求”為標(biāo)準(zhǔn),如進(jìn)入工廠流水線或提供家庭服務(wù),則仍存在明顯差距。目前,人形機(jī)器人產(chǎn)業(yè)仍處于從“秀場(chǎng)時(shí)刻”向“商業(yè)化落地”過(guò)渡的早期階段。
接連不斷的商業(yè)演示,會(huì)否加速人形機(jī)器人產(chǎn)業(yè)化的進(jìn)程?
速騰聚創(chuàng)市場(chǎng)部總監(jiān)謝闐地在接受上海證券報(bào)記者采訪時(shí)表示:“無(wú)論是奔跑還是疊衣,機(jī)器人技術(shù)在特定、結(jié)構(gòu)化的環(huán)境中已展示出令人印象深刻的任務(wù)能力,但如何應(yīng)對(duì)開(kāi)放環(huán)境、不同的操作對(duì)象,仍是業(yè)界普遍關(guān)注卻亟待解決的技術(shù)方向。”
一般而言,演示是技術(shù)可行性的驗(yàn)證,是吸引關(guān)注與資金的手段,但它與真正的商業(yè)化落地,并沒(méi)有直接的關(guān)系。
記者在采訪中了解到,真正的行業(yè)分水嶺或在2026年出現(xiàn)。屆時(shí),經(jīng)過(guò)幾年資本投入和研發(fā)周期,眾多公司到了需要“交作業(yè)”的時(shí)刻——即兌現(xiàn)融資時(shí)承諾的交付與市場(chǎng)驗(yàn)證。而能否在特定場(chǎng)景下實(shí)現(xiàn)價(jià)值閉環(huán),將成為真正的“試金石”。那些無(wú)法實(shí)現(xiàn)從“演示”到“小規(guī)模商用”跨越的企業(yè),或?qū)⒆钕缺惶蕴?/p>
瓶頸與期待
無(wú)論是年初因登上央視春晚而大火的宇樹(shù)科技,還是在全球首屆人形機(jī)器人半程馬拉松中因跑步平穩(wěn)、無(wú)需操作員跟隨而出圈的松延動(dòng)力,抑或是憑借“斧頭舞”引發(fā)關(guān)注的眾擎科技——這些公司都在不同方向上展現(xiàn)出中國(guó)機(jī)器人行業(yè)的活力與突破。
撇開(kāi)炫目的“整活”,聚焦到人形機(jī)器人的“干活”,一系列深層次的技術(shù)瓶頸正在浮出水面。
記者采訪了解到,在運(yùn)動(dòng)控制等硬件方面,國(guó)內(nèi)企業(yè)已能實(shí)現(xiàn)“85分”的水平,具備可用性與性價(jià)比。但在“大腦”——即感知、認(rèn)知與決策系統(tǒng)方面,仍面臨“數(shù)據(jù)稀缺、標(biāo)準(zhǔn)缺失、算法不成熟”三大挑戰(zhàn)。這也導(dǎo)致各家企業(yè)“各自為戰(zhàn)”。
“以行業(yè)中主要采用的依賴真人遙操采集數(shù)據(jù)為例,每人每天僅能采集幾百條,效率極低,相對(duì)于大模型所需的萬(wàn)億級(jí)數(shù)據(jù)量無(wú)異于杯水車薪。”田野說(shuō)。
“眼睛”的缺失,則導(dǎo)致機(jī)器人仍局限于二維圖像,不能感知現(xiàn)實(shí)更需要的三維世界。
謝闐地說(shuō):“人類可以在大腦中重演和重建現(xiàn)實(shí)環(huán)境和具體物體的互動(dòng),這對(duì)機(jī)器人來(lái)說(shuō)是很大的挑戰(zhàn):缺乏深度信息,機(jī)器人就無(wú)法理解‘墻在哪里’‘目標(biāo)距離多遠(yuǎn)’,自主行動(dòng)便無(wú)從談起。”
因此,上述瓶頸決定了現(xiàn)階段人形機(jī)器人仍是典型的to B產(chǎn)品,需要強(qiáng)大工程團(tuán)隊(duì)進(jìn)行集成、部署與維護(hù),只有擁有雄厚工程師力量的大型機(jī)構(gòu)才能率先應(yīng)用。
兆威集團(tuán)副總裁陳毅東認(rèn)為,行業(yè)在硬件穩(wěn)定性、數(shù)據(jù)準(zhǔn)確性及模型訓(xùn)練方面仍處初級(jí)階段,發(fā)展應(yīng)遵循“漏斗模型”,從技術(shù)能力上限出發(fā),逐步收斂至可實(shí)現(xiàn)的產(chǎn)品形態(tài),而非一開(kāi)始就追求高自由度或復(fù)雜交互。
在田野看來(lái),實(shí)現(xiàn)機(jī)器人的智能化突破需在三個(gè)維度上實(shí)現(xiàn)“泛化”:一是對(duì)任意物體的識(shí)別與操作能力;二是完成多樣化、非預(yù)設(shè)任務(wù)的能力;三是適配不同機(jī)器人硬件本體的能力。只有當(dāng)機(jī)器人在物體與任務(wù)層面實(shí)現(xiàn)一定程度的泛化,并顯著降低部署的邊際成本,才能稱得上真正意義上的商業(yè)化落地。
分歧與共識(shí)
未來(lái)3年至5年,人形機(jī)器人產(chǎn)業(yè)亟待解決的技術(shù)難點(diǎn)是什么?在采訪中,記者發(fā)現(xiàn),“數(shù)據(jù)采集”已經(jīng)成為受訪者的共識(shí)。
“幾乎可以確定,人形機(jī)器人產(chǎn)業(yè)的焦點(diǎn)將逐漸從運(yùn)動(dòng)能力顯著轉(zhuǎn)向操作能力和‘大腦’的構(gòu)建,這背后都需要依托有效的數(shù)據(jù)集。”田野說(shuō)。
面對(duì)瓶頸,業(yè)內(nèi)在破局路徑上出現(xiàn)了明顯的分化,不同的技術(shù)路線隨之而生。
與通常選擇VLA(視覺(jué)—語(yǔ)言—?jiǎng)幼鳎┞肪€不同,RoboScience選擇了VLOA(視覺(jué)—語(yǔ)言—物體—?jiǎng)幼鳎┑募軜?gòu),該架構(gòu)將任務(wù)拆解為“從視覺(jué)語(yǔ)言理解物體運(yùn)動(dòng)意圖”和“從物體狀態(tài)變化生成執(zhí)行動(dòng)作”兩個(gè)階段,以充分利用互聯(lián)網(wǎng)視頻數(shù)據(jù)與物理仿真環(huán)境,繞開(kāi)對(duì)單一真機(jī)數(shù)據(jù)源的依賴。“這很像嬰兒的成長(zhǎng)過(guò)程,先無(wú)意識(shí)地觸摸抓取,再學(xué)習(xí)任務(wù)意圖。”田野解釋道。
張恒第則分享了另一個(gè)視角:觸覺(jué)。在他看來(lái),沒(méi)有觸覺(jué)的機(jī)器人,是一個(gè)“信息殘缺”的系統(tǒng)。觸覺(jué)的引入,能使機(jī)器人從“精確預(yù)編程的執(zhí)行者”轉(zhuǎn)變?yōu)椤澳軌蛎髋c調(diào)整的探索者”。
為了解決具身智能數(shù)據(jù)缺失尤其是觸覺(jué)模態(tài)空白的問(wèn)題,帕西尼感知科技已經(jīng)建立擁有150個(gè)標(biāo)準(zhǔn)化采集單元的數(shù)據(jù)采集工廠,年產(chǎn)近2億條高質(zhì)量、全模態(tài)、標(biāo)準(zhǔn)化、高可用性的具身智能數(shù)據(jù)。“有了數(shù)據(jù)采集工廠的海量全模態(tài)數(shù)據(jù)支撐,帕西尼有望在一年內(nèi)實(shí)現(xiàn)特定場(chǎng)景的初步商業(yè)化。”張恒第說(shuō)。
除了數(shù)據(jù)采集,關(guān)于機(jī)器人終極形態(tài)的討論也不斷深化,核心議題逐漸聚焦于:如何讓機(jī)器人真正“像人”?
田野認(rèn)為,相較于“像人”,關(guān)鍵應(yīng)是如何確定人形機(jī)器人的功能性定義。真正意義上的“人形機(jī)器人”,應(yīng)是指能夠像人一樣處理事務(wù)、與物理世界進(jìn)行智能交互的機(jī)器。在這一點(diǎn)上,行業(yè)已經(jīng)形成共識(shí)。
反觀當(dāng)前的機(jī)器人,大多數(shù)仍是在高度結(jié)構(gòu)化的環(huán)境中,執(zhí)行預(yù)設(shè)程序的自動(dòng)化設(shè)備。它們?nèi)狈?duì)未知情境的理解與應(yīng)對(duì)能力,本質(zhì)上與傳統(tǒng)的工業(yè)機(jī)器人并無(wú)區(qū)別,只是外形發(fā)生了變化。
“只有當(dāng)機(jī)器人的‘靈魂’——即其決策與行為模式源于對(duì)人類行為數(shù)據(jù)的學(xué)習(xí),它才能真正融入為人設(shè)計(jì)的環(huán)境和工作。”張恒第說(shuō)。
可以預(yù)見(jiàn),2026年或?qū)⒊蔀槿诵螜C(jī)器人賽道一個(gè)關(guān)鍵分水嶺——泡沫會(huì)退潮,路線會(huì)收斂,最終能夠穿越周期、抵達(dá)彼岸的,將是那些理解場(chǎng)景、掌握數(shù)據(jù)、并能交付真實(shí)價(jià)值的企業(yè)。
高盛在《2025年全球機(jī)器人產(chǎn)業(yè)展望》中提到,當(dāng)前機(jī)器人賽道存在明顯的估值虛高現(xiàn)象,全球約有60%的機(jī)器人企業(yè)估值超出營(yíng)收100倍,且2025年全球機(jī)器人行業(yè)產(chǎn)能過(guò)剩率或達(dá)25%。
近期,人形機(jī)器人產(chǎn)業(yè)也不時(shí)傳來(lái)泡沫破裂的聲音,短期內(nèi)或帶給行業(yè)及投資人一些“尷尬”乃至“困惑”。技術(shù)進(jìn)步需要時(shí)間,場(chǎng)景應(yīng)用需要過(guò)程,這是發(fā)展的規(guī)律,也是留給這個(gè)新興行業(yè)重新思考、重新出發(fā)的時(shí)間。
人形機(jī)器人技術(shù)的未來(lái),也許并不是要打造一個(gè)完美的“人造人”,而是將它作為一種賦能手段,帶入千行百業(yè),重塑生產(chǎn)和服務(wù)的模式。這條路雖然比人們想象的要長(zhǎng),但每一步扎實(shí)的進(jìn)步,都在縮短與未來(lái)的距離。