當(dāng)資本重新聚焦人形機(jī)器人,具身智能迎來高度關(guān)注時(shí),行業(yè)內(nèi)部卻呈現(xiàn)“兩極心態(tài)”。
星動(dòng)紀(jì)元等企業(yè)訂單破5億、海外業(yè)務(wù)占比達(dá)50%,跑出高速增長(zhǎng)曲線;而科研與產(chǎn)業(yè)界則反復(fù)強(qiáng)調(diào)泛化不足、落地成本高、數(shù)據(jù)匱乏等現(xiàn)實(shí)桎梏,甚至擔(dān)憂炒概念引發(fā)行業(yè)泡沫。
近日,10億元的A+輪融資,讓星動(dòng)紀(jì)元及其背后的“模型—本體—場(chǎng)景數(shù)據(jù)”飛輪成為具身智能賽道的焦點(diǎn)。
同時(shí),一個(gè)尖銳的問題隨之浮現(xiàn),具身智能距離“ChatGPT時(shí)刻”還有多遠(yuǎn)?是等待單點(diǎn)爆發(fā)拐點(diǎn),還是走向漫長(zhǎng)分布式突破?在資本、場(chǎng)景與工程技術(shù)作用下,具身智能產(chǎn)業(yè)正站在復(fù)雜轉(zhuǎn)折點(diǎn)。
從“會(huì)執(zhí)行”到“會(huì)想象”,
星動(dòng)紀(jì)元跑出加速度
近日,星動(dòng)紀(jì)元完成近10億元A+輪融資,吉利資本領(lǐng)投,北汽產(chǎn)投跟投,北京市相關(guān)產(chǎn)業(yè)投資基金聯(lián)合注資。這輪融資不僅是資金增加,更明確了資本押注方向:“軟硬一體自研”“具身智能+產(chǎn)業(yè)協(xié)同”“模型工程化能力”。
自大模型進(jìn)入商業(yè)化敏感周期后,資本愈發(fā)關(guān)注AI企業(yè)工程落地能力,模型參數(shù)與訓(xùn)練數(shù)據(jù)量逐漸讓位于可復(fù)用場(chǎng)景與可規(guī)模交付的解決方案。
星動(dòng)紀(jì)元堅(jiān)持“具身大腦+人形本體”全棧自研路線,其具身大模型ERA - 42與人形本體平臺(tái)耦合,不僅能高精度控制全尺寸雙足人形機(jī)器人、五指靈巧手,還支撐多場(chǎng)景任務(wù),在“端到端具身智能”全球競(jìng)賽中,與Figure Helix、Tesla Grok和NVIDIA GR00T并列。
更關(guān)鍵的是,它構(gòu)建了物理世界 AI“模型-本體-場(chǎng)景數(shù)據(jù)”的正向循環(huán)飛輪,這被投資機(jī)構(gòu)視為更具確定性的壁壘。資本重新定價(jià)具身智能,正是基于這種“從算法到工程”的認(rèn)知轉(zhuǎn)變。
而且,世界模型是近一年來具身智能技術(shù)鏈條中的關(guān)注焦點(diǎn),其核心價(jià)值在于讓機(jī)器人在進(jìn)入真實(shí)場(chǎng)景前,能在“想象空間”預(yù)演任務(wù)、評(píng)估策略、自我迭代。
比如,今年10月,清華陳建宇團(tuán)隊(duì)與斯坦福Chelsea Finn團(tuán)隊(duì)提出的可控生成世界模型Ctrl - World,使得機(jī)器人在陌生場(chǎng)景任務(wù)成功率提升44.7%,被視為具身智能“從可控到泛化”的關(guān)鍵突破。
而ERA - 42的迭代也與世界模型深度綁定,借助多模態(tài)感知與場(chǎng)景數(shù)據(jù)積累,實(shí)現(xiàn)穩(wěn)定視覺-語言-動(dòng)作(VLA)聯(lián)動(dòng),完成多種任務(wù)。
過去機(jī)器人“會(huì)執(zhí)行”,如今世界模型讓它們開始“會(huì)想象”,這是具身智能跨越“專家系統(tǒng)式定制開發(fā)”走向“泛化智能”的分水嶺。不過,這種進(jìn)化仍局限于特定場(chǎng)景,距通用具身智能還有一段距離。
具身智能的未來:
不是等待拐點(diǎn),而是沿途開花
相比模型討論,星動(dòng)紀(jì)元的商業(yè)化速度也頗受產(chǎn)業(yè)關(guān)注。2025年,公司總訂單額破5億元,物流行業(yè)最大單筆訂單近五千萬元,與吉利、雷諾等眾多企業(yè)深度合作,讓具身智能走出實(shí)驗(yàn)室,進(jìn)入產(chǎn)業(yè)真實(shí)工位。
更具指標(biāo)意義的是海外業(yè)務(wù),占比達(dá)50%。全球市值前十科技巨頭中九家是其客戶,海外覆蓋多地核心市場(chǎng),還進(jìn)入多所頂尖機(jī)構(gòu),成為其具身智能開發(fā)主要平臺(tái)之一。
這種布局打破國(guó)內(nèi)企業(yè)只能做低端落地場(chǎng)景的刻板印象,使其成為少數(shù)兼顧前沿研究與產(chǎn)業(yè)應(yīng)用的中國(guó)機(jī)器人公司。
但商業(yè)化越快,挑戰(zhàn)越大,需驗(yàn)證模型泛化能力、降低硬件成本、提升供應(yīng)鏈穩(wěn)定性,產(chǎn)業(yè)化依然是一場(chǎng)壓力測(cè)試。
“人形機(jī)器人的ChatGPT時(shí)刻何時(shí)到來”這一拷問也隨之而來。
樂觀派認(rèn)為具身智能商業(yè)化已經(jīng)走上軌道。雖然現(xiàn)階段泛化不足,但這是必然過程,從語言大模型發(fā)展路徑看,具身智能演進(jìn)邏輯類似,隨著世界模型、VLA和控制策略迭代,機(jī)器人進(jìn)入大量真實(shí)場(chǎng)景只是時(shí)間問題。
務(wù)實(shí)派則從產(chǎn)業(yè)視角指出,過去十年機(jī)器人滲透率低,是因?yàn)檫M(jìn)入新場(chǎng)景的二次開發(fā)成本高昂。具身智能價(jià)值在于讓機(jī)器人具備場(chǎng)景遷移能力,即變得更便宜、更快、更普適。
也有人認(rèn)為具身智能不會(huì)出現(xiàn)類似ChatGPT的單點(diǎn)爆發(fā),突破將呈分布式、漸進(jìn)式,由大量“真實(shí)工位”推動(dòng),而非某個(gè)模型發(fā)布激活。
這是因?yàn)?,?dāng)前主流VLA架構(gòu)受限于“信息流與控制流強(qiáng)耦合”,在非標(biāo)場(chǎng)景難穩(wěn)定,且真實(shí)數(shù)據(jù)獲取有阻力,數(shù)據(jù)閉環(huán)不易。
因此,先做“場(chǎng)景通用”,從缺工、危險(xiǎn)、高成本工位切入,以點(diǎn)帶面,再沉淀高價(jià)值數(shù)據(jù)與工藝know - how,這是更務(wù)實(shí)的產(chǎn)業(yè)路徑,即不等待拐點(diǎn),而是提前沿途開花。
結(jié)語
具身智能能否迎來“ChatGPT時(shí)刻”?答案或許不是“會(huì)與不會(huì)”,而是什么樣的方式。
語言智能爆發(fā)源于純數(shù)字世界規(guī)則演化,具身智能臨界點(diǎn)則來自千百個(gè)真實(shí)工位的反復(fù)驗(yàn)證與數(shù)據(jù)積累,它不是模型參數(shù)或發(fā)布會(huì)節(jié)點(diǎn),而是長(zhǎng)期累積的拐點(diǎn)。
具身智能的真正突破將以更慢、更深、更有韌性的方式發(fā)生,待到來時(shí),人們或許會(huì)發(fā)現(xiàn)“ChatGPT時(shí)刻”早已在無數(shù)不起眼場(chǎng)景中悄然鋪開。