①高盛分析師:人形機(jī)器人技術(shù)拐點(diǎn)仍不明朗,宇樹(shù)科技機(jī)器人硬件表現(xiàn)穩(wěn)健,但仍未準(zhǔn)備好履行功能型任務(wù); ②目前的人形機(jī)器人仍停留在“大玩具”階段; ③工業(yè)可能是最先落地場(chǎng)景,家用機(jī)器人道阻且長(zhǎng)。
《科創(chuàng)板日?qǐng)?bào)》2月28日訊(編輯 宋子喬) 2月28日早盤(pán),機(jī)器人板塊走低,截至午間收盤(pán),中大力德跌停,埃夫特、三豐智能跌超10%,鳴志電器、綠的諧波、兆威機(jī)電、豐立智能、步科股份、埃斯頓、拓斯達(dá)等跌超7%。
消息面上,高盛杜茜團(tuán)隊(duì)于2月27日發(fā)布研報(bào)稱(chēng),人形機(jī)器人技術(shù)拐點(diǎn)仍不明朗,宇樹(shù)科技機(jī)器人硬件表現(xiàn)穩(wěn)健,但仍未準(zhǔn)備好履行功能型任務(wù),給正熱的機(jī)器人板塊澆了一盆冷水。
研報(bào)稱(chēng),宇樹(shù)人形機(jī)器人H1只有19個(gè)自由度,因此仍然無(wú)法處理復(fù)雜而精細(xì)的任務(wù)。關(guān)于商業(yè)化進(jìn)展,宇樹(shù)科技表示,未來(lái)2-3年人形機(jī)器人難以達(dá)到與人類(lèi)工人相同的效率,但5-10年后可能會(huì)出現(xiàn)具有實(shí)際意義的應(yīng)用。該公司目前的人形機(jī)器人出貨量為幾百臺(tái),滿足了大學(xué)實(shí)驗(yàn)室研發(fā)以及機(jī)器人數(shù)據(jù)采集和訓(xùn)練的需求。
高盛預(yù)計(jì),到2027/2032年全球人形機(jī)器人出貨量為7.6萬(wàn)/50.2萬(wàn)臺(tái),步伐慢于市場(chǎng)預(yù)期,需要更長(zhǎng)時(shí)間才能迎來(lái)由AI賦能的機(jī)器人。
另?yè)?jù)公開(kāi)報(bào)道,摩根士丹利在2月17日至21日期間,對(duì)中國(guó)自動(dòng)化和人形機(jī)器人產(chǎn)業(yè)鏈進(jìn)行了深入調(diào)研,走訪了包括螺絲、減速器、電機(jī)、傳感器等在內(nèi)的多家企業(yè),其調(diào)研報(bào)告稱(chēng),盡管在和運(yùn)動(dòng)控制方面進(jìn)展迅速,但要實(shí)現(xiàn)人形機(jī)器人的實(shí)際應(yīng)用仍需算法和硬件的持續(xù)改進(jìn)。
大摩稱(chēng),盡管有許多組件供應(yīng)商聲稱(chēng)他們已經(jīng)開(kāi)發(fā)并將產(chǎn)品發(fā)送給集成商(包括特斯拉)進(jìn)行測(cè)試,但產(chǎn)能建設(shè)(設(shè)備和經(jīng)驗(yàn)豐富的技術(shù)人員/工人)、產(chǎn)能提升(精密加工、產(chǎn)品一致性)在最初幾年都非常具有挑戰(zhàn)性,影響效率、產(chǎn)量和成本。
當(dāng)下人形機(jī)器人的代表產(chǎn)品處于哪一階段?
宇樹(shù)科技的人形機(jī)器人G1已經(jīng)對(duì)外出售,從第一批嘗鮮者發(fā)出的視頻來(lái)看,目前的人形機(jī)器人仍停留在“大玩具”階段,對(duì)跳舞、逛街、遛狗(機(jī)器狗)等單一任務(wù)手到擒來(lái),但沒(méi)有展現(xiàn)更實(shí)用的應(yīng)用價(jià)值,并不能處理做家務(wù)這類(lèi)更精細(xì)、更復(fù)雜的任務(wù)。
小鵬汽車(chē)CEO何小鵬近日在小鵬X9海外發(fā)運(yùn)儀式上,被問(wèn)及小鵬人形機(jī)器人的進(jìn)展時(shí)便表示,今天行業(yè)里基本上所有的機(jī)器人都處于L2階段。
能干活的人形機(jī)器人離我們還有多遠(yuǎn)?最先落地場(chǎng)景是什么?
宇樹(shù)科技創(chuàng)始人王興興近期在接受央視采訪時(shí)提到,“個(gè)人感覺(jué)在今年年底之前,整個(gè)AI的人形機(jī)器人會(huì)達(dá)到一個(gè)新的量級(jí)。如果順利的話,到明年或者后年,一些基礎(chǔ)的,比如說(shuō)服務(wù)業(yè)或者一些工業(yè)其實(shí)基本可以推起來(lái)了,但家用可能會(huì)稍微慢一點(diǎn),因?yàn)榧矣每赡軐?duì)安全性的要求更高,還是會(huì)需要技術(shù)相對(duì)更成熟一點(diǎn)點(diǎn)?!?/p>
從技術(shù)上看,數(shù)據(jù)匱乏扼住了通用機(jī)器人的脖頸。東吳證券詳細(xì)解析了訓(xùn)練出好用的端到端大模型的難點(diǎn)——數(shù)據(jù)瓶頸,目前:
1)數(shù)據(jù)量差距巨大:相較于VLM大模型億條級(jí)別的數(shù)據(jù)量,目前機(jī)器人實(shí)際單一場(chǎng)景的訓(xùn)練數(shù)據(jù)量?jī)H僅在千條和萬(wàn)條級(jí)別,差距百倍。
2)機(jī)器人數(shù)據(jù)獲取難度極高:相較于互聯(lián)網(wǎng)上常見(jiàn)的語(yǔ)料供VLM大模型訓(xùn)練,機(jī)器人訓(xùn)練數(shù)據(jù)獲取難度極高。目前有三種數(shù)據(jù)獲取模式:①真實(shí)數(shù)據(jù)遙操采集:?jiǎn)栴}在于成本極高,目前動(dòng)捕設(shè)備一套價(jià)格在幾十萬(wàn)區(qū)間,初創(chuàng)企業(yè)如果要靠動(dòng)捕設(shè)備遙操采集數(shù)據(jù),成本非常高;②虛擬生成數(shù)據(jù):例如銀河通用發(fā)布的GraspVLA,通過(guò)虛擬仿真技術(shù)生成數(shù)據(jù),用于機(jī)器人訓(xùn)練,但目前難以解決sim-to-real gap。簡(jiǎn)單來(lái)說(shuō),就是用虛擬仿真數(shù)據(jù)訓(xùn)練機(jī)器人效果很差,如果是簡(jiǎn)單的抓放搬運(yùn)場(chǎng)景,虛擬數(shù)據(jù)相對(duì)可行,但如果涉及到柔性場(chǎng)景,比如說(shuō)衣服被子等柔性物體,就很難運(yùn)用。因?yàn)樯婕暗饺嵝晕矬w形變仿真,在物理層面本身就很難建模;③真人數(shù)據(jù)映射:UMI和DexCap(斯坦福機(jī)器人團(tuán)隊(duì))等正在探索真人數(shù)據(jù)映射(即采集真實(shí)人的數(shù)據(jù),通過(guò)某種映射關(guān)系轉(zhuǎn)化為機(jī)器人數(shù)據(jù)),但目前還比較早期。
3)遙操采集的數(shù)據(jù)本身存在毒性:①人在運(yùn)動(dòng)過(guò)程中會(huì)有額外的運(yùn)動(dòng)軌跡:例如簡(jiǎn)單的搬箱子,人在遙操錄制過(guò)程中,可能會(huì)因?yàn)橥饨绺蓴_停頓幾秒,但這個(gè)停頓對(duì)于機(jī)器人來(lái)說(shuō)就存在毒性,因?yàn)槠錈o(wú)法理解人為什么要停頓;②人的運(yùn)動(dòng)軌跡和機(jī)器人不一致:目前市面上大量機(jī)器人都是以旋轉(zhuǎn)關(guān)節(jié)為主,而人的上下肢是直線關(guān)節(jié),因此同樣是搬箱子的動(dòng)作,人和機(jī)器人的運(yùn)動(dòng)軌跡就是不一致的,這時(shí)候用真人的數(shù)據(jù)去訓(xùn)練機(jī)器人本身就存在毒性。
4)機(jī)器人本體方案未收斂導(dǎo)致數(shù)據(jù)難以復(fù)用:例如用特斯拉本體采集的數(shù)據(jù)很難給智元的機(jī)器人來(lái)訓(xùn)練,因?yàn)楸倔w方案不同。
該機(jī)構(gòu)表示,真實(shí)的情況是,業(yè)界目前還無(wú)法解決上述數(shù)據(jù)端的問(wèn)題。但目前各家都選擇在自己的方案上努力收集數(shù)據(jù),先在單一場(chǎng)景下實(shí)現(xiàn)一定程度的泛化,從而讓更多人形機(jī)器人投入實(shí)際運(yùn)用。該機(jī)構(gòu)認(rèn)為可能是3-5年后,當(dāng)市場(chǎng)上有足夠多的人形機(jī)器人數(shù)據(jù),并且硬件方案逐步收斂,具身智能基礎(chǔ)模型呈現(xiàn)出一定的智能涌現(xiàn),才有可能實(shí)現(xiàn)真正的端到端具身智能大模型。
