對(duì)話天娛數(shù)科首席數(shù)據(jù)官吳邦毅:AGI從桌面邁入工業(yè)應(yīng)用,深挖3D空間智能是關(guān)鍵
原創(chuàng)
2024-08-29 14:23 星期四
財(cái)聯(lián)社記者 崔銘
①在人工智能從技術(shù)探索轉(zhuǎn)向技術(shù)應(yīng)用趨勢(shì)下,空間智能作為一種融合了多模態(tài)大模型、虛擬現(xiàn)實(shí)等前沿技術(shù)的新方向,展現(xiàn)出了巨大潛力。
②天娛數(shù)科首席數(shù)據(jù)官吳邦毅表示,人工智能下一個(gè)階段是實(shí)現(xiàn)AGI,而AGI釋放的更大生產(chǎn)力蘊(yùn)含在制造領(lǐng)域,發(fā)展空間智能是讓AGI從桌面邁入工業(yè)應(yīng)用的關(guān)鍵。

財(cái)聯(lián)社8月29日訊(記者 崔銘)人工智能的演進(jìn)正從初期的技術(shù)探索階段,轉(zhuǎn)向技術(shù)應(yīng)用階段。在此趨勢(shì)下,空間智能作為一種融合了多模態(tài)大模型、虛擬現(xiàn)實(shí)等前沿技術(shù)的新方向,展現(xiàn)出了巨大的潛力和商業(yè)價(jià)值。

2024深圳(國(guó)際)通用人工智能大會(huì)期間,天娛數(shù)科首席數(shù)據(jù)官吳邦毅在接受財(cái)聯(lián)社記者專訪時(shí)表示,人工智能下一個(gè)階段是實(shí)現(xiàn)通用人工智能(AGI),而AGI釋放的更大生產(chǎn)力蘊(yùn)含在制造領(lǐng)域,發(fā)展空間智能是讓AGI從桌面邁入工業(yè)應(yīng)用的關(guān)鍵。

以下是訪談實(shí)錄(有刪改):

財(cái)聯(lián)社:隨著AI技術(shù)的廣泛應(yīng)用,您認(rèn)為人工智能發(fā)展的下一個(gè)階段會(huì)是什么?

吳邦毅:人工智能正處在一個(gè)快速發(fā)展和廣泛應(yīng)用的階段,同時(shí)也在積極探索實(shí)現(xiàn)更高級(jí)別的通用智能的可能性。我們對(duì)人工智能下一階段的普遍共識(shí)是實(shí)現(xiàn)AGI。那時(shí),AI的認(rèn)知、理解、驅(qū)動(dòng)、決策能力可以與人類匹敵甚至超越人類。然而,目前AGI主要集中在內(nèi)容創(chuàng)作、客服、編程等桌面應(yīng)用,在工業(yè)領(lǐng)域應(yīng)用可以說(shuō)鳳毛麟角。

我們判斷人工智能下一階段的發(fā)展機(jī)遇,蘊(yùn)含在新型工業(yè)化變革中,AGI釋放的更大生產(chǎn)力蘊(yùn)含在制造領(lǐng)域。

財(cái)聯(lián)社:相對(duì)于AGI桌面應(yīng)用,為什么工業(yè)應(yīng)用會(huì)比較匱乏?如何彌合工業(yè)場(chǎng)景應(yīng)用存在的空間計(jì)算鴻溝?

吳邦毅:人工智能在工業(yè)場(chǎng)景應(yīng)用匱乏的本質(zhì)原因在于工業(yè)場(chǎng)景是3D空間,而目前絕大部分大模型為語(yǔ)言、圖形、視頻等2D模型,在工業(yè)場(chǎng)景應(yīng)用時(shí)存在空間計(jì)算鴻溝。 相較于2D智能,3D空間智能在理解真實(shí)世界方面具備更全面的感知、理解、交互與決策能力,重新定義人、機(jī)器與真實(shí)世界、虛擬世界之間的關(guān)系,擁有更強(qiáng)的泛化能力和涌現(xiàn)特性。

一方面,通過(guò)3D數(shù)據(jù)捕捉深度信息,它能讓AI對(duì)物理世界人與物的形態(tài)、結(jié)構(gòu)和位置有更準(zhǔn)確的理解,從而生成更具真實(shí)感的場(chǎng)景,提供更直觀的可視化效果,讓虛擬世界更真實(shí);另一方面,空間智能可以在三維場(chǎng)景中像人類一樣對(duì)視覺(jué)信息進(jìn)行高級(jí)推理,超越二維視覺(jué)的局限,讓真實(shí)世界更智能,將為多個(gè)產(chǎn)業(yè)特別是具身智能、智能制造、低空經(jīng)濟(jì)等產(chǎn)業(yè)帶來(lái)顛覆式的變革。

因此,發(fā)展空間智能是讓AGI從桌面邁入工業(yè)應(yīng)用的關(guān)鍵。

財(cái)聯(lián)社:可以詳細(xì)說(shuō)說(shuō)在具身智能、智能制造、低空經(jīng)濟(jì)等產(chǎn)業(yè),3D空間智能將如何與產(chǎn)業(yè)結(jié)合?

吳邦毅:如果說(shuō)空間智能是讓AGI從桌面邁入工業(yè)應(yīng)用的關(guān)鍵,那么3D大模型則是發(fā)展空間智能的關(guān)鍵。

3D大模型為空間智能提供了多模態(tài)數(shù)據(jù)融合、空間計(jì)算、復(fù)雜場(chǎng)景處理、交互性增強(qiáng)、3D生成式AI等多方面的支持,是推動(dòng)空間智能技術(shù)發(fā)展的關(guān)鍵。

在具身智能、人形機(jī)器人領(lǐng)域,將3D多模態(tài)大模型與機(jī)器人技術(shù)相結(jié)合,使機(jī)器人不但具備理解、記憶、推理等認(rèn)知水平,還能認(rèn)識(shí)和理解真實(shí)的3D物理世界,在作業(yè)場(chǎng)景中具備自主決策、行動(dòng)與操作能力。

在智能制造領(lǐng)域,將3D大模型與人、機(jī)、物、環(huán)境的多源異構(gòu)3D數(shù)據(jù)相結(jié)合,對(duì)整個(gè)生產(chǎn)環(huán)節(jié)進(jìn)行3D重構(gòu),精確分析、交叉比對(duì)、識(shí)別瓶頸、輔助管理決策,提高生產(chǎn)制造、倉(cāng)儲(chǔ)物流的效率,降低成本,助力產(chǎn)業(yè)升級(jí)和模式創(chuàng)新。

在低空經(jīng)濟(jì)領(lǐng)域,將3D大模型與飛行器技術(shù)相結(jié)合,使飛行器在飛行活動(dòng)中可以智能感知和識(shí)別、自主導(dǎo)航和避障,再通過(guò)對(duì)低空空域自然環(huán)境、飛行活動(dòng)、基礎(chǔ)設(shè)施等進(jìn)行3D重構(gòu),構(gòu)建空間智能系統(tǒng),破解低空管理中感知能力弱、智能化程度低、應(yīng)用成本高等難題。

財(cái)聯(lián)社:天娛數(shù)科在構(gòu)筑空間智能的領(lǐng)域有哪些嘗試和布局?目前進(jìn)展如何?

吳邦毅:到目前為止,天娛數(shù)科布局空間智能領(lǐng)域已有3年多的時(shí)間,從最開(kāi)始入局時(shí)的AI數(shù)字人,到如今的3D大模型、空間智能MaaS平臺(tái),我們穩(wěn)步推進(jìn)著空間智能技術(shù)和應(yīng)用場(chǎng)景的創(chuàng)新。

公司融合智者千問(wèn)大模型與3D數(shù)據(jù)集、可視算法,構(gòu)建了空間智能MaaS平臺(tái),實(shí)現(xiàn)了跨類型數(shù)據(jù)的智能解析。通過(guò)“1+1+N”模式,構(gòu)建了1個(gè)全國(guó)最大規(guī)模的高質(zhì)量3D數(shù)據(jù)集,開(kāi)發(fā)了1個(gè)國(guó)產(chǎn)高性能3D空間智能大模型,通過(guò)DaaS、MaaS模式實(shí)現(xiàn)在具身智能、人形機(jī)器人、智能制造、低空經(jīng)濟(jì)等N個(gè)場(chǎng)景的應(yīng)用。

MaaS平臺(tái)匯聚兩大核心功能,一是AI+3D可視化功能,可為多元產(chǎn)業(yè)提供XR虛擬場(chǎng)景、游戲開(kāi)發(fā)、AI客服、智能數(shù)字人等多種數(shù)智產(chǎn)品與服務(wù),目前已廣泛應(yīng)用與文旅、展會(huì)、金融、教育、影視、游戲等行業(yè);二是AI+3D數(shù)據(jù)集功能,可為企業(yè)提供垂類模型訓(xùn)練、數(shù)據(jù)智算、具身智能等AI數(shù)據(jù)服務(wù)。

目前,空間智能MaaS平臺(tái)已為中國(guó)日?qǐng)?bào)、內(nèi)蒙古阿拉善電視臺(tái)、云南農(nóng)職院、五芳齋、天河城、楊國(guó)福、華潤(rùn)雪花等多家企業(yè)客戶提供了3D虛擬場(chǎng)景、AI數(shù)字人智能交互服務(wù)。

財(cái)聯(lián)社:要實(shí)現(xiàn)3D空間智能在工業(yè)領(lǐng)域的廣泛應(yīng)用還面臨哪些挑戰(zhàn)?天娛數(shù)科有哪些應(yīng)對(duì)方案?

吳邦毅:首先要強(qiáng)調(diào)的是,3D多模態(tài)大模型極端依賴大規(guī)模、高質(zhì)量的3D數(shù)據(jù)訓(xùn)練,3D數(shù)據(jù)集對(duì)于提供真實(shí)人物、場(chǎng)景的展示、豐富的交互體驗(yàn)和決策支持至關(guān)重要。

但當(dāng)前,3D數(shù)據(jù)集在質(zhì)量和數(shù)量上都面臨著一些挑戰(zhàn),高質(zhì)量3D數(shù)據(jù)集匱乏是產(chǎn)業(yè)痛點(diǎn),全球范圍內(nèi),3D數(shù)據(jù)都處于極端重要,又極端缺乏的狀態(tài)。

其次,3D數(shù)據(jù)的獲取和處理成本相對(duì)較高,涉及到高端設(shè)備如深度相機(jī)的數(shù)據(jù)采集,以及繁瑣的數(shù)據(jù)處理工作。這不僅需要大量的時(shí)間、人力和資金投入。而且,3D數(shù)據(jù)的標(biāo)準(zhǔn)化程度低,導(dǎo)致數(shù)據(jù)的兼容性較差,共享和復(fù)用難度大,也對(duì)空間智能技術(shù)的發(fā)展形成了掣肘。

3D數(shù)據(jù)集正在成為競(jìng)爭(zhēng)的核心節(jié)點(diǎn),在可見(jiàn)的未來(lái),它決定3D多模態(tài)大模型和空間智能的發(fā)展,以及全球科技競(jìng)爭(zhēng)的走勢(shì)。

我們已經(jīng)在數(shù)據(jù)的采、存、管、研、用各個(gè)階段形成了一體化解決方案??臻g智能MaaS平臺(tái)通過(guò)收集多樣化的數(shù)據(jù)類型,利用LightStage超高精度光場(chǎng)掃描、手持深度攝像頭等先進(jìn)設(shè)備,捕捉詳盡的三維數(shù)據(jù)。

與此同時(shí),平臺(tái)還運(yùn)用了NeRF、3D高斯等前沿技術(shù),從掃描數(shù)據(jù)、視頻、圖像乃至文字中生成高質(zhì)量的3D模型,使虛擬場(chǎng)景和物體更加逼真。這些數(shù)據(jù)與圖像、文本等其他模態(tài)信息相互融合,形成了全方位、多維度的數(shù)據(jù)集。

目前,平臺(tái)已擁有超80萬(wàn)組3D數(shù)據(jù)、35萬(wàn)組多模態(tài)數(shù)據(jù),建立了海量的數(shù)據(jù)資源優(yōu)勢(shì)。

收藏
48.45W
我要評(píng)論
歡迎您發(fā)表有價(jià)值的評(píng)論,發(fā)布廣告和不和諧的評(píng)論都將會(huì)被刪除,您的賬號(hào)將禁止評(píng)論。
發(fā)表評(píng)論
要聞
股市
關(guān)聯(lián)話題
4.16W 人關(guān)注
2.71W 人關(guān)注
8701 人關(guān)注