大模型邁向“多模態(tài)”時(shí)代,“情緒化”成關(guān)鍵趨勢(shì) | 直擊2025GDC
原創(chuàng)
2025-02-21 19:57 星期五
科創(chuàng)板日?qǐng)?bào)記者 陳美
①未來語料行業(yè)的標(biāo)注和清洗,應(yīng)該有AI的身影,即通過AI技術(shù)實(shí)現(xiàn)語料標(biāo)注的自動(dòng)化與知識(shí)化。
②多模態(tài)大模型(如結(jié)合視覺、語音)將成為行業(yè)趨勢(shì),而多模態(tài)一直階躍星辰最重要的標(biāo)簽。
③語料數(shù)據(jù)的情緒化,是大模型發(fā)展的重要一步。

《科創(chuàng)板日?qǐng)?bào)》2月21日訊(記者 陳美)開年,隨著上海首個(gè)科技盛會(huì) ——“2025 全球開發(fā)者先鋒大會(huì)(GDC)” 的舉辦,一場(chǎng)關(guān)于技術(shù)是創(chuàng)新基石、應(yīng)用是實(shí)現(xiàn)落地的關(guān)鍵、發(fā)展需具備可持續(xù)性的思維碰撞在大會(huì)中激烈展開。

會(huì)上,AI產(chǎn)業(yè)鏈語料企業(yè)庫(kù)帕思CEO黃海清在接受《科創(chuàng)板日?qǐng)?bào)》記者采訪時(shí)表示,“隨著DeepSeek的崛起,基礎(chǔ)大模型公司們將重新資源分配,語料行業(yè)也需要在這場(chǎng)變革中自我更新,把成本降下來。”

作為專注于人工智能語料數(shù)據(jù)服務(wù)的公司,黃海清向《科創(chuàng)板日?qǐng)?bào)》記者介紹,庫(kù)帕思已經(jīng)為階躍星辰、商湯、MiniMax,以及上海人工智能實(shí)驗(yàn)室等提供高質(zhì)量的語料數(shù)據(jù)。

黃海清認(rèn)為,隨著行業(yè)的發(fā)展,現(xiàn)在是Data for AI,但未來則是AI for Data?!霸?AI 產(chǎn)業(yè)鏈中,算力、算法、算料是關(guān)鍵的三要素。在算力方面,需朝著具備 10 萬卡集群規(guī)模的方向演進(jìn);在算法方面,以 DeepSeek 為代表的基礎(chǔ)大模型公司已實(shí)現(xiàn)彎道超車,未來是否會(huì)再次被超越,值得期待;在算料方面,國(guó)內(nèi)人工智能應(yīng)用場(chǎng)景豐富,能夠帶動(dòng)高質(zhì)量算料的進(jìn)步與發(fā)展?!?/p>

對(duì)于語料產(chǎn)業(yè)發(fā)展的趨勢(shì),黃海清認(rèn)為,未來行業(yè)語料的標(biāo)注和清洗,應(yīng)該有AI的身影。“即通過AI技術(shù)實(shí)現(xiàn)語料標(biāo)注的自動(dòng)化與知識(shí)化,讓行業(yè)從勞動(dòng)力密集型變?yōu)橹R(shí)和技術(shù)型,最終減輕數(shù)據(jù)獲取成本高昂的問題?!?/p>

“同時(shí),高質(zhì)量的語料數(shù)據(jù)也應(yīng)該具有鮮活度、真實(shí)性、大樣本、完整性、多樣性、高知識(shí)密度的特點(diǎn)。目前,大模型在情緒理解和知識(shí)深度上的語料能力仍有不足,需通過高質(zhì)量語料和算法優(yōu)化改進(jìn)?!?黃海清說道,鑒于當(dāng)前大模型發(fā)展現(xiàn)狀,未來多模態(tài)大模型(如結(jié)合視覺、語音)必將成為行業(yè)趨勢(shì),進(jìn)一步推動(dòng) AI 貼近人類的需求。

在此背景下,《科創(chuàng)板日?qǐng)?bào)》記者注意到,上海本地的頭部大模型公司——階躍星辰開源了兩款階躍 Step 系列多模態(tài)大模型——Step-Video-T2V 視頻生成模型和 Step-Audio 語音模型。

階躍星辰副總裁李璟表示,“多模態(tài)一直階躍星辰最重要的標(biāo)簽。而之所以擁抱開源,是因?yàn)橄嘈偶夹g(shù)社區(qū)的力量,希望吸引更多‘智慧’,優(yōu)化、改進(jìn)大模型。同時(shí),構(gòu)建強(qiáng)大的生態(tài)?!?/p>

根據(jù)企業(yè)官方技術(shù)報(bào)告中的評(píng)測(cè)結(jié)果,階躍 Step-Video-T2V 的參數(shù)量和模型性能目前在全球開源視頻生成領(lǐng)域都處于領(lǐng)先水平。而階躍 Step-Audio方面,據(jù)介紹,這是業(yè)內(nèi)首款產(chǎn)品級(jí)的開源語音交互模型,目前已在躍問 App 內(nèi)開放用戶體驗(yàn)。

李璟表示,階躍 Step-Audio最大的特點(diǎn),是能夠根據(jù)不同的場(chǎng)景需求生成情緒、方言、語種、歌聲和個(gè)性化風(fēng)格的表達(dá),能和用戶自然地進(jìn)行高質(zhì)量對(duì)話?!氨热?,當(dāng)用戶面臨各種人生問題,它都可以像好朋友一樣提供貼心陪伴并出主意,體現(xiàn)出‘熟知人情世故’等、情商高特點(diǎn)?!崩瞽Z談到。

庫(kù)帕思CEO黃海清也認(rèn)為,語料數(shù)據(jù)的情緒化,是大模型發(fā)展的重要一步。“沒有‘情緒’就意味著沒有人類共性和人情味,大模型仍是冷冰冰的機(jī)器;有‘情緒’的大模型,則代表了‘有趣’的靈魂,可以讓AI成為人類更好的Agent?!?/p>

收藏
126.46W
我要評(píng)論
歡迎您發(fā)表有價(jià)值的評(píng)論,發(fā)布廣告和不和諧的評(píng)論都將會(huì)被刪除,您的賬號(hào)將禁止評(píng)論。
發(fā)表評(píng)論
要聞
股市
關(guān)聯(lián)話題