生數(shù)科技CEO唐家渝:多模態(tài)大模型將催生全新體驗?zāi)J降某墤?yīng)用
原創(chuàng)
2024-01-08 12:32 星期一
科創(chuàng)板日報記者 黃心怡
多模態(tài)大模型能夠更全面可靠地學(xué)習(xí)和理解復(fù)雜的信息輸入,同時能夠從文本、聲音、視覺等角度提供更豐富多維的信息輸出。多模態(tài)大模型在藝術(shù)、設(shè)計、娛樂、教育等多個領(lǐng)域都已展示了其巨大的應(yīng)用潛力,伴隨著底層技術(shù)的持續(xù)發(fā)展,也必將催生全新體驗?zāi)J降某墤?yīng)用。

《科創(chuàng)板日報》1月8日訊(記者 黃心怡) ChatGPT的橫空出世,帶來2023年全球大模型熱潮。在2024年新年之際,財聯(lián)社、《科創(chuàng)板日報》聯(lián)合上海市人工智能行業(yè)協(xié)會,邀請人工智能領(lǐng)軍者與行業(yè)精英推出“2024·AI領(lǐng)先者心聲”系列報道,回顧過去的一年,展望新的一年AI大模型發(fā)展的機遇與挑戰(zhàn)。

生數(shù)科技CEO唐家渝向《科創(chuàng)板日報》表示:

從GPT-4V的搶眼亮相,到年底Gemini的火爆出圈,大模型正從單模態(tài)智能向多模態(tài)融合發(fā)展。

圍繞“聽、說、讀、寫、看”等諸多方面模擬和接近人類的智能化能力,多模態(tài)大模型能夠更全面可靠地學(xué)習(xí)和理解復(fù)雜的信息輸入,同時能夠從文本、聲音、視覺等角度提供更豐富多維的信息輸出,使人機交互更加友好和直觀,貼近人類自然的習(xí)慣。

image

唐家渝“2024·AI領(lǐng)先者心聲”全文如下:

從GPT-4V的搶眼亮相,到年底Gemini的火爆出圈,大模型正從單模態(tài)智能向多模態(tài)融合發(fā)展。

我們堅信,多模態(tài)大模型將是未來生成式AI的必要發(fā)展趨勢。圍繞“聽、說、讀、寫、看”等諸多方面模擬和接近人類的智能化能力,多模態(tài)大模型能夠更全面可靠地學(xué)習(xí)和理解復(fù)雜的信息輸入,同時能夠從文本、聲音、視覺等角度提供更豐富多維的信息輸出,使人機交互更加友好和直觀,貼近人類自然的習(xí)慣。

目前,多模態(tài)大模型在藝術(shù)、設(shè)計、娛樂、教育等多個領(lǐng)域都已展示了其巨大的應(yīng)用潛力,伴隨著底層技術(shù)的持續(xù)發(fā)展,也必將催生全新體驗?zāi)J降某墤?yīng)用。

收藏
74W
我要評論
歡迎您發(fā)表有價值的評論,發(fā)布廣告和不和諧的評論都將會被刪除,您的賬號將禁止評論。
發(fā)表評論
要聞
股市
關(guān)聯(lián)話題
8853 人關(guān)注