多模態(tài)大模型能夠更全面可靠地學(xué)習(xí)和理解復(fù)雜的信息輸入,同時能夠從文本、聲音、視覺等角度提供更豐富多維的信息輸出。多模態(tài)大模型在藝術(shù)、設(shè)計、娛樂、教育等多個領(lǐng)域都已展示了其巨大的應(yīng)用潛力,伴隨著底層技術(shù)的持續(xù)發(fā)展,也必將催生全新體驗?zāi)J降某墤?yīng)用。
《科創(chuàng)板日報》1月8日訊(記者 黃心怡) ChatGPT的橫空出世,帶來2023年全球大模型熱潮。在2024年新年之際,財聯(lián)社、《科創(chuàng)板日報》聯(lián)合上海市人工智能行業(yè)協(xié)會,邀請人工智能領(lǐng)軍者與行業(yè)精英推出“2024·AI領(lǐng)先者心聲”系列報道,回顧過去的一年,展望新的一年AI大模型發(fā)展的機遇與挑戰(zhàn)。
生數(shù)科技CEO唐家渝向《科創(chuàng)板日報》表示:
從GPT-4V的搶眼亮相,到年底Gemini的火爆出圈,大模型正從單模態(tài)智能向多模態(tài)融合發(fā)展。
圍繞“聽、說、讀、寫、看”等諸多方面模擬和接近人類的智能化能力,多模態(tài)大模型能夠更全面可靠地學(xué)習(xí)和理解復(fù)雜的信息輸入,同時能夠從文本、聲音、視覺等角度提供更豐富多維的信息輸出,使人機交互更加友好和直觀,貼近人類自然的習(xí)慣。
唐家渝“2024·AI領(lǐng)先者心聲”全文如下:
從GPT-4V的搶眼亮相,到年底Gemini的火爆出圈,大模型正從單模態(tài)智能向多模態(tài)融合發(fā)展。
我們堅信,多模態(tài)大模型將是未來生成式AI的必要發(fā)展趨勢。圍繞“聽、說、讀、寫、看”等諸多方面模擬和接近人類的智能化能力,多模態(tài)大模型能夠更全面可靠地學(xué)習(xí)和理解復(fù)雜的信息輸入,同時能夠從文本、聲音、視覺等角度提供更豐富多維的信息輸出,使人機交互更加友好和直觀,貼近人類自然的習(xí)慣。
目前,多模態(tài)大模型在藝術(shù)、設(shè)計、娛樂、教育等多個領(lǐng)域都已展示了其巨大的應(yīng)用潛力,伴隨著底層技術(shù)的持續(xù)發(fā)展,也必將催生全新體驗?zāi)J降某墤?yīng)用。