①Kimi爆火,核心優(yōu)勢在于長文本讀取和解析能力,阿里和百度正在長文本領(lǐng)域布局。 ②評判應(yīng)用的核心標(biāo)準(zhǔn)是看輸出結(jié)果的精準(zhǔn)性連貫性,并不是文本長度越長越好。 ③對于2024年的應(yīng)用落地,行業(yè)保持審慎樂觀。
《科創(chuàng)板日報》3月23日訊(記者 張洋洋)月之暗面不再“晦暗”。近期,由這家公司創(chuàng)作的大模型應(yīng)用Kimi,吸引了大量目光。Kimi產(chǎn)生的效應(yīng)已經(jīng)從大模型圈外溢至資本市場,Kimi概念股在本周應(yīng)運而生。用戶激增,巨大流量突然涌入,甚至讓Kimi服務(wù)器一度宕機。
Kimi在這一輪大模型應(yīng)用當(dāng)中突圍,核心優(yōu)勢在于長文本讀取和解析能力。頗為巧合的是,就在22日晚間,阿里高調(diào)宣布通義千問開放1000萬字長文本能力。360當(dāng)晚緊隨其后,宣布360智腦正式內(nèi)測500萬字長文本處理功能,即將入駐360AI瀏覽器。
而據(jù)《科創(chuàng)板日報》了解,百度也將在下個月開放200萬-400萬的長文本能力。
阿里巴巴、百度等互聯(lián)網(wǎng)巨頭紛紛布局并升級自家的大模型產(chǎn)品,強化長文本處理能力,正讓業(yè)界重新審視長文本處理在大模型領(lǐng)域的必要性和重要性。而隨著Kimi的崛起,這也讓大模型的討論焦點從大模型本身轉(zhuǎn)移到了應(yīng)用端,2024年是否會成為AI大模型應(yīng)用落地元年?
▍長文本是必要的嗎?
相較于其他大模型應(yīng)用,Kimi的長處在于長文本分析聯(lián)網(wǎng)搜索、文檔處理和等功能上,尤其在深度解析厚重書籍內(nèi)容方面,其性能遠(yuǎn)超遠(yuǎn)超其他模型。3月18日,月之暗面甚至一口氣將無損上下文長度提升了十倍,直達(dá)200萬字級別。
據(jù)目前的用戶體驗來看,Kimi也不是全能選手。有用戶反饋表示,對于一些較為困難的任務(wù),包括結(jié)構(gòu)化信息處理和圖像中潦草文字的識別,對話連續(xù)性上,Kimi仍顯示出一些短板。在生成能力和語音能力上,目前Kimi還未加入這些模態(tài)。
盡管如此,長文本能力的重要性不言而喻。目前,市面上的大模型應(yīng)用,GPT-4Turbo-128k公布的文本范圍約為10萬漢字,Claude3200k上下文約16萬漢字。
一家AI上市公司大模型架構(gòu)業(yè)務(wù)人士告訴記者,由于模型訓(xùn)練結(jié)構(gòu)的限制,以往大模型的文本范圍都不算長,但復(fù)雜任務(wù)和行業(yè)知識通常是長篇巨制,這種情況下,只能拆分輸入提問,但這可能會導(dǎo)致輸出的結(jié)果上下不連貫邏輯不通順。長文本可以全篇連貫的去理解上下文,滿足理解和問答的需求,長文本能力在此時是具備優(yōu)勢的。
而國內(nèi)大廠們,則正在長文本領(lǐng)域快速布局。
《科創(chuàng)板日報》記者從知情人士方面了解到,百度在下個月將對文心一言進(jìn)行升級,屆時也將開放長文本能力,文本范圍在200萬-500萬。目前,文心一言的文本最高上限在3.2萬。
而阿里已經(jīng)先行一步。22日晚間,阿里的通義千問官宣升級,向所有人免費開放1000萬字的長文檔處理功能。用戶可通過通義千問網(wǎng)站和APP快速讀研報、分析財報、讀科研論文、研判案情、讀醫(yī)療報告、解讀法律條文、分析考試成績、總結(jié)深度文章。
360緊隨其后,其在當(dāng)晚宣布,360智腦正式內(nèi)測500萬字長文本處理功能,即將入駐360AI瀏覽器。
Kimi成功在前,阿里、百度、360先后角逐長文本。長文本能力會是大模型未來差異化的競爭點嗎?
上述大模型架構(gòu)人士表示,長文本能力目前在訓(xùn)練和效果上仍存在一些難點,比如如何避免遺漏細(xì)節(jié)。事實上,文本長度也可以通過RoPE等算法技術(shù)去拓展,但是此時會嚴(yán)重丟失細(xì)節(jié),這就導(dǎo)致輸出效果不準(zhǔn)確。因此,核心標(biāo)準(zhǔn)是看輸出結(jié)果的精準(zhǔn)性連貫性,并不是文本長度越長越好。
另外一名大模型行業(yè)人士也告訴記者,長文本實際是大模型的基礎(chǔ)能力,只要算力資源足夠,理論上長文本可以追求無限長,“但是如果使用場景根本用不上長文本,那么此時的長文本就沒有任何意義”。
▍2024年是大模型應(yīng)用落地元年嗎?
Kimi的火爆,一定程度上也反應(yīng)了當(dāng)下國內(nèi)大模型的發(fā)展階段,從打基建開始走向應(yīng)用落地。那么,2024年是否會成為AI大模型應(yīng)用落地元年?
瀾舟科技CEO周明認(rèn)為,從長遠(yuǎn)來看,人工智能在逼近AGI。而經(jīng)過去一年的發(fā)展,大模型已經(jīng)具備了落地的能力,企業(yè)側(cè)也積攢了很多業(yè)務(wù)落地場景。加上國家政策的推動,2024年將會是大模型落地元年。
零一萬物聯(lián)合創(chuàng)始人祁瑞峰也表達(dá)了類似的看法,但他是聚焦在B端場景。目前,內(nèi)容生成、理解、摘要和對話等應(yīng)用仍占據(jù)主導(dǎo),但隨著新一代模型推理、決策和執(zhí)行能力的提升,有望更快地將AI技術(shù)植入企業(yè)業(yè)務(wù)系統(tǒng),真正開啟大模型賦能的騰飛。
電商是AI應(yīng)用最具代表性的領(lǐng)域之一。魔琺科技目前是阿里媽媽、淘寶直播生態(tài)官方指定的3D超寫實虛擬直播服務(wù)商,旗下有一款3D虛擬人直播AIGC產(chǎn)品“有光”。
魔琺科技CEO柴金祥在接受《科創(chuàng)板日報》記者采訪時表示,電商是公司AI產(chǎn)品應(yīng)用的最主要一個行業(yè)。從已有的使用效果來看,多個知名頭部美妝品牌在使用魔琺科技提供的3D虛擬人后,午夜6小時的直播時段內(nèi)累計年GMV增量高達(dá)數(shù)千萬。3D虛擬直播午夜超級直播廣告投放高于行業(yè)均值2倍以上,ROI大于5倍。
盡管2024年被寄予厚望,但是各方仍然保持著審慎樂觀的態(tài)度。
祁瑞峰認(rèn)為,在C端市場,目前成本還很高,商業(yè)模式還未完全跑通。即便是對于現(xiàn)在已經(jīng)可以創(chuàng)收的B端市場,周明也認(rèn)為,要想做好產(chǎn)品標(biāo)準(zhǔn)化和完整交付,訓(xùn)練和部署成本、行業(yè)適配能力、幻象問題、數(shù)據(jù)安全四方面的問題,還有待解決。
夢餉科技CTO曹均濤在接受《科創(chuàng)板日報》記者采訪時表示,雖然AI在電商行業(yè)的應(yīng)用,想象空間非常大,夢餉也在通過GPT大模型重構(gòu)業(yè)務(wù)場景,包括解決模特圖片生成、素材差異化、服裝秀、AI創(chuàng)作助手、聊天室導(dǎo)購等問題。
“但是現(xiàn)在的階段,基礎(chǔ)設(shè)施并不完善?!辈芫鶟嬖V記者,夢餉在去年為創(chuàng)作者做了AI創(chuàng)作平臺,雖然能生成模特圖,但是成圖率并不高,還是需要技術(shù)升級和內(nèi)部做技術(shù)提示詞、算法模型的調(diào)優(yōu),這個平臺到現(xiàn)在還沒有開放,“現(xiàn)在大家都在找應(yīng)用場景,估計2024年開始能夠看到更多AI、大模型帶來的變化”。
在42章經(jīng)創(chuàng)始人曲凱看來,2024年仍會是技術(shù)上不斷突破的一年,很難真的做到大規(guī)模的落地和有非常多的場景,不過,不管是在B端還是C端,今年有望看到更多應(yīng)用開始跑出來。與此同時,應(yīng)用端的項目今年也將更受投資人青睞。
“去年大家投了非常多資金和精力在大模型本身,要想將這個故事持續(xù)下去,就需要有落地,因此會在應(yīng)用端繼續(xù)探索,找到PMF(Product Market Fit,產(chǎn)品市場匹配)?!鼻鷦P說。