“百模大戰(zhàn)”正酣!同質化或構成“硬傷”? 需從應用入手反哺大模型|直擊外灘大會
原創(chuàng)
2023-09-08 13:39 星期五
財聯(lián)社記者 黃心怡
①大模型作為創(chuàng)業(yè)公司來講,一定要慎重,這個豪賭是很大的;
②AI應用的生態(tài)需要更加繁榮,這樣才能反過來推動模型的發(fā)展。

《科創(chuàng)板日報》9月8日訊(記者 黃心怡) 今年以來AI熱度持續(xù)攀升,近半年內全球近百家公司、機構相繼發(fā)布大語言模型相關產品。國內也正面臨著“百模大戰(zhàn)”,有數(shù)據(jù)顯示,全國有至少130家公司研究大模型產品,其中做通用大模型的有78家。

在外灘大會期間,《科創(chuàng)板日報》記者對話了小冰公司CEO李笛,螞蟻集團副總裁、螞蟻基礎大模型負責人徐鵬,就大模型的落地前景和挑戰(zhàn)進行了探討。

現(xiàn)在行業(yè)里面最大的問題其實是太雷同了。”李笛對于大模型風潮直言,“大家都沿著同一條路徑往前走,沒有多樣性,這和創(chuàng)新精神是違背的。創(chuàng)新其實不是追趕,而是有新的方法,去實現(xiàn)自己的優(yōu)勢。”

李笛還強調,大模型創(chuàng)業(yè)需要慎重?!拔矣X得大模型作為創(chuàng)業(yè)公司來講,一定要慎重。如果創(chuàng)新是在一個維度的線性發(fā)展,那么只要追就可以了。但現(xiàn)在還不知道技術范式是不是這個方向。一旦最后的方向跟現(xiàn)在的方向有夾角,那么你跟得越快,創(chuàng)業(yè)公司就會走得越偏。當然,如果原本是一個擁有非常強業(yè)務的公司,想嘗試用大模型去改變原來的業(yè)務,那么是沒有任何問題的。但假如你就是吃大模型這碗飯,那這個豪賭是很大的。因為沒有人能確定,OpenAI也不能確定,風險很高?!?/p>

對于大模型同質化的問題,徐鵬也認為,“現(xiàn)在很多吃大模型這碗飯的,大家做的都是偏雷同的,真正對于擴性本身的發(fā)展并不能帶來多大的推動作用?!?/p>

不過,徐鵬補充說道,雷同從另一個角度看,也是源于中國還處于追趕的階段,首先要及格,之后才有機會發(fā)展的更好。

“比如說百度、騰訊、阿里等等,都要做到跟GPT類似的水平。相信在這之后會有很多創(chuàng)新的點,可以做不一樣的東西。只是現(xiàn)階段還處在追齊GPT能力的階段。”

金沙江創(chuàng)投主管合伙人張予彤在大會上指出,當前生成式人工智能創(chuàng)業(yè)與投資爆發(fā),今年上半年投資額已超過去年全年水平。頭部25家生成式AI已吸收170億美金的融資,估值雖有泡沫,但泡沫中也有顛覆性的機會。生成式AI投資將圍繞那些具備護城河的AI原生應用展開。

徐鵬表示,AI應用的生態(tài)需要更加繁榮,這樣才能反過來推動模型的發(fā)展?,F(xiàn)在至少看起來應用生態(tài)還不夠繁榮,應用的場景上面還沒有那么豐富。

”還是要從應用入手,應用可以做出來非常多不一樣的東西。”徐鵬說,“如今國內外的開源模型,給大家?guī)砹藙?chuàng)新上的便利,不用從頭開始浪費大量的財力去訓練基礎模型。所以,如果大家都把力量放在大模型應用的創(chuàng)新上面,會反過來看到大模型在什么地方做得不到位,哪里還有很大的提升空間,反過來能促進大模型技術的發(fā)展?!?/p>

數(shù)據(jù),是決定大模型性能的三大要素之一。用來訓練模型的數(shù)據(jù),將直接決定模型的質量。李笛判斷,中文語料所存在的挑戰(zhàn)沒有想象中那么大。“中文的語料要好好地清洗,還是可以的。但把語料真正挖清楚、清洗得足夠好,這是苦力活。

徐鵬也認同語料清洗確實是一個苦力活。“而且誰都逃不開,但是中文本身的數(shù)據(jù)量級應該是夠的?!?/p>

展望大模型的未來,徐鵬稱,短期內容易高估技術帶來的變化,而長期可能會低估其產生的效應,要冷靜地看待長期帶來的價值。

“當這樣的大潮起來之時,要非常認真地看清它,到底帶來的東西是什么,能力邊界到底在哪里。既不能盲目做太多不切實際的幻想,但又不能離開這個幻想。因為只有幻想才有動力,才有更多的人愿意做一些看上去不靠譜的事情。我們應有一定的機制支持人們長期在這個方向做進一步的投入,然后找到核心應用場景、真正能夠帶來變化的東西。然后就可以反哺到人工智能的發(fā)展?!?/p>

收藏
152.03W
我要評論
歡迎您發(fā)表有價值的評論,發(fā)布廣告和不和諧的評論都將會被刪除,您的賬號將禁止評論。
發(fā)表評論
要聞
股市
關聯(lián)話題
0 人關注
0 人關注