OpenAI發(fā)布強(qiáng)化微調(diào) 卻被馬斯克的xAI、Meta搶走風(fēng)頭
原創(chuàng)
2024-12-07 03:30 星期六
財(cái)聯(lián)社 史正丞
①OpenAI發(fā)布強(qiáng)化微調(diào)技術(shù),可基于少量特定領(lǐng)域數(shù)據(jù)創(chuàng)造專(zhuān)家模型;
②馬斯克的xAI向所有用戶開(kāi)放Grok聊天機(jī)器人;
③Meta推出Llama 3.3 70B模型,在多個(gè)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)于谷歌、OpenAI等競(jìng)品的模型,且成本更低。

財(cái)聯(lián)社12月7日訊(編輯 史正丞)就在OpenAI的“12日大直播”進(jìn)入第二天之際,馬斯克和扎克伯格同時(shí)出手,爭(zhēng)搶市場(chǎng)的注意力。

在進(jìn)入正題前,先簡(jiǎn)要介紹一下OpenAI第二日直播發(fā)布的產(chǎn)品:強(qiáng)化微調(diào)(Reinforcement Finetuning)。這是一種旨在特定領(lǐng)域使用非常少的訓(xùn)練數(shù)據(jù),就能在o1等模型的基礎(chǔ)上創(chuàng)造專(zhuān)家模型的功能。例如OpenAI正在與湯森路透合作,打造專(zhuān)屬于該公司的法律專(zhuān)業(yè)模型。

image

(來(lái)源:OpenAI)

OpenAI在演示中表示,經(jīng)過(guò)強(qiáng)化微調(diào)后,哪怕是基于o1-mini的專(zhuān)屬模型,在應(yīng)對(duì)特定任務(wù)時(shí)的表現(xiàn),也會(huì)比通用o1模型的表現(xiàn)更好。公司介紹稱,這個(gè)項(xiàng)目適合那些執(zhí)行“由專(zhuān)家主導(dǎo)狹窄、復(fù)雜任務(wù)的機(jī)構(gòu)”,例如金融、法律、醫(yī)療、工程等領(lǐng)域都有可能獲益。

image

目前開(kāi)發(fā)人員需要通過(guò)申請(qǐng)獲得強(qiáng)化微調(diào)alpha項(xiàng)目的訪問(wèn)權(quán)限,公司期待在2025年初公開(kāi)提供這項(xiàng)服務(wù)。

很顯然,OpenAI的新品應(yīng)該會(huì)令那些有訓(xùn)練模型需求的程序員們感到激動(dòng),但大多數(shù)“坐等現(xiàn)成產(chǎn)品”的消費(fèi)者恐怕就沒(méi)什么感覺(jué)了。

就在這個(gè)時(shí)候,馬斯克的xAI和Meta公司出手了。

Grok聊天機(jī)器人對(duì)所有用戶開(kāi)放

不少馬斯克旗下社交媒體平臺(tái)X的用戶發(fā)現(xiàn),從周五開(kāi)始,不加錢(qián)訂閱會(huì)員的用戶也能使用Grok聊天機(jī)器人了。

Grok由xAI去年推出,在今年8月增加了“文生圖”功能。與公司老板馬斯克一樣,這個(gè)AI產(chǎn)品也非常特立獨(dú)行——Grok應(yīng)該是目前主流大公司的AI產(chǎn)品里,唯一一個(gè)沒(méi)有設(shè)置嚴(yán)格安全護(hù)欄的聊天機(jī)器人,例如用戶可以生成特朗普這種知名公眾人物的AI圖像。

image

(馬斯克與特朗普握手的AI圖像)

根據(jù)報(bào)道,沒(méi)有給馬斯克付錢(qián)的用戶,每?jī)尚r(shí)可以向Grok發(fā)送10條信息。更關(guān)鍵的問(wèn)題是,隨著這款頗具爭(zhēng)議的產(chǎn)品面向上億用戶免費(fèi)開(kāi)放,未來(lái)在互聯(lián)網(wǎng)上分辨圖片真實(shí)性的難度料將顯著提升。

xAI本周向美國(guó)證券交易委員會(huì)提交報(bào)告,披露完成了一筆60億美元的融資,公司的估值已經(jīng)超過(guò)400億美元。

Meta發(fā)布Llama家族新成員

在開(kāi)源AI賽道上領(lǐng)跑的Meta公司周五宣布,推出Llama 3.3 70B模型。目前開(kāi)發(fā)者們已經(jīng)可以從Llama官網(wǎng)或“抱抱臉”等代碼平臺(tái)上下載。

Meta的生成式AI副總裁Ahmad Al-Dahle表示,純文本的Llama 3.3 70B能夠以更低的成本,提供與Llama家族最大模型Llama 3.1 405B相當(dāng)?shù)男阅芩?/strong>。利用最新的后訓(xùn)練(Post-Training)技術(shù)進(jìn)展,該模型在顯著降低成本的同時(shí)提高了核心性能。

Al-Dahle也發(fā)布了一張側(cè)視圖,顯示Llama 3.3 70B模型在多個(gè)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)于谷歌的Gemini 1.5 Pro、OpenAI的GPT-4o,以及亞馬遜的Nova Pro,而且在成本上還有很大優(yōu)勢(shì)。

image

為了參與這場(chǎng)AI時(shí)代的競(jìng)爭(zhēng),Meta本周剛宣布將斥資100億美元在路易斯安那州建設(shè)公司歷史上最大的人工智能數(shù)據(jù)中心。扎克伯格此前曾表示,為了訓(xùn)練下一代Llama模型Llama 4,公司需要的計(jì)算能力是訓(xùn)練Llama 3所需的10倍。

收藏
149.81W
我要評(píng)論
歡迎您發(fā)表有價(jià)值的評(píng)論,發(fā)布廣告和不和諧的評(píng)論都將會(huì)被刪除,您的賬號(hào)將禁止評(píng)論。
發(fā)表評(píng)論
要聞
股市
關(guān)聯(lián)話題
0 人關(guān)注
0 人關(guān)注