①用戶和AutoGLM的溝通為語音或文字形式,并實時顯示字幕; ②智譜同步發(fā)布“人味兒”更重的GLM-4-Voice端到端情感語音模型; ③當(dāng)下的AI助理依然存在很大的進(jìn)步空間。
《科創(chuàng)板日報》10月28日訊(編輯 宋子喬) 臨近蘋果AI功能(Apple Intelligence)發(fā)布日,中國獨角獸企業(yè)智譜AI(以下簡稱智譜)搶先上線了AI助理工具。
10月25日,智譜用三分鐘的視頻展示了AutoGLM帶來的便利:無需手動操作,用戶對著手機(jī)說話(發(fā)出指令),便可讓其自動打開手機(jī)上的各類App,進(jìn)行網(wǎng)購、點外賣、訂高鐵票,甚至發(fā)微信、搶紅包、評論朋友圈、整理筆記并生成攻略、總結(jié)論文。從宣傳視頻中已經(jīng)有的功能看,智譜已展示淘寶、美團(tuán)、微信等App,這三個公司也是智譜的投資方。
用戶和AutoGLM的溝通為語音或文字形式,并實時顯示字幕。
手機(jī)成為AI助理,只需接收文字/語音指令,就可以模擬人類操作手機(jī),幫你解決日?,嵤?,這一幕是不是很像電影中的賈維斯來到現(xiàn)實?
同日(10月25日),智譜發(fā)布GLM-4-Voice端到端情感語音模型。
該模型的最大亮點在于,“人味兒”更重、交互體驗更強(qiáng)。據(jù)介紹,GLM-4-Voice能夠根據(jù)用戶指令靈活調(diào)整語音的情感、語調(diào)、語速及方言等特征,且具有更低的延時,支持實時打斷、多語言、多方言。作為端到端的語音模型,GLM-4-Voice避免了傳統(tǒng)的“語音轉(zhuǎn)文字再轉(zhuǎn)語音”級聯(lián)方案過程中帶來的信息損失和誤差積累,也擁有理論上更高的建模上限,即將上線視頻通話功能,旨在打造“能看又能說”的AI助理。
智譜表示,“GLM-4-Voice的出現(xiàn)是智譜在邁向AGI的道路上邁出的最新一步。”
目前,用戶可以通過安裝“智譜清言”插件體驗AutoGLM,AutoGLM也在安卓系統(tǒng)上開放了內(nèi)測申請,并與榮耀等手機(jī)廠商開展了深度合作。
資料顯示,智譜在2024年9月與榮耀共同成立AI大模型技術(shù)聯(lián)合實驗室,與榮耀進(jìn)行深度合作。2024年10月23日榮耀Magic9.0發(fā)布會展示具備自動駕駛功能的AI Agent YOYO。
開源證券稱,智譜AutoGLM大幅提高AI Agent的實用性,或推動AI Agent用戶滲透率及商業(yè)化空間打開。
國泰君安表示,AutoGLM精準(zhǔn)理解用戶指令,自動完成App操作,解放用戶雙手,有望加速手機(jī)廠商AI助理落地,具備自動駕駛功能的AI助理可幫助用戶擺脫繁瑣的App操作,僅需語音指令即可滿足用戶需求,真正實現(xiàn)AI個人助理,有望驅(qū)動AI手機(jī)換機(jī)潮,帶動上游產(chǎn)業(yè)鏈需求上行。
不過AutoGLM依然存在很大的進(jìn)步空間。國泰君安便表示,手機(jī)端的“自動駕駛”仍需明確指令,根據(jù)數(shù)字生命卡茲克發(fā)布的實測視頻,AutoGLM自動駕駛需要用戶下達(dá)明確的指令信息,如預(yù)訂酒店,需要用戶給出時間、地點、預(yù)算及相應(yīng)房型。
另外,執(zhí)行如“幫我訂回家的機(jī)票”等更個性化指令,仍需與手機(jī)廠商進(jìn)行合作,獲取用戶個人信息使用權(quán)限方可實現(xiàn)。目前AutoGLM已可自動執(zhí)行微信、淘寶、美團(tuán)、小紅書等App中用戶常用操作,更多個性化操作尚未實現(xiàn),并且未適配滴滴、京東、微信讀書等App,未來需要更多第三方廠商以及更全面的UI訓(xùn)練數(shù)據(jù)集支持。
終端有望迎AI助理時代 或帶來多層次產(chǎn)業(yè)機(jī)遇
AI助理(AI Agent)是一種能夠感知環(huán)境、進(jìn)行決策和執(zhí)行動作的智能實體,具備通過獨立思考、調(diào)用工具去逐步完成給定目標(biāo)的能力,可拆解為大模型+規(guī)劃+記憶+工具使用四個組成部分。
應(yīng)用場景方面,AI助理適用于銷售、供應(yīng)鏈、客戶服務(wù)、財務(wù)、人力資源等。
對于AI產(chǎn)業(yè)而言,AI助理能夠為C端提供個性化應(yīng)用、為B端提供降本增效方案;對于用戶而言,AI助理最核心的功能是AI自主操作手機(jī),輔助完成復(fù)雜推理任務(wù)。
業(yè)界正積極布局和探索AI助理,如阿里的MobileAgent、騰訊的App Agent、榮耀的MagicOS 9.0操作系統(tǒng)、蘋果的Apple Intelligence等,微軟、谷歌近期也相繼推出AI助理應(yīng)用。
10月22日凌晨,微軟宣布在Dynamics365中集成10個自主AI助理,可幫助企業(yè)自動執(zhí)行客服、銷售、財務(wù)、倉儲等業(yè)務(wù),這些AI助理支持OpenAI最新模型o1并具備自主學(xué)習(xí)能力,可以自動執(zhí)行跨平臺的超復(fù)雜任務(wù);
10月24日,科大訊飛推出面向教育、醫(yī)療、司法、政府服務(wù)等領(lǐng)域的AI助手;
彩訊股份于10月11-13日的2024中國移動全球合作伙伴大會上,正式推出一站式AI應(yīng)用開發(fā)平臺RichAIBox,可實現(xiàn)多個基座大模型統(tǒng)一接入、企業(yè)私域知識庫無縫銜接以及多場景智能體可視編排,助力企業(yè)快速構(gòu)建AI應(yīng)用。在應(yīng)用層面,公司也推出了3D數(shù)字人生成、圖生音樂彩靈、AI智舞、AI來電秘書等AIGC產(chǎn)品,覆蓋“5G新通話”各場景……
浙商證券表示,近期,國產(chǎn)多模態(tài)AI應(yīng)用的使用情況呈現(xiàn)爆發(fā)態(tài)勢——8月底Minimax推出文生視頻模型abab-video-1并應(yīng)用于海螺AI以來,使用生態(tài)呈現(xiàn)加速增長,據(jù)“AI產(chǎn)品榜”統(tǒng)計,9月海螺AI網(wǎng)頁版訪問量環(huán)比增長860%;而similarweb數(shù)據(jù)顯示,7月快手“可靈”視頻生成大模型上線以來,9月單月web端訪問量超1600萬次。
該機(jī)構(gòu)認(rèn)為,AI助理應(yīng)用的爆發(fā)反映出國產(chǎn)多模態(tài)AI大模型能力的顯著提升,國產(chǎn)多模態(tài)AI應(yīng)用使用情況爆發(fā)式增長,為AI助理應(yīng)用奠定良好基礎(chǔ)。
華泰證券表示,AI助理是通往AGI的核心基礎(chǔ),AI助理落地帶來多個層次的產(chǎn)業(yè)機(jī)遇,其中,Agent+終端有望推動人機(jī)交互變革,除了在終端銷售量價方面的變化外,可能對終端應(yīng)用的商業(yè)模式產(chǎn)生更加深遠(yuǎn)的影響。
德邦證券認(rèn)為,由于建立在大模型底層平臺上,AI助理在應(yīng)用場景實現(xiàn)規(guī)?;茝V以及高頻響應(yīng)后將催生巨大的推理算力需求,推理側(cè)或成為未來算力需求長期藍(lán)海。