DeepSeek通過(guò)開(kāi)源其系列模型(如DeepSeek-V3、R1、Janus-Pro等)及多模態(tài)能力,迅速點(diǎn)燃了行業(yè)熱情。
目前,已有超過(guò)10家以上的國(guó)產(chǎn)AI芯片企業(yè)宣布適配或上架DeepSeek模型服務(wù),包括華為昇騰、沐曦、天數(shù)智芯等頭部廠商。同時(shí),華為云與DeepSeek的合作,受到行業(yè)內(nèi)外高度關(guān)注。
此外,聯(lián)想、釘釘?shù)绕髽I(yè)推出基于DeepSeek的AI一體機(jī),覆蓋銷售助理、會(huì)議質(zhì)檢、智能審批等場(chǎng)景,實(shí)現(xiàn)了從芯片、模型到應(yīng)用的全鏈路國(guó)產(chǎn)化改造。這一波熱度不僅提升了端側(cè)的技術(shù)自主性,還通過(guò)實(shí)測(cè)數(shù)據(jù)驗(yàn)證了國(guó)產(chǎn)硬件的競(jìng)爭(zhēng)力,為端側(cè)AI的規(guī)?;涞氐於嘶A(chǔ)。
為了進(jìn)一步探索DeepSeek對(duì)于云側(cè)與端側(cè)所帶來(lái)的影響,財(cái)聯(lián)社VIP特聯(lián)合蜂網(wǎng)火線直連“AI算力”行業(yè)專家,剖析華為云以及邊緣計(jì)算行業(yè)的潛在價(jià)值。
【核心邏輯】
【交流紀(jì)要】
問(wèn)題一:華為為何能成為DeepSeek生態(tài)中的關(guān)鍵角色?
專家:在部署DeepSeek-R1-671b大模型時(shí),內(nèi)存與顯存容量是主要硬件瓶頸。當(dāng)下,并非所有的云計(jì)算資源或者國(guó)產(chǎn)芯片都能夠達(dá)成滿血部署。即便部分用戶或許無(wú)需使用滿血版本,但無(wú)法支持滿血版部署的芯片或平臺(tái),必然難以成為客戶的優(yōu)先之選。
在國(guó)產(chǎn)芯片領(lǐng)域,華為昇騰位居第一梯隊(duì)。搭載昇騰芯片的云服務(wù)商,例如三大運(yùn)營(yíng)商旗下的移動(dòng)云、聯(lián)通云、天翼云,能夠依托華為昇騰,提供媲美全球高端GPU性能的DeepSeek推理服務(wù)。(在這方面,海光信息、寒武紀(jì)、云天勵(lì)飛等芯片廠商也在積極調(diào)整。)
此外,昇騰芯片采用非CUDA的自主架構(gòu),這無(wú)疑為相關(guān)應(yīng)用和服務(wù)提供了更具自主性與安全性的保障。另外,寒武紀(jì)也是自成體系路線的代表。
問(wèn)題二:在端側(cè)領(lǐng)域,華為對(duì)于DeepSeek而言具有怎樣的獨(dú)特價(jià)值?
專家:當(dāng)下,華為基于純血鴻蒙HarmonyOSNEXT開(kāi)發(fā)的小藝助手APP已成功接入DeepSeek,智能體廣場(chǎng)也已上線DeepSeek-R1的Beta版本。并且,預(yù)計(jì)在2025年,PC鴻蒙版將正式推出。由此可見(jiàn),憑借華為強(qiáng)大的“全棧能力”,使其在端側(cè)AI的激烈競(jìng)爭(zhēng)中脫穎而出,占據(jù)了優(yōu)勢(shì)地位。
對(duì)于DeepSeek來(lái)說(shuō),華為正在積極推進(jìn)全新的全球化戰(zhàn)略布局,計(jì)劃深入拓展至多達(dá)60個(gè)國(guó)家和地區(qū)。這一舉措無(wú)疑為DeepSeek大模型在全球范圍內(nèi)的廣泛應(yīng)用與推廣,創(chuàng)造了更為廣闊的發(fā)展空間與機(jī)遇。
問(wèn)題三:部署方式與模型性能怎樣作用于端側(cè)AI的實(shí)際落地?
專家:DeepSeek通過(guò)開(kāi)源涵蓋1.5B至671B參數(shù)的不同規(guī)模推理模型,極大地降低了端側(cè)部署的難度。不過(guò),端側(cè)部署仍面臨推理延遲和硬件資源受限這兩大關(guān)鍵難題。
舉例來(lái)說(shuō),在某些場(chǎng)景中,模型推理需要長(zhǎng)達(dá)40秒的時(shí)間,因此這種情況僅適用于像政務(wù)審批、出差報(bào)銷這類對(duì)延時(shí)容忍度較高的場(chǎng)景。為了解決這一問(wèn)題,DeepSeek推出了蒸餾模型,比如R1-Distill系列。這類模型在維持性能的同時(shí),有效壓縮了參數(shù)量,能夠很好地適配消費(fèi)級(jí)PC和邊緣設(shè)備。
所以,基于開(kāi)源模型性能的提升,一體機(jī)得以將更為出色的模型應(yīng)用于端側(cè)部署,并與業(yè)務(wù)能力相結(jié)合,從而能夠應(yīng)對(duì)更多的業(yè)務(wù)場(chǎng)景。而開(kāi)源模型性能的進(jìn)步,也為進(jìn)行私有化部署的企業(yè)提供了更廣闊的操作空間和更多發(fā)展機(jī)會(huì)。
與此同時(shí),國(guó)產(chǎn)芯片廠商通過(guò)優(yōu)化軟件棧,如華為的CANN以及昆侖芯P800的CUDA兼容方案,極大地提高了模型在本地化部署時(shí)的效率。隨著技術(shù)不斷突破并與場(chǎng)景適配度不斷提高,端側(cè)AI正從“概念驗(yàn)證”階段穩(wěn)步邁向“商業(yè)變現(xiàn)”階段。
問(wèn)題四:端側(cè)的熱度能否延續(xù)至2025年?Agent技術(shù)會(huì)成為新的焦點(diǎn)嗎?
專家:目前,國(guó)內(nèi)Agent技術(shù)的商業(yè)價(jià)值還沒(méi)有真正體現(xiàn)出來(lái),在實(shí)際落地應(yīng)用方面顯得比較空洞。反觀端側(cè)AI,依靠像一體機(jī)、AIPC這類具體有形的產(chǎn)品,已經(jīng)在市場(chǎng)上收獲了實(shí)際收益。DeepSeek的火熱發(fā)展,更是進(jìn)一步推動(dòng)整個(gè)行業(yè)朝著“產(chǎn)品力與宣傳力雙輪驅(qū)動(dòng)”的方向轉(zhuǎn)變。
據(jù)分析機(jī)構(gòu)預(yù)測(cè),2025年全球AIPC出貨量會(huì)超過(guò)1億臺(tái),復(fù)合增長(zhǎng)率達(dá)到44%。由于PC作為生產(chǎn)力工具的特性,使其成為大模型本地部署的關(guān)鍵載體。但是,Agent技術(shù),比如OpenAI的Operator以及谷歌Gemini2.0,確實(shí)有很大潛力成為新的熱點(diǎn)。所以在2025年,端側(cè)的熱度或許會(huì)與Agent技術(shù)形成一個(gè)“價(jià)值過(guò)渡期”,借助技術(shù)的不斷更新迭代,持續(xù)吸引市場(chǎng)的關(guān)注。





