AI智算中心現(xiàn)狀五問|行業(yè)調(diào)研
原創(chuàng)
2024-10-02 20:12 星期三
財聯(lián)社記者 付靜
①供給端緊缺狀況緩解,各類計算卡價格現(xiàn)已貼近銷售商成本線。
②智算需求持續(xù)增長,但需求方趨于理性,供需不完全匹配。
③全國百余個智算中心中,算力閑置并非普遍現(xiàn)象。
④從業(yè)者預計,部分智算中心三四年左右能夠“回本”。
⑤首個高質(zhì)量算力評估體系發(fā)布,業(yè)內(nèi)希望用更小算力產(chǎn)生更多的智能。

財聯(lián)社10月2日訊(記者 付靜)大模型參數(shù)規(guī)模持續(xù)增加,對AI算力基礎設施提出更高要求,當下AI智算行業(yè)蓬勃發(fā)展,智算中心建設加速。最新數(shù)據(jù)顯示,截至今年6月,全國在用算力中心機架總規(guī)模超過830萬標準機架,算力規(guī)模達246 EFLOPS(FP32),智算同比增速超過65%。

現(xiàn)階段供應端算卡價格和緊缺程度如何?供給端與需求端是否相匹配?全國百余個智算中心是否都滿負荷運行?建設智算中心何時能回本?人工智能算力如何實現(xiàn)高質(zhì)量發(fā)展?圍繞五個核心問題,財聯(lián)社記者采訪了多位產(chǎn)業(yè)人士。

據(jù)財聯(lián)社記者梳理,此前AI算力供給端緊缺的局面有所緩解,但供需兩端不完全匹配,導致部分智算中心利用率較低。各地政府、企業(yè)的智算中心規(guī)劃雖屢見不鮮,真正能落地投入使用的數(shù)量或不及預期。有從業(yè)者預計,部分智算中心三四年左右能夠“回本”,與此同時,算力高質(zhì)量發(fā)展亦受業(yè)內(nèi)重視。

算卡價貼近銷售商成本線

“算力供應緊張確實是這幾年一個比較普遍的現(xiàn)象,算力能力好、生態(tài)適應性較好的產(chǎn)品,確實是很多人都搶著買。從使用者來講,當然希望智算能力能夠更好地支撐應用?!闭驹谒懔Ψ掌鞴探嵌龋顺痹坪J紫茖W家張東接受財聯(lián)社記者采訪時表示。

張東告訴記者,智算供應緊張存在周期性。

供給端當下狀況如何?上海六尺科技集團董事長、恒潤股份(603985.SH)子公司上海潤六尺科技有限公司總經(jīng)理張亞洲向財聯(lián)社記者表示, “今年算力市場供應是有的,不像去年缺得很,目前各類計算卡的價格已經(jīng)貼近銷售商成本線了?,F(xiàn)在行業(yè)內(nèi)各種項目參與的人多、中介也多,原來做電腦做設備的、ICT通訊行業(yè)的全部‘卷’進來,但其實真正做成、做好的不多?!?/p>

近期,A股部分跨界智算玩家透露出了壓力,如:蓮花控股(600186.SH)旗下蓮花紫星目前已簽署的部分算力服務合同,可能存在收回采購成本實際所需時間超出預期或無法收回的風險,截至今年8月,蓮花紫星仍處于虧損狀態(tài),全年能否盈利存在不確定性;奧雅股份(300949.SZ)全資子公司奧創(chuàng)引擎與供應商潤信供應鏈協(xié)商簽署《算力服務器采購合同補充協(xié)議》,原計劃采購的128臺內(nèi)嵌英偉達GPU芯片的高性能運算服務器數(shù)量變更為8臺。

據(jù)張亞洲觀察,今年6月-8月,GPU終端價格呈持續(xù)下跌態(tài)勢?!叭ツ甑捻椖拷衲晟习肽甓急幌袅?,今年在進行的項目主要有兩種情況:一是企業(yè)研發(fā)真正需要算力,主要集中在大型互聯(lián)網(wǎng)公司,二是一些地區(qū)拿了補貼、能源指標等配套建設智算中心?!?/p>

據(jù)了解,9月市場才出現(xiàn)了一波“掃貨”現(xiàn)象,“主要是受淡旺季和國際環(huán)境影響,但其實市場現(xiàn)貨資源并不多?!?/p>

記者亦從一位業(yè)內(nèi)人士處獲悉,“之前4090的價格從一萬三千多漲到一萬六七千了”,不過據(jù)稱漲價主要由于《黑神話:悟空》對該款顯卡需求較強。

另外張亞洲稱,市場還存在算力供給零散的現(xiàn)象:部分供給方“可能只有5臺、10臺服務器,大一些的是64臺、100多臺,大批量的基本很少。這種供應商可能會承接一些實驗室、學校的散單需求?!?/p>

供需兩端不完全匹配

幾位從業(yè)者告訴財聯(lián)社記者,供給緊缺緩解并不意味著智算需求不及預期。張亞洲稱,智算需求呈增長態(tài)勢,且不斷有新的需求產(chǎn)生,不過當下需求方已趨于理性。

深圳人工智能產(chǎn)業(yè)協(xié)會執(zhí)行會長范叢明在接受財聯(lián)社記者采訪時談到了不同類型需求方的現(xiàn)狀:頭部企業(yè)、科研高校算力資源充足,而當下產(chǎn)業(yè)垂直大模型正在大量研發(fā),中小微企業(yè)算力緊張的情況存在。

值得注意的是,智算中心建設如火如荼,相關(guān)招投標項目逐月遞增。

此前數(shù)智前線報道,據(jù)不完全統(tǒng)計,僅今年前7個月,圍繞土建基礎設施和IT基礎架構(gòu)等方方面面的建設內(nèi)容,智算中心相關(guān)項目中標公告已發(fā)布超140個,其中至少24個項目中標金額超億元;7月國內(nèi)公布的相關(guān)中標項目超40個。

中國信息通信研究院云計算與大數(shù)據(jù)研究所總工程師郭亮在剛剛落下帷幕的“2024中國算力大會”期間接受財聯(lián)社記者采訪時表示,“現(xiàn)在全國建了很多智算中心,據(jù)不完全統(tǒng)計,應有200個以上,但其中有90%的算力在1000P以下,意味著這部分算力中心對大模型訓練來說作用有限,以后的使用效率存疑。”

“算力需求是很大,只不過現(xiàn)有類型無法滿足用戶需求。無論是適配方面還是性價比角度,都達不到客戶的預期?!盜DC中國分析師杜昀龍對財聯(lián)社記者表示。

張亞洲也認為,目前存在算力供應端和需求端不完全匹配的狀況,“B端需求方一般都會找自己熟悉的單位。一個項目可能有幾十個人過來詢價,實際上只有跟項目方合作關(guān)系良好或者綜合實力比較受認可才可能成交,并不一定是以最低價成交?!?/p>

算力閑置是否普遍?

財聯(lián)社記者注意到,現(xiàn)階段算力設備是否滿負荷運行成為市場關(guān)注的焦點。

“現(xiàn)在很多算力已經(jīng)得到了消化,但行業(yè)內(nèi)確實存在小部分算力閑置的情況,比如說市場上可能有千臺機器的供應量,但可能有幾百臺機器在閑置?!睆垇喼薷嬖V財聯(lián)社記者。

據(jù)郭亮觀察,算力閑置并非是普遍現(xiàn)象,“我們團隊支撐了很多省市的相關(guān)工作。近期來看,據(jù)我們了解,寧夏算力中心的利用率還是很高的?!?/p>

現(xiàn)在比較普遍的是在網(wǎng)上賣內(nèi)蒙古、西藏、新疆的算力,進行分時租賃,價格便宜,這就會導致建在廣東等地的智算中心利用率較低。” 范叢明告訴記者。

談及寧夏智算中心,郭亮分析,當?shù)卣w電價現(xiàn)在雖無補貼,但仍有優(yōu)勢;當?shù)刂撬阒行牡乃懔σ?guī)模較大,對于大模型訓練比較有用?!傲硗鈱τ谥撬銇碚f,網(wǎng)絡傳輸?shù)男阅芤鬀]那么強,數(shù)據(jù)完全可以通過線下的方式進行,這對我國中西部的智算中心來說是個比較好的應用場景?!?/p>

“從前期建設的算力消化程度看,頭部企業(yè)應該在80%,科研高校應該是30%-40%左右,市場化建設的算力消化程度應該在一半左右?!狈秴裁鲗τ浾弑硎?。

據(jù)范叢明觀察,字節(jié)、騰訊、華為、百度等頭部企業(yè)“不停訓練大模型,數(shù)據(jù)量越大,算力需求越大,幾乎不存在算力閑置情況”;科研高校算力“建得大、用得少”,閑置相對較多;中小企業(yè)算力閑置則相對較普遍。由于定位不清、位置偏遠、價格過高,前期建設的算力消化程度是不夠的?!?/p>

杜昀龍認為,算力是否閑置主要看幾個方面:上層軟件對算力的調(diào)動、硬件之間的互聯(lián)方式、硬件設施與應用場景的適配、用戶部署成本。

9月初,騰訊云副總裁沙開波在接受財聯(lián)社記者采訪時也談到了智算中心即便具備了硬件資源,但仍缺乏配套軟件能力,缺乏實際的終端客戶或應用場景等現(xiàn)象。

張亞洲稱,算力出現(xiàn)閑置,背后原因較為復雜,與各類智算卡的性能、項目方的運營、網(wǎng)絡產(chǎn)品技術(shù)服務能力等均有關(guān),而業(yè)內(nèi)的核心關(guān)注點在于應用端是否有實際產(chǎn)出。

建智算中心幾年能回本?

算力閑置導致部分智算中心成本過高,是業(yè)內(nèi)普遍關(guān)注的問題之一。

對此,范叢明認為,智算中心供應價太貴,用戶用不起,就導致智算中心計算的連續(xù)性不夠,成本過高。

談及智算中心運營問題,郭亮在“2024中國算力大會”期間對財聯(lián)社記者表示,“近期大家在各種場合會經(jīng)??吹剿懔φ{(diào)度平臺的信息,但建了之后效果怎么樣?據(jù)了解,有些地方花了上千萬投資建了平臺,因為設計理念、功能特色等問題,實際上并沒有很好地利用起來。目前全國還沒有符合大家需求的平臺出現(xiàn),而這對我國智算中心的整體運營特別重要。”

他進一步表示,“對于智算來說,即使是政府投資也需要回報,更何況是企業(yè)?,F(xiàn)在業(yè)界確實是群雄紛爭的局面,但還沒有一統(tǒng)天下的角色出現(xiàn),當然我們也在努力,本次算力大會發(fā)布的中國算力服務平臺(河南)就是我們推出的一個解決方案?!?/p>

(財聯(lián)社記者攝于2024中國算力大會現(xiàn)場)

關(guān)于智算中心如何平衡成本和性能,范叢明告訴財聯(lián)社記者,“算力投資回收期一般是五年左右,因為算力市場變化太快,還要加上電費、運營等其他成本。如果能找到頭部大廠使用,我覺得回本時間大概在三四年左右。”

杜昀龍則認為,智算中心的運營方應制定長期規(guī)劃,降低最終用戶的使用成本,培養(yǎng)使用習慣,后期恢復標價;重點培養(yǎng)應用案例,逐漸擴大覆蓋行業(yè)。

由“量”轉(zhuǎn)“質(zhì)”何解?

客觀來看,中國算力發(fā)展依然任重道遠。

2024中國算力大會發(fā)布的《中國算力發(fā)展報告(2024年)》顯示,截至去年底,全球智算市場同比增長130%以上,而中國智算市場同比增長超過60%。

財聯(lián)社記者注意到,算力建設熱潮之下,有從業(yè)者在上述大會上分享了諸多“冷思考”,并將目光聚焦高質(zhì)量算力。

浪潮信息(000977.SZ)聯(lián)合信通院發(fā)布的業(yè)界首個高質(zhì)量算力評估體系《人工智能算力高質(zhì)量發(fā)展評估體系報告》表示,高質(zhì)量算力是基于最新人工智能理論,采用先進人工智能的計算架構(gòu),與算法、數(shù)據(jù)深度結(jié)合的高水平計算能力。

財聯(lián)社記者從浪潮信息方面獲悉,當前算力集群實測性能和理論性能差距過大問題明顯,部分算力實際性能不足理論性能的10%。公開數(shù)據(jù)顯示,傳統(tǒng)模式下的智算中心GPU利用率平均數(shù)值低于30%。

張東認為,對于算力的關(guān)注不能僅僅關(guān)注芯片,“很多地方買算力,點名芯片的品牌,構(gòu)建一個多大規(guī)模的算力中心,實際上看芯片指標沒有意義,大家還是要從系統(tǒng)角度,綜合考慮最后怎樣滿足應用需要。”

郭亮也表示,“目前,我們在芯片這一層選擇不多。但計算和網(wǎng)絡融合方面是一個熱點。目的是把一臺AI服務器,從現(xiàn)在的8卡擴展到32卡、512卡,這對智算集群的能力,包括集群的部署、上線、運維都有益處?!?/p>

財聯(lián)社記者多方采訪獲悉,大規(guī)模智算落地絕非簡單的規(guī)模數(shù)量堆疊,其復雜程度呈指數(shù)級增加,對智算建設運營者的技術(shù)實力、資源優(yōu)勢、產(chǎn)業(yè)協(xié)同能力有著很高的要求。

至于智算中心如何由“量”轉(zhuǎn)“質(zhì)”,郭亮稱,“建設智算中心需要‘適度超前’,結(jié)合當?shù)貙嶋H需求做整體的分析和預判?!?/p>

收藏
100.62W
我要評論
歡迎您發(fā)表有價值的評論,發(fā)布廣告和不和諧的評論都將會被刪除,您的賬號將禁止評論。
發(fā)表評論
要聞
股市
關(guān)聯(lián)話題
0 人關(guān)注
0 人關(guān)注