
DeepSeek宣布開源DeepGEMM
財聯(lián)社2月26日電,Deepseek于開源周第三天宣布開源DeepGEMM。DeepGEMM 是一個專為簡潔高效的 FP8 通用矩陣乘法(GEMM)設(shè)計的庫,具有細(xì)粒度縮放功能,如 DeepSeek-V3 中所提出。它支持普通和混合專家(MoE)分組的 GEMM。該庫采用 CUDA 編寫,在安裝過程中無需編譯,通過使用輕量級的即時編譯(JIT)模塊在運行時編譯所有內(nèi)核。FP8GEMM庫,為V3/R1訓(xùn)練和推理提供支持。
我要評論
反饋意見 

歡迎您發(fā)表有價值的評論,發(fā)布廣告和不和諧的評論都將會被刪除,您的賬號將禁止評論。
發(fā)表評論
關(guān)聯(lián)話題
4.86W 人關(guān)注
+ 關(guān)注