
DeepSeek開源第一個(gè)用于混合專家模型訓(xùn)練和推理的高效專家并行通信庫
財(cái)聯(lián)社2月25日電,DeepSeek在“開源周”的第二天向公眾開源了DeepEP。據(jù)介紹,DeepEP是第一個(gè)用于MoE(混合專家)模型訓(xùn)練和推理的EP(Expert Parallelism,專家并行)通信庫,可以實(shí)現(xiàn)高效且優(yōu)化的全對全通信,支持包括FP8在內(nèi)的低精度運(yùn)算,適配現(xiàn)代高性能計(jì)算需求。同時(shí),DeepEP針對NVLink到RDMA的非對稱帶寬轉(zhuǎn)發(fā)場景進(jìn)行了深度優(yōu)化,不僅提供了高吞吐量,還支持SM(Streaming Multiprocessors)數(shù)量控制,兼顧訓(xùn)練和推理任務(wù)的高吞吐量表現(xiàn)。對于延遲敏感的推理解碼場景,DeepEP還提供了純RDMA的低延遲內(nèi)核,支持自適應(yīng)路由,能實(shí)現(xiàn)更靈活的GPU資源控制,滿足不同場景需求。
我要評(píng)論
反饋意見 

歡迎您發(fā)表有價(jià)值的評(píng)論,發(fā)布廣告和不和諧的評(píng)論都將會(huì)被刪除,您的賬號(hào)將禁止評(píng)論。
發(fā)表評(píng)論
關(guān)聯(lián)話題
4.84W 人關(guān)注
+ 關(guān)注