![logo](https://cdnjs.cls.cn/www/20200601/image/telegraph-logo.png)
字節(jié)豆包大模型團(tuán)隊(duì)提出稀疏模型架構(gòu) 推理成本最高可降低83%
《科創(chuàng)板日報(bào)》12日訊,據(jù)豆包大模型團(tuán)隊(duì)消息,字節(jié)跳動豆包大模型Foundation團(tuán)隊(duì)近期提出UltraMem,一種同樣將計(jì)算和參數(shù)解耦的稀疏模型架構(gòu),在保證模型效果的前提下解決了推理的訪存問題。據(jù)介紹,該架構(gòu)有效解決了MoE推理時高額的訪存問題,推理速度較MoE架構(gòu)提升2-6倍,推理成本最高可降低83%。
關(guān)聯(lián)文章
我要評論
反饋意見 ![arrow](https://cdnjs.cls.cn/www/20200601/image/right-arrow.png)
![arrow](https://cdnjs.cls.cn/www/20200601/image/right-arrow.png)
歡迎您發(fā)表有價(jià)值的評論,發(fā)布廣告和不和諧的評論都將會被刪除,您的賬號將禁止評論。
發(fā)表評論
關(guān)聯(lián)話題
4.72W 人關(guān)注
+ 關(guān)注