科技狗

科技狗 > 互联>

豆包提出全新稀疏架构推理成本较MoE最高可降83%

时间：2025-02-13 07:33 来源：科技快报网阅读量：5443

近期，字节跳动豆包大模型团队提出了全新的稀疏模型架构UltraMem，该架构有效解决了MoE推理时高额的访存问题，推理速度较MoE架构提升2—6倍。

更重要的是，该架构能够将推理成本最高降低83%。

该研究还揭示了新架构的Scaling Law，证明其不仅具备优异的Scaling特性，更在性能上超越了MoE。

郑重声明：此文内容为本网站转载企业宣传资讯，目的在于传播更多信息，与本站立场无关。仅供读者参考，并请自行核实相关内容。

相关

热点

最新

图文

与网易和好基无可

亮度最高的千元投

推荐

科技狗 | 网站地图 | RSS订阅 | 供稿服务

科技狗版权所有，任何单位或者个人未经书面授权不得镜像或者复制本站。备案号：皖ICP备2023007381号

Copyright©2018- By http://dog.kjxq.cn All Rights Reserved 客服邮箱：bgm1231@sina.com