2025-09-29 18:20
热度 0

DeepSeek-V3.2-Exp模型正式发布并开源

摘要
神经日报 9月29日消息,DeepSeek-V3.2-Exp模型今日正式发布并开源。模型引入稀疏Attention架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台MaaS,针对DeepSeek-V3.2-Exp模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。

神经日报 9月29日消息,DEEPSeek-V3.2-EXP模型今日正式发布并开源。模型引入稀疏AtTENtIon架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台MaaS,针对DeepSeek-V3.2-EXp模型,华为云此次仍沿用大EP并行方案部署,基于稀疏AttentIOn结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。

声明:文章不代表神经日报观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!当前页面地址:https://www.nervedaily.com/kuaixun/146795.html
回顶部