本文作者:访客

DeepSeekR2都有哪些爆料 参数与硬件升级

访客 2025-04-27 17:55:50 836
DeepSeekR2都有哪些爆料 参数与硬件升级摘要: 昨晚,玩家deedydas在社交媒体上披露了深度求索即将发布的下一代AI大模型DeepSeek-R2的参数信息。DeepSeek-R2将采用更先进的混合专家模型(MoE),结合智能...

昨晚,玩家deedydas在社交媒体上披露了深度求索即将发布的下一代AI大模型DeepSeek-R2的参数信息。DeepSeek-R2将采用更先进的混合专家模型(MoE),结合智能门控网络层,以优化高负载推理任务的性能。新模型的总参数量预计将达到1.2万亿,是DeepSeek-R1的两倍左右。规模上,DeepSeek-R2与ChatGPT的GPT-4 Turbo和谷歌的Gemini 2.0 Pro相当。

DeepSeekR2都有哪些爆料 参数与硬件升级

DeepSeek-R2基于华为昇腾910B芯片集群平台进行训练,在FP16精度下实现了512PetaFLOPS的计算性能,芯片资源利用率达到82%。这一算力约为英伟达A100训练集群的91%。由于使用华为昇腾910B训练集群,DeepSeek-R2的单位推理成本相比GPT-4降低了97.4%,每百万token的成本约为0.07美元,而GPT-4则为0.27美元。

当前美国对英伟达H20芯片的断供背景下,采用华为昇腾910B训练集群有助于减少对海外高端AI芯片的依赖。华为全新的昇腾910C芯片也已开始大规模量产,CloudMatrix 384超节点采用了384颗昇腾910C芯片,有望成为英伟达NVL72集群的替代方案,进一步提升我国人工智能领域的硬件自主化水平。

阅读
分享