st
指数
  • 富时隆综指1,516.79-1.330-0.09%
  • 富时10011,123.69-4.670-0.04%
  • 富时全股项11,355.34-7.490-0.07%
分享

全部用华为芯片 传DeepSeek R2于5月发布

- 文 +
DeepSeek

DeepSeek

(新华社)

(北京30日讯)年初,由中国企业深度求索推出的大模型DeepSeek R1震动了美国AI圈,甚至引发英伟达股价大跌。如今,在中美AI竞争持续升温的背景下,市场传出消息称性能更强的新版本DeepSeek R2即将于5月发布,且将完全摆脱对英伟达芯片的依赖,全面采用华为昇腾910B(Ascend 910B)芯片。

据快科技报道,R2将采用更先进的混合专家模型(MoE),总参数量预计达到1.2万亿,是前代R1(6710亿参数)的近一倍。相较于GPT-4,其单次推理成本大幅下降,降低幅度高达97.4%。

目前中美科技与贸易冲突不断升级,英伟达H20芯片面临新一轮出口限制。在DeepSeek R2即将登场之际,各界密切关注这款中国代表性大模型,在缺乏美国产芯片支援下的技术突破与发展趋势。

传闻指出,R2在规模上与OpenAI的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相当,并将引入更智能的门控网络层(Gating Network),进一步提升高负载推理任务的执行效率。

值得注意的是,R2整个训练过程未使用英伟达GPU,而是基于华为昇腾910B芯片集群平台,采用FP16精度时计算性能可达512 PetaFLOPS,芯片利用率高达82%,整体性能达到英伟达前代A100集群的约91%。

业内预计,R2的发布将进一步降低中国对海外高端AI芯片的依赖。同时,华为全新一代的昇腾910C芯片也已进入大规模量产阶段。

在成本方面,DeepSeek R2的推理成本极具竞争力:每百万字符的输入成本仅为0.07美元,输出仅为0.27美元,远低于现有国际主流模型。

分析指出,若R2表现如市场预期,将再次引发外界对AI基础设施依赖性的讨论,而基于华为AI芯片的国产替代方案,也可能对英伟达构成更大的挑战。

新闻来源:世界新闻网


相关新闻

中国
华为
人工智能
芯片
英伟达
DeepSeek