
DeepSeek
(新华社)(北京30日讯)年初,由中国企业深度求索推出的大模型DeepSeek R1震动了美国AI圈,甚至引发英伟达股价大跌。如今,在中美AI竞争持续升温的背景下,市场传出消息称性能更强的新版本DeepSeek R2即将于5月发布,且将完全摆脱对英伟达芯片的依赖,全面采用华为昇腾910B(Ascend 910B)芯片。
据快科技报道,R2将采用更先进的混合专家模型(MoE),总参数量预计达到1.2万亿,是前代R1(6710亿参数)的近一倍。相较于GPT-4,其单次推理成本大幅下降,降低幅度高达97.4%。
目前中美科技与贸易冲突不断升级,英伟达H20芯片面临新一轮出口限制。在DeepSeek R2即将登场之际,各界密切关注这款中国代表性大模型,在缺乏美国产芯片支援下的技术突破与发展趋势。
传闻指出,R2在规模上与OpenAI的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相当,并将引入更智能的门控网络层(Gating Network),进一步提升高负载推理任务的执行效率。
值得注意的是,R2整个训练过程未使用英伟达GPU,而是基于华为昇腾910B芯片集群平台,采用FP16精度时计算性能可达512 PetaFLOPS,芯片利用率高达82%,整体性能达到英伟达前代A100集群的约91%。
业内预计,R2的发布将进一步降低中国对海外高端AI芯片的依赖。同时,华为全新一代的昇腾910C芯片也已进入大规模量产阶段。
在成本方面,DeepSeek R2的推理成本极具竞争力:每百万字符的输入成本仅为0.07美元,输出仅为0.27美元,远低于现有国际主流模型。
分析指出,若R2表现如市场预期,将再次引发外界对AI基础设施依赖性的讨论,而基于华为AI芯片的国产替代方案,也可能对英伟达构成更大的挑战。
新闻来源:世界新闻网