st
指数
快讯
分享

华为浙大开发DeepSeek安全版 百分百防御“有害问题”

- 文 +

(北京20日讯)科技巨头联合开发了人工智能模型一款以安全为重点的版本,据称该模型在阻止政治敏感话题讨论方面“成功率近100%”。

周四(9月18日),技术有限公司与联合发布了首个基于升腾千卡算力平台的-R1-Safe基础大模型。

在公司微信公众号上发布消息称,它使用了1000块升腾芯片来训练大语言模型,该模型是根据-R1的开源模型进行调整而来的。

用户在DeepSeek手机客户端上提问。
用户在DeepSeek手机客户端上提问。(新华社)

的发布,测试结果表明,-R1-Safe针对“有毒有害言论、政治敏感内容、违法行为教唆等14个维度的普通有害问题”整体防御成功率近100%。

不过,在针对“情境假设、角色扮演、加密编码等多个越狱模式”时,整体防御成功率降为40%。据称其综合安全防御能力达83%,在同样测试设置下超过阿里云的Qwen-235B 和-R1-671B等多个同期模型8%至15%。

监管机构要求,国内人工智能模型及其支持的应用程序必须体现的“社会主义价值观”,以遵守严格的言论管控。

表示,在通用能力基准测试中,-R1-Safe相比于-R1 的性能损耗在1%以内,这些结果表明-R1-Safe不仅显著提升了安全防护能力,也保障了模型的可用性。

的研发合作伙伴是,也是创始人梁文峰的母校。然而,和梁文峰似乎并未参与该项目。尚未立即回应路透社的置评请求。

今年年初,发布的-R1和V3因其先进程度震惊了硅谷和以外的科技投资者,并引发了1月份美国人工智能股的大跌。

人工智能模型在已被各行各业和社会广泛接受、改进和使用。不过的人工智能聊天机器人,例如百度的“文心一言”(Ernie Bot),拒绝回答许多有关国内政治的问题,并回避那些被执政党认为敏感的话题。

安全版是在上海举行的“全联接大会”上发布的。大会还发布了升腾芯片发展路线图,包括2026年第一季度推出升腾950PR芯片,四季度推出升腾950DT,2027年四季度推出升腾960芯片,2028年四季度推出升腾970芯片。

新闻来源:德国之声

相关新闻

AI
DeepSeek
中国
华为
浙江大学