在华为全联接大会2025期间,华为技术有限公司与浙江大学联合宣布推出国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型。这款模型通过构建全流程安全后训练框架,实现了安全防护能力与通用性能的双重突破,标志着我国在AI安全领域迈出关键一步。
浙江大学计算机科学与技术学院院长任奎透露,研发团队从底层架构入手,创新性地设计了覆盖"高质量安全语料构建-平衡优化安全训练-全链路自主软硬件平台"的三阶段安全体系。该框架首次在昇腾千卡集群上完成千亿级参数大模型的安全训练,开发出服务器环境同步、数据权重共享等协同工具,系统性解决了训练环境中的关键技术难题。
测试数据显示,DeepSeek-R1-Safe在14类常规有害内容防御中成功率接近100%,针对情境假设、角色扮演等复杂越狱模式的防御成功率超过40%,综合安全防御能力达83%。相较于同期Qwen-235B和DeepSeek-R1-671B模型,其安全性能提升8%-15%,同时保持通用能力损耗在1%以内,在MMLU、GSM8K等基准测试中展现出优异表现。
中国工程院院士陈纯特别指出,浙江大学已组建由海内外青年专家构成的科研团队,依托昇腾生态完成国内首次千卡集群大模型安全训练。此次发布的DeepSeek-R1-Safe不仅具备示范应用价值,更将推动AI安全技术与产业生态的深度融合。他期待校企双方在后续研发中开展更紧密合作,共同提升我国AI技术核心竞争力。
华为昇腾计算业务总裁张迪煊在发布会上宣布,华为同步推出新一代AI硬件及全系列软件开源战略,涵盖编译器、运行时驱动等核心组件。通过深度开放协作模式,华为将与高校、产业伙伴共同推进基础软件创新和AI安全能力建设,为行业提供更可靠的技术支撑。
据悉,DeepSeek-R1-Safe模型已在ModelZoo、GitCode、GitHub、Gitee及ModelScope等多个开源社区全面开放。这一举措将加速安全可信AI技术的普及应用,为构建健康发展的AI产业生态奠定基础。