ITBear旗下自媒体矩阵:

华为携手浙大推出DeepSeek-R1-Safe大模型 平衡安全与性能引领AI新发展

   时间:2025-09-21 14:43:20 来源:小AI编辑:快讯 IP:北京 发表评论无障碍通道
 

在华为全联接大会2025期间,华为技术有限公司与浙江大学联合宣布推出国内首个基于昇腾千卡算力平台的基础大模型——DeepSeek-R1-Safe。该模型由浙江大学计算机科学与技术学院牵头研发,重点聚焦大模型安全防护能力的突破性创新。

据浙江大学区块链与数据安全全国重点实验室常务副主任任奎介绍,研发团队构建了覆盖数据语料、训练框架到硬件平台的全流程安全后训练体系。通过自主研发的高质量安全语料库与平衡优化训练算法,结合昇腾千卡算力平台,首次实现了千亿级参数大模型的安全满血训练。团队开发了服务器环境同步、数据权重共享等协同工具,系统性解决了分布式训练中的环境依赖难题。

安全性能测试显示,该模型在14类常规有害内容防御中实现近100%的拦截率,对情境假设、角色扮演等复杂越狱攻击模式的防御成功率超过40%,综合安全指标达到83%。相比同期Qwen-235B和DeepSeek-R1-671B模型,其安全性能提升8%-15%,同时保持通用能力基准测试(MMLU、GSM8K等)性能损耗低于1%,实现了安全防护与模型效能的平衡优化。

中国工程院院士陈纯指出,浙江大学已组建跨学科科研团队,依托昇腾生态完成自主后训练框架开发,并实现国内首次千卡集群大模型安全训练。此次发布的DeepSeek-R1-Safe不仅验证了技术可行性,更为产业界提供了安全可信的大模型应用范式。他强调,高校与企业的深度协作对推动AI技术安全发展具有重要意义。

华为昇腾计算业务总裁张迪煊在会上同步发布新一代AI硬件战略及全栈软件开源计划,涵盖编译器、驱动等核心组件。通过开放协作模式,华为将联合高校及产业伙伴加速基础软件创新,重点提升AI系统的安全可控能力。该战略与浙江大学的安全大模型研发形成技术协同,共同构建安全可信的AI产业生态。

目前,DeepSeek-R1-Safe已在ModelZoo、GitCode、GitHub、Gitee及ModelScope等开源社区全面开放。开发团队通过Gitee(https://gitee.com/ZJUsafe/deep-seek-r1-safe)和GitHub(https://github.com/ZJUAISafety/DeepSeek-R1-Safe)平台提供完整代码库与技术文档,支持全球开发者参与模型优化与安全研究。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version