ITBear旗下自媒体矩阵:

华为携手浙大发布DeepSeek-R1-Safe大模型 平衡AI安全与性能新突破

   时间:2025-09-21 13:57:12 来源:小AI编辑:快讯 IP:北京 发表评论无障碍通道
 

在华为全联接大会2025期间,华为技术有限公司与浙江大学共同宣布推出国内首款基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型。该成果由浙江大学计算机科学与技术学院主导研发,其核心创新在于构建了覆盖安全语料构建、训练优化到软硬件协同的全流程安全后训练体系。

项目负责人、浙江大学计算机学院院长任奎教授介绍,研发团队从底层架构突破,首次在昇腾千卡集群上实现千亿参数大模型的完整安全训练。通过开发服务器环境同步、数据权重共享等工具链,系统性解决了大规模训练中的环境依赖难题,为模型安全能力提供了硬件级支撑。

安全性能测试显示,该模型在14类常规有害内容(包括敏感言论、违法诱导等)防御中实现近100%的拦截率,在角色扮演、加密混淆等复杂越狱场景下防御成功率超过40%,综合安全指标达83%。相较于同期Qwen-235B和DeepSeek-R1-671B模型,其安全优势提升8%-15%,同时保持通用能力损耗在1%以内,在MMLU等基准测试中与原始模型性能持平。

中国工程院院士陈纯特别指出,浙大团队依托昇腾生态构建的自主训练框架具有产业示范意义。该成果不仅验证了国产算力平台承载大规模安全训练的可行性,更为AI产业安全发展提供了可复制的技术路径。他透露,研究团队已形成由多位海外引进人才领衔的创新梯队,未来将深化与华为的产学研合作。

华为昇腾计算业务总裁张迪煊在发布现场宣布,伴随新模型推出,昇腾将全面开放编译器、驱动等核心软件组件,通过开源生态建设推动AI安全技术共研。目前DeepSeek-R1-Safe已在ModelZoo、GitCode、Gitee等平台开源,其中Gitee项目地址为https://gitee.com/ZJUsafe/deep-seek-r1-safe,GitHub地址为https://github.com/ZJUAISafety/DeepSeek-R1-Safe。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version