ITBear旗下自媒体矩阵:

360《大模型安全白皮书》发布:筑牢安全防线 护航AI稳健发展

   时间:2025-11-09 15:42:56 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

在世界互联网大会乌镇峰会期间,三六零数字安全集团正式发布《大模型安全白皮书》,为人工智能行业安全发展提供系统性解决方案。该白皮书首次梳理大模型运行中的五大核心安全风险,提出“外筑动态屏障、内固安全底座”的创新防护理念,通过实战经验构建覆盖全链路的安全防护体系。

白皮书指出,随着大模型深度融入百行千业,传统网络安全边界加速消融。2025年国内首次AI大模型实网众测发现281个安全漏洞,其中大模型特有漏洞占比超60%,攻击门槛显著降低,“全民黑客”时代来临。面对这一态势,中国探索出“发展与安全并重”的治理路径,以《生成式人工智能服务管理暂行办法》为框架,实现技术创新与风险防控的动态平衡。

大模型运行时安全风险呈现多维特征。白皮书系统梳理出基础设施安全、内容安全、数据与知识库安全、智能体安全、用户端安全五大关键风险点。其中,智能体失控、API接口滥用、隐私泄露等新型威胁,传统安全方案难以有效应对。例如,攻击者可通过自然语言指令绕过常规防护,对模型进行恶意操控。

针对新型威胁,白皮书提出“以模治模”与“平台原生”双轨防护策略。前者如同“动态免疫系统”,通过大模型间的对抗训练实现主动防御;后者则如“基因编码”,将安全能力深度植入模型架构。四大实施原则——安全防护、向善引导、可信提升、可控管理,构成技术治理的顶层设计。

在技术落地层面,360推出“外挂式+平台原生”双轨解决方案。外挂式安全体系包含算力主机防护、检测系统、防护系统、幻觉缓解四大产品,形成从算力层到内容层的实时监测网络。平台原生安全则通过企业级知识库、智能体运营平台、智能体客户端三大产品,解决数据泄露、行为失控等内生性问题。

实战数据显示,该体系可有效应对算力劫持、供应链投毒等基础设施风险,以及提示词注入、模型幻觉等内容风险。例如,在某金融大模型防护中,系统成功拦截97.3%的恶意指令攻击,幻觉内容发生率降低至0.8%以下。

生态共建成为白皮书强调的另一重点。360深度参与《GB/T 45654-2025网络安全技术 生成式人工智能服务安全基本要求》制定,与北京大学联合研发的TinyR1-32B模型在安全能力评估中超越多个主流模型。通过发起大模型安全联盟,已在工信部人工智能公共服务平台为100余家企业提供安全测试服务。

这份覆盖安全边界演变、威胁全景、防护策略、解决方案及生态共治的五章报告,标志着大模型安全治理进入体系化建设阶段。360提出的“安全-向善-可信-可控”发展框架,为行业提供了从理论到实践的完整路径,推动人工智能技术向更稳健的方向演进。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version