滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

滑铁卢大学与ServiceNow携手：用人类判断教AI守护隐私边界

时间：2026-06-30 04:02:49 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

当智能助手接管了日程管理、邮件撰写甚至财务查询，用户享受便利的同时，隐私泄露风险正悄然滋生。加拿大滑铁卢大学与ServiceNow AI研究院联合麦吉尔大学、米拉魁北克人工智能研究所的研究团队发现，即便是GPT-5.5、Claude Opus 4.7等顶尖模型，在扮演智能助手时仍有12%-23%的概率将银行余额、报销记录等敏感信息误写入邮件。这项发表于arXiv平台（编号2606.21710）的研究揭示，现有AI系统对"何时该沉默"的判断存在根本性缺陷。

研究团队构建的虚拟场景还原了典型失误案例：某AI助手在撰写赞助申请邮件时，不仅插入了项目支出数据，还将机构活期存款5423.15美元、储蓄账户11789.40美元等无关信息全部披露。这种"上下文隐私泄露"并非黑客攻击所致，而是源于AI对社会关系认知的缺失——它无法理解哪些信息适合分享给基金会工作人员，哪些应当保留给财务部门。社会学中的"情境完整性"理论指出，同样信息在不同场合的敏感性截然不同，但现有AI训练方法尚未将这种动态判断纳入核心框架。

为破解这一难题，研究团队开发了PrivacyAlign数据集与训练框架。该系统通过三步构建真实人类判断：首先利用Qwen3.5、gpt-oss-120b等模型生成1350个包含人物背景、任务需求、敏感信息的虚拟场景；接着由599名来自20国的标注员对AI生成的回应进行三重评估——是否泄露隐私、是否遗漏关键信息、整体质量排序；最终形成包含3516条标注的数据集，其中标注员在"是否泄露"判断上的一致率达78.4%。

实验数据显示，传统字符串匹配方法在判断隐私泄露时存在严重局限。研究团队发现，某AI生成的训练数据中竟有5.1%的条目存在自相矛盾——同一词语既被要求包含又被禁止出现。相比之下，注入人类判断的"标注条件化奖励模型"展现出显著优势：当裁判模型参考人类标注记录后，其判断一致性κ值从0.47提升至0.71，与人类基准线0.62的差距缩小至0.08。这种改进源于人类标注提供的情境化解释，使AI裁判能理解"向医生透露病史"与"向雇主披露病情"的本质区别。

在训练效果验证中，参数量仅40亿的Nemotron-3-Nano-4B模型经过强化学习后，双优率（既不泄露也不遗漏）从19.1%跃升至32.6%，接近Gemini 3.1 Pro的37.3%水平。更关键的是，该模型在独立测试集PrivacyLens上的泄露率从49.3%降至38.3%，与GPT-5.4-mini持平。这种突破得益于新训练框架对人类判断逻辑的深度模拟——评分系统会参考标注员对具体场景的解释，而非简单统计关键词出现频率。

研究同时暴露出当前技术的边界。所有测试场景均由AI生成，可能存在模型偏好导致的偏差；599名标注员虽来自多国，但均需精通英语，难以代表全球文化多样性；参数规模更大的模型尚未进行同等规模训练。这些局限指向未来研究方向：如何构建更包容的文化敏感度评估体系，以及如何在保护用户隐私的前提下获取真实交互数据。

对于企业用户而言，这项研究提供了高性价比的隐私保护方案。相比调用昂贵的前沿大模型，经过隐私对齐训练的小模型既能降低部署成本，又能将泄露风险控制在可接受范围。个人用户则需警惕：当赋予AI助手更多数据访问权限时，应优先选择通过人类判断验证的训练框架，避免将敏感信息暴露于缺乏情境认知的算法之中。

更多>同类资讯

万卡时代破局：中国算力以系统优化突围，重构下一代算力底座

06-30

欧盟新规落地：强化AI监管，严令禁止生成色情私密内容并推迟部分合规时限

06-30

具身智能照进现实：大晓机器狗在上海西岸开启全天候智能守护新篇

06-30

惠普携手OpenAI深化合作：全球业务全面融入Frontier平台促转型升级

06-30

中国移动再布局：设立Token办公室，引领通信行业迈向移动智能新时代

06-30

全球汽车零部件巨头博世换帅：哈通卸任，菲舍尔接棒谋新局

06-30

酷态科外骨骼机器人招募体验者啦！50个名额，众测后设备免费留

06-30

中国移动成立Token办公室运营商探索AI时代“Token经营”新路径

06-30

2026郑州PLC控制柜新趋势：携君电气技术深耕与多元实践探索

针对郑州地区企业普遍存在的设备改造需求，该公司能够提供从方案设计、图纸深化到设备成套、现场实施的全程服务。郑州携君电气设备有限公司凭借在自动化控制领域的专业积累和对本地行业痛点的理解，在消防控制柜、变频器配套…

06-30

MWC上海2026：拓恳科技陈明谈6G如何赋能异构机器人协同与行业落地

记者：拓恳自研 HiveMind 异构机器人群智操作系统被称为机器人“通用翻译中枢”，这套系统从底层架构上做了哪些独创设计，打破不同厂商机器人的协议、数据、控制壁垒，实现跨品牌即插即用协同？陈明：未来3…

06-30

华为引领体验经营新趋势：核心网创新助力运营商开启价值增长新篇章

武云骥告诉C114，UE Logo在1.0时代主要实现Logo动态变更，从显示运营商名称变为显示VIP或特定套餐标识;目前正在验证的2.0版本则更进一步，用户下拉Logo即可查看当前可获得速率、体验MOS值…

06-30

iPhone 18 Pro芯片架构曝光：WMCM封装革新，或9月8日携折叠屏登场

早在去年就有报告认为，苹果将在 iPhone 18 系列的 A20 芯片上首次采用台积电 2nm（N2）工艺，并引入一种全新的WMCM（晶圆级多芯片模块）封装技术。在 iPhone 17 Pro 及之前的…

06-30

图灵奖得主Joseph Sifakis出任曹操出行首席科学顾问

06-29

豆包手机每月自动发放68元会员额度全端通用

06-29

知乎毕业季线下展落地THE BOX朝外：聚焦AI时代毕业生的艺术与自我

06-29

点击查看更多 +

全站最新

TMC2026聚焦电驱油低粘化，陶氏携新技术与行业共探动力系统新未来

玛莎拉蒂新动向：手动挡或重现，V8引擎重启在评估，燃油混动双布局

比亚迪元UP焕新升级：续航达505Km，能否成为年轻人出行代步新宠？

电车电池健康度自查攻略：3种零成本方法，在家1分钟搞定无需跑门店

DS推出新款DS N7 E-Tense纯电SUV 多种动力续航可选充电高效

比亚迪大汉实车亮相！大型车身搭配双动力，纯电续航有望突破千公里

热门内容

本栏最新

晟兴电话机器人助力资料补全：小步试跑精准优化，让人机协作更高效

晟兴电话机器人通知确认：把握语气要点，做好场景规划与细节优化

股东会亮出“价值底牌”，长城汽车引领行业跳出“销量陷阱”

华为杨扬：借AI焕新产品服务携手各方推动Token经营价值提升

东风奕派M8正式开启预售！大六座布局+华为科技加持，19.98万起售

东风奕派M8开启预售：大六座SUV新选择，纯电增程双版本来袭

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.