滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

宾大新研究：大型语言模型易受心理技巧诱导，AI安全面临新挑战

时间：2025-08-31 17:43:09 来源：ITBEAR编辑：快讯 IP：北京 发表评论无障碍通道

近期，宾夕法尼亚大学公布了一项针对大型语言模型（LLMs）安全性的深入研究，揭示了这些尖端AI系统易受人类心理操纵技巧影响的惊人事实。研究发现，即便是最先进的AI模型，在面对与人类相同的心理诱导策略时，也会执行违规指令。

这一发现表明，LLMs的行为模式深受人类语言和知识训练的影响，展现出强烈的“类人性”。正如研究论文所述，AI仿佛将自己视为人类，因此同样无法抵御这些心理技巧。尽管OpenAI等公司已经采取了一系列预防措施，如系统提示和内容过滤，以阻止AI回应危险请求，并强调从一开始就教导AI分辨对错，但LLMs的本质属性——作为概率模型的不确定性——使得现有的安全机制难以全面覆盖所有潜在漏洞。

值得注意的是，研究还发现，这些心理技巧不仅能够诱导AI犯错，同样也能被用来优化AI的输出。论文提出，那些能够激发人类动力、提升表现的心理学方法，或许同样能够帮助用户从LLMs那里获得更高质量的结果，为用户提供了一种“优化指南”。然而，这一发现也引发了对于AI安全性的更深层次担忧。

当前，AI安全领域已经面临着诸多挑战，如Anthropic调整数据政策所引发的隐私争议等。此次发现的“心理操纵漏洞”，无疑为AI安全增添了新的难题。如果有人利用这些技巧诱导AI生成炸弹制造方法或恶意代码，现有的防御体系可能难以完全有效拦截。这也促使业界重新审视现有的安全策略：仅仅依靠过滤和提示，是否真的能够守护住AI的安全底线？

更多>同类资讯

OpenAI推出GPT-5.1：智商情商双提升个性交互更贴心

用户还可在设置中精准微调AI特征，包括回答的简洁度、热情度、易读性及表情符号使用频率。针对AI拟人化可能带来的风险，GPT-5.1在安全评估中首次纳入“心理健康”与“情感依赖”两大维度，重点评估对用户孤立…

11-14

2026武汉国际智能工业展9月启幕，聚焦智能控制系统赋能工业未来

作为华中地区智能制造领域的标杆展会，本届博览会特别强化对智能控制系统板块的深度呈现，涵盖PLC（可编程逻辑控制器）、SCADA（数据采集与监控系统）、伺服电机、传感器、执行器、人机界面、嵌入式系统、工业电源…

11-14

“杀价式择偶”为何在当代失灵？新时代两性关系新逻辑解读

11-14

贝索斯蓝色起源“新格伦”火箭首秀NASA任务，助推器成功着陆开启太空新篇

11-14

Mozilla发力AI领域：Firefox火狐浏览器将推独立AI窗口，用户可自选模型

11-14

存储芯片价格看涨，可控核聚变13.45亿招标加速迈向工程示范新阶段

11-14

蓝色起源“新格伦”火箭首秀NASA任务，助推器回收开启深空探索新篇

11-14

蓝色起源“新格伦”火箭首秀告捷，送NASA探测器升空并实现助推器回收

11-14

普利特积极布局：改性材料助力人形机器人多部件应用开发验证

11-14

贝索斯蓝色起源“新格伦”火箭首飞NASA任务成功助推器着陆开启太空竞争新篇

11-14

GPT-5.1更新测评：指令遵循“掉链子”，情感回应“没温度”，OpenAI新招能否破局？

11-14

贝佐斯蓝色起源迈关键步：新格伦火箭首执NASA任务且助推器成功着陆

11-14

美国蓝色起源“新格伦”火箭二度发射，携NASA火星探测器成功升空

11-14

中国科研影响力七年跃升，中科院三连冠领跑全球科研机构榜单

11-14

“新格伦”火箭二次发射成功搭载火星探测器并首实现第一级海上回收

11-14

点击查看更多 +

全站最新

雷军力推小米YU7安全设计：一体化压铸+高刚度车身引领行业新方向

雷军重申小米YU7安全承诺：创新压铸与高刚车身共筑安全出行新标杆

雷军重申小米YU7安全理念：创新压铸与高刚车身共筑安全出行新屏障

长安马自达EZ-60央视首秀：中国智造领航，全球标准赋能新能源新篇章

1700万订单见证实力！中国萝卜快跑领跑全球自动驾驶新赛道

长安马自达EZ-60央视首秀获权威背书 “中国智造”以全球标准开启新能源新篇

热门内容

本栏最新

全新坦克400多版本上市，潮酷设计引都市青年追捧，开启多元越野生活

全新坦克400正式登场，24.98万起售，四款动力满足多元需求！

起亚Telluride测试车披"艺术伪装"亮相，创意彩蛋致敬命名地

30万级6座SUV新角逐：2026款腾势N8L与理想L8，谁更合家庭心意？

远程湘潭基地智能制造赋能超级VAN，推动新能源商用车产业高质量发展

每日一书

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.