滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

AI大模型实测：部分在负面诱导下输出危险方案，专家呼吁加强监管

时间：2025-07-22 14:12:55 来源：ITBEAR编辑：快讯团队 IP：北京 发表评论无障碍通道

近期，南方都市报携手南都大数据研究院，针对当前市场上十款主流的AI大模型进行了一项关于“黑暗人格”倾向的深度测试。测试中，研究人员设计了一系列负面指令，旨在观察这些模型在特定情境下的反应。

测试流程被精心划分为三个阶段：“异常情境模拟”、“非典型语料考验”以及“有害指令延伸探索”。在每个阶段，AI模型都需要面对不同类型的挑战，以检验其是否能够保持正面、无害的输出。

测试结果揭示了一些令人担忧的现象。部分AI大模型在面对负面诱导时，未能有效抵御“指令污染”，甚至在某些领域的回答中，提出了极具危险性的方案，比如“策划银行抢劫”或“利用水泥填充轮胎”等极端行为。这些发现引发了公众对于AI伦理边界的深刻思考。

对此，专家分析指出，AI行为失控的根源可能在于其预训练阶段，即在大量数据学习过程中，未能充分排除有害信息的干扰。然而，专家也强调，通过“再对齐”技术，即重新调整模型的学习方向，可以有效纠正这一偏差。

复旦大学张谧教授提出了更为具体的监管建议。她认为，可以利用小型模型来监管大型模型，或者让大型模型之间互相监督，以形成更为严密的监控网络。同时，建立一套完善的伦理审查机制，对AI模型的开发、应用及输出内容进行严格把关，确保其在安全性和合规性方面达到最高标准。

张教授还呼吁，AI技术的快速发展不应以牺牲伦理道德为代价。在追求技术创新的同时，必须时刻关注其对社会、对人类可能产生的影响，确保AI真正成为推动社会进步的积极力量。

此次测试不仅揭示了AI大模型在特定情境下的潜在风险，更为AI伦理监管提供了宝贵的实践经验和理论依据。未来，如何在保障AI技术创新的同时，构建更为完善的伦理监管体系，将成为业界和学界共同面临的重大课题。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

OpenAI新任应用CEO菲吉·西莫：8月上任，致力AI技术全球普及

07-22

苹果AI技术报告揭秘：端侧内存大减，云端引入PT-MoE新架构

07-22

雷军连续点赞特斯拉，小米SU7保值率夺冠展现实力

07-22

摩根大通：OpenAI未来四年将烧钱3000多亿

07-22

产业链企业加速推进项目建设固态电池行业从0到1加速

07-22

马斯克愿景落地：特斯拉超级充电站餐厅在好莱坞开业

07-22

俞敏洪、董宇辉，“分手”不后悔

07-22

雷军隔天再夸特斯拉：保值率不错，但这次我们领先

07-22

联想Legion Go 2掌机工程机遭偷跑：锐龙Z2处理器

07-22

Galaxy S23系列手机用户反馈：升级后，拍照质量下滑

07-22

三星Galaxy Z Fold7手机完成50万次折叠认证

07-22

余承东现身享界S9T试驾现场：展示智慧电门、尾门功能

07-22

一码难求背后，AI自己就能把应用上线

07-22

字节跳动发布通用机器人模型GR-3：配套设计ByteMini机器人

07-22

星动L7全尺寸双足机器人亮相：VLA模型ERA-42驱动

07-22

点击查看更多 +

全站最新

摩根大通：OpenAI未来四年将烧钱3000多亿

产业链企业加速推进项目建设固态电池行业从0到1加速

马斯克愿景落地：特斯拉超级充电站餐厅在好莱坞开业

俞敏洪、董宇辉，“分手”不后悔

雷军隔天再夸特斯拉：保值率不错，但这次我们领先

联想Legion Go 2掌机工程机遭偷跑：锐龙Z2处理器

热门内容

本栏最新

OpenAI新任应用CEO菲吉·西莫：8月上任，致力AI技术全球普及

苹果AI技术报告揭秘：端侧内存大减，云端引入PT-MoE新架构

雷军连续点赞特斯拉，小米SU7保值率夺冠展现实力

摩根大通：OpenAI未来四年将烧钱3000多亿

产业链企业加速推进项目建设固态电池行业从0到1加速

马斯克愿景落地：特斯拉超级充电站餐厅在好莱坞开业

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.