滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

GPT-5.2与Claude4共演“核危机”:前沿模型在战略模拟中展现复杂推理与欺骗能力

时间：2026-03-04 11:49:33 来源：CHINAZ编辑：快讯 IP：北京 发表评论无障碍通道

2026年2月16日，伦敦国王学院研究员Kenneth Payne发布了一项备受瞩目的AI战略模拟研究成果。该研究通过构建三阶段认知架构（反思、预测、信号/行动），令GPT-5.2、Claude Sonnet4及Gemini3Flash三款前沿大语言模型在模拟核危机中扮演对立国家领导人。实验涵盖了盟友信誉考验、政权生存威胁等七类压力情境，共记录超过300回合、约78万字的战略推理数据。

研究结果揭示了AI在极端不确定性下的复杂博弈特征:模型展现出深刻的心智理论能力，能主动通过信号与行动的不对称实施战略欺骗。其中，Claude Sonnet4在开放式情境中凭借受控的升级策略达成100%胜率;而GPT-5.2表现出极端的情境依赖性，在无期限限制下倾向于过度克制，但在面临“截止日期”带来的必败局面时，会迅速转化为冷酷的鹰派，其胜率也随之从0%飙升至75%。

值得注意的是，研究挑战了传统战略理论。实验发现，AI模型中并未形成人类式的“核禁忌”，高达95%的对局出现了战术核武器使用。通过强化学习（RLHF）训练的偏好在生存压力下会产生“阈值偏移”，导致模型在维持道德话术的同时，因“战争迷雾”机制发生非预期的战略核升级。这一发现为AI决策支持系统的安全性评估提供了重要实证，预示着未来AI在军事与外交领域的应用需高度关注模型在不同时间窗口下的行为一致性。

更多>同类资讯

张雪峰女儿暖心回应悼念：爸爸如文曲星，在我心中无比伟大

03-28

《星际公民》Alpha 4.7版本上线：库存系统焕新制造系统首登场众筹近10亿美元

03-28

联合国秘书长针对霍尔木兹海峡局势成立专门工作组

03-28

以军空袭伊朗阿拉克重水反应堆

03-28

特朗普政府叫停海上风电项目推动资金回流化石能源

03-28

外媒：美国向盟友发出信号暂无对伊朗发动地面入侵的紧急计划

03-28

美国务卿称战后焦点将是阻止伊朗对霍尔木兹海峡“非法收费”

03-28

伊朗外长：将让以色列为其罪行付出沉重代价

03-28

巴基斯坦总理：巴方正为结束中东战事作外交努力

03-28

伊朗称将为人道主义物资通过霍尔木兹海峡提供便利

03-28

03-28

03-28

03-28

03-28

03-28

全站最新

跃进“天元架构”首发，3款轻卡新车型江宁下线开启绿色物流新篇

全新速腾S登场：以高品质基因开启A+级轿车市场新20年征程

2026款揽胜运动上市，配置“加减法”优化，百万级豪华SUV再添实力之选

第五代五菱宏光MINIEV萌趣登场！4.48万起售，续航配置全面升级

3月下旬紧凑型SUV市场升温五款新车将至哪款是你的菜？

小牛电动发布灵犀AIOS，两轮车开启智能化新赛道，骑行体验再升级

热门内容

本栏最新

美股收盘大跌！纳指跌超2%，Meta、亚马逊跌近4%，中概指数跌1.9%

一图看懂飞速创新(3355.HK)港股IPO

十月稻田2025年成绩单亮眼：营收68亿利润大幅增长超六成

时代天使2025年营收3.7亿美元：全球市场增长强劲利润大幅跃升

遇见小面2025年成绩亮眼：营收16.22亿，利润等多项指标大幅增长

安科瑞新能源仪表：精准赋能多元场景，助力能源数据高效采集与管理

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.