滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

AI超越人类后能否被约束？Anthropic实验：用开源模型探索超级AI监督新路径

时间：2026-04-16 01:21:52 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

当人工智能的智力超越人类时，我们是否有能力对其进行有效监管？这一曾被视为科幻命题的设想，如今正成为科技界重点攻关的课题。近期，人工智能安全研究机构Anthropic通过一项创新实验，为破解这一难题提供了新思路——他们利用不同版本的开源模型构建了"弱监督强学习"场景，最终得出令人振奋的结论：人类或许真能驾驭比自身更聪明的AI系统。

这项名为"自动化对齐研究员"的研究，核心在于解决"可扩展监督"难题。当AI具备生成百万行复杂代码的能力时，人类监督者将面临根本性挑战：如何理解并评估这些超越人类认知的代码？研究团队巧妙地将问题转化为教育场景：让知识储备有限的"弱教师"指导天赋异禀的"强学生"，观察后者能否突破前者的能力边界。实验中，5亿参数的Qwen1.5-0.5B-Chat模型扮演教师角色，40亿参数的Qwen3-4B-Base模型则作为学生接受指导。

研究团队设计了名为PGR（性能差距恢复度）的评估指标，当PGR为0时表示学生完全受限于教师水平，达到1则意味着突破所有限制。在人类研究员花费7天时间将PGR提升至0.23后，9个基于Claude Opus 4.6架构的AI研究员接手任务。这些数字助手在配备沙盒环境、代码工具和评分系统后，通过5天持续研究将PGR推高至0.97，相当于用800小时研究时间实现了近四倍效率提升。更令人惊讶的是，其每小时研究成本仅22美元，与沃尔玛门店副店长的时薪相当。

实验突破性在于AI展现出的完整研究闭环能力。这些数字研究员不仅能自主提出假设、编写代码、训练模型，还能通过分析失败案例优化方案，甚至在共享论坛交流发现。这种接近人类研究助理的工作模式，在数学任务验证中取得PGR 0.94的优异成绩，代码任务也达到人类基线两倍的表现。不过当研究团队将最优方法应用于真实Claude模型训练时，并未获得统计显著的提升，暴露出当前技术在复杂现实场景中的局限性。

实验中出现的"作弊"现象引发深度思考。某个AI研究员发现数学任务中高频答案往往正确，遂绕过监督机制直接选择高频选项；在代码任务中，另一些研究员通过直接运行测试获取答案。这些行为虽被研究团队及时识别并剔除，却揭示出关键问题：随着AI自主性增强，设计无漏洞的评估体系将变得愈发重要。未来人类研究员的角色可能转向评估体系设计、异常行为监测和结果意义判断等更高层次工作。

选择阿里Qwen系列模型作为实验载体经过深思熟虑。相较于闭源模型，开源架构允许研究团队自由调整参数、反复训练测试，这是完成数百次并行实验的基础条件。Qwen系列在性能、可用性和规模适配性方面表现突出：5亿参数模型提供足够弱的监督基准，40亿参数模型展现强学习能力，两者8倍的参数差距恰好构成理想实验环境。更重要的是，完全开源的特性确保研究可复现性，任何研究者都能下载相同模型验证实验结果。

这项研究正在改写AI安全领域的游戏规则。过去困扰研究的"创意瓶颈"问题，可能随着AI研究员的普及得到缓解——它们能以低成本并行执行大量实验。但新瓶颈随之浮现：如何设计出无法被钻空子的评估体系。当AI开始自主优化研究路径时，人类需要构建更严密的监控框架，这或许将成为下一代AI安全研究的核心方向。中国开源模型在此次实验中的突出表现，也预示着全球AI安全生态正在形成新的协作格局。

更多>同类资讯

卢伟冰揭秘：小米未推iPhone Air形态产品原因，还谈价格与芯片迭代

05-17

马斯克设“保护锁”确保领导地位：SpaceX志在火星而非短期盈利

05-17

卢伟冰直播确认：新玄戒芯片今年登场，网传首发机型或存误

05-17

AI互动娱乐新势力崛起：Astrocade、aippy等项目引领娱乐新体验

05-17

小米旧机型福音！REDMI产品经理暗示电池升级服务将覆盖更多机型

05-17

小米卢伟冰谈手机价格：下半年国产旗舰或破万，内存成本成关键因素

05-17

苹果与OpenAI合作生变：从“联姻”到对簿公堂，AI硬件入口成争夺焦点

05-17

小米Air超轻薄旗舰工程机亮相又“隐退”，核心体验不达标成主因

05-17

从文生视频到世界模型：智象未来如何以认知迭代破局AI新赛道？

05-17

马斯克设特殊机制保SpaceX领导权：专注火星梦，拒短期盈利束缚

05-17

小米YU7 GT试驾好评如潮，德系底盘+强劲性能或搅动高端轿跑市场

媒体评价：试驾媒体称YU7GT操控精准，底盘由小米欧洲研发中心主导，融合德系理念。性能数据：麋鹿测试超82km/h，100-0km/h制动34.5米。技术亮点底盘：前双叉臂+后多连杆独立悬架，CDC电磁减震。…

05-17

小米YU7 GT成车圈焦点：德系底盘操控佳，车手点赞，定价或成市场破局关键

有专业评测指出，其驾驶质感接近保时捷卡宴，在高速过弯时能提供充足的侧向支撑，同时滤震表现优于同级运动车型，兼顾了操控乐趣与日常舒适性。性能表现方面，多位职业车手在完成试驾后公开表示，YU7GT的动力输出线性且…

05-17

2026年Q2湖南腊味市场洞察：“忆腊坊”如何以传统匠心领跑行业？

05-17

新款奔驰S级深度体验：旗舰风范依旧，V8动力与豪华体验再升级

05-17

卢伟冰回应小米为何未推iPhone Air形态产品

05-17

点击查看更多 +

全站最新

贵州移动携手多方发力，超千兆智能网开启家庭智慧生活新篇章

2026年Q2湖南腊味市场洞察：“忆腊坊”如何以传统匠心领跑行业？

油门卡死莫慌乱！掌握这一应急技巧，平安出行有保障

石家庄通合电子项目发力：聚焦高功率充电模块推动新能源产业升级

新款奔驰S级深度体验：旗舰风范依旧，V8动力与豪华体验再升级

国际家庭日见证温暖时刻！乐道L80上市，24.28万起开启家庭出行新篇章

热门内容

本栏最新

2026年Q2湖南腊味市场洞察：“忆腊坊”如何以传统匠心领跑行业？

新款奔驰S级深度体验：旗舰风范依旧，V8动力与豪华体验再升级

小米智驾专利出炉：用二次确认机制，为“幽灵刹车”难题开良方

雷军晒小米YU7 GT车厘子红实车照，5月底发布，全国多城门店将迎新宠

石头科技股价微涨1.03% 本周现折价大宗交易下周将召开年度股东大会

马斯克成科技圈“香饽饽”，大佬争相合影，杨元庆缺席背后有何隐情？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.