滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

AI预测专家坦言低估进展：AI研发自动化或于今年取得关键突破

时间：2026-03-10 11:04:53 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

知名AI预测研究者Ajeya Cotra近日对其两个月前发布的2026年AI发展预测作出重大修正，承认当前AI技术突破速度远超预期。这一调整源于Anthropic公司最新模型Claude Opus 4.6在权威评测机构METR基准测试中的突破性表现——该模型在软件工程领域的"时间跨度"指标达到12小时，较Cotra原预测的2026年底24小时水平提前近十个月实现。

METR测试数据显示，在19项预计人类需耗时8小时以上的软件工程任务中，Opus 4.6能部分完成14项并稳定攻克4项。Cotra坦言，考虑到距离2026年底仍有十个月发展期，原预测模型中AI代理在24小时任务上失败率仍达50%的假设已失去参考价值。她特别指出，当前时间跨度估算存在显著不确定性，Opus 4.6的95%置信区间横跨5.3至66小时，这主要受制于长任务样本稀缺、人工耗时估算误差以及基准测试接近理论极限等因素。

随着AI处理能力突破数十小时任务量级，传统评估框架正面临严峻挑战。Cotra分析指出，任务可分解性随规模扩大呈现指数级提升：小时级调试任务难以拆分，日级开发任务可分工但边界模糊，而月级项目则天然适合分解为并行子任务。其同事Tom提出，应采用大型团队完成项目所需的日历时间替代单人工时作为难度指标，因为当AI稳定处理80小时任务时，理论上可通过"管理层AI"分配任务、"执行层AI"并行作业的方式推进任意规模项目。

尽管承认大规模任务分解存在局限性——如项目参与者对全局背景的直觉把握难以被任务管理系统完全替代，但Cotra认为这种模式对特定类型软件项目可能产生超预期效果。她特别强调，随着AI进入新能力量级，传统"单人时间"指标可能呈现超指数增长趋势，导致年底前软件工程能力上限难以预估。

在所有修正内容中，Cotra对"AI研发全面自动化"的概率判断引发行业震动。她将该概率定义为AI系统独立承担研究构想与实施的全过程，此前1月预测中给出的10%概率曾遭多位同行质疑过高。但Opus 4.6的表现使其重新确认该数值的合理性，尽管她同时强调，全面自动化需要AI在研究判断力和创造力等关键领域取得突破，这些恰是当前系统相对人类研究者的明显短板。

这位供职于METR机构的前Coefficient Giving安全研究资助负责人表示，虽然认为AI研发全面自动化在未来三至五年内实现的可能性远高于今年，但其预测立场已发生根本性转变："我首次无法找到可靠趋势线，来支撑'这不会很快发生'的判断。"这种表述与她年初"2026年底前不太可能实现重大突破"的论断形成鲜明对比，折射出AI技术发展对专业预测体系的持续冲击。

更多>同类资讯

AI短剧浪潮下：从观望到行动，技术与创意如何共舞？

05-29

新型“分子时钟”捕捉衰老动态或为延长寿命提供新靶点图谱

05-29

引力波“宇宙藏宝图”再扩容三大突破解锁黑洞演化新谜题

05-29

资金出逃与疯狂“抄底”同时上演，ST板块极端分化

05-29

闪迪CTO：AI竞赛正变成“拼内存” HBF成套产品明年推出

05-29

人民币兑美元中间价调升64点续创2023年2月以来新高

05-29

SpaceX据称将IPO估值目标下调到至少1.8万亿美元

05-29

联想在天津投建新一代AI算力研发制造中心

05-29

中际旭创站上1200元股价创历史新高

05-29

花园生物(300401.SZ)：公司暂无杀虫剂相关产品

05-29

东田微(301183.SZ)：隔离器已批量出货

05-29

派克SCPSDI-250-04-27压力传感器：多领域适配，助力工业流体系统智能升级

派克SCPSDI-250-04-27压力传感器是集成监测、反馈与控制于一体的智能化工业传感元件，凭借优异的环境适配性与信号稳定性，可适配各类复杂工业工况，为流体控制系统提供精准、实时的压力数据支撑，助力设备实…

05-29

华竣设计：以克制美学融合科技人文，智慧城市展厅讲述梅州特色故事

展厅的背景大屏循环播放的梅州城市风光，与顶部的数字地球投影装置形成巧妙对话：宏观的全球数字浪潮，最终落点于梅州的街巷、河流与社区，让参观者瞬间理解智慧技术不是外来的舶来品，而是服务于梅州城市治理、民生改善的…

05-29

Oura Ring 5 发布：尺寸缩小 40%，健康追踪与医疗数据功能全面升级

05-29

三星电子开始出货业界首款HBM4E样品

05-29

点击查看更多 +

全站最新

Rivian软件负责人：AI引领车机变革，整合CarPlay已非当下所需

鸿蒙智行尊界S800 Grand Design典藏大观开启预订，6月下旬上海发布预售价160万起

全新吉利星愿6.18万起售，以空间巧思重塑A0级车体验新标杆

2026款福特烈马亚马逊限量版来袭！原厂涉水喉+2.3T+10AT，硬核越野新选择

鑫源RL525全新ADV天津展亮相，原创设计配置丰富，价格成最大悬念！

法拉利Luce纯电超跑登场：435万售价，是颠覆传统还是另辟蹊径？

热门内容

本栏最新

迅雷2026年Q1财报亮眼：总营收同比增54.1%，出海业务成新增长极

云桌面系统：破解物业IT运维难题，实现高效便捷数字化管理新路径

新能安与张雪机车高层接洽合作，锂电池巨头跨界机车领域引关注

豪沃TX新能源搅拌车交付天津赋能区域基建共绘绿色工程运输新画卷

豪沃TX新能源搅拌车交付天津赋能区域绿色基建绘就低碳新画卷

OpenClaw崛起：自主智能体浪潮来袭，2026发展蓝图与未来机遇展望

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.