近日,科技领域因两则关于人工智能(AI)发展的消息引发广泛关注。先是网络上流传一篇“2028年预测”文章,称因AI进步,2028年将出现大规模失业潮,许多人工作会被AI取代。该文章发布恰逢中东局势紧张,导致当天美国股市大幅下跌。尽管文章疑似由AI生成,却精准击中了人们对“AI致大失业”的担忧,产生了巨大影响。随后,OpenAI公布的一则消息,让“2028年大失业”的猜测似乎有了更多现实依据。
OpenAI首席科学家雅各布·帕乔基(Jakub Pachocki)在接受《麻省理工科技评论》独家专访时透露,公司的“北极星”目标是在2028年前建成一套全自动多智能体研究系统。今年9月,这一目标的第一阶段将落地,即推出能独立处理特定研究问题的“自主AI研究实习生”。这并非产品路线图中的空想,也不是公司高层的随意表态,而是OpenAI正集中公司资源全力推进的方向。
科技公司设定“北极星”目标,通常意味着其他事务要为其让步,且公司内部已达成高度共识。从近期OpenAI的一系列动作来看,这一判断得到了印证。3月19日,OpenAI宣布收购开发者工具公司Astral,将其团队并入Codex部门;同时,公司宣布整合ChatGPT、Codex和浏览器,打造统一的桌面“超级应用”,由应用主管菲吉·西莫(Fidji Simo)主导,格雷格·布罗克曼(Greg Brockman)协助推进组织改革。这表明OpenAI正结束碎片化产品时代,将所有资源聚焦于“让AI自己做研究”这一方向。
在OpenAI宣布“北极星”目标当天,另一家AI公司Anthropic也有了新动作,悄悄上线了Claude Code Channels功能。该功能允许开发者通过Telegram和Discord直接与正在运行的Claude Code会话交互。这一举措看似微小,实则意义重大。Anthropic的思路是,与其向开发者描绘AI的未来潜力,不如让它直接融入开发者日常工作流程。Telegram和Discord是程序员每日工作的常用平台,让Claude Code活跃其中,意味着它从单纯的“工具”转变为“同事”。社区用户的反馈也印证了这一点,有用户称“Claude通过这次更新让OpenClaw失去优势,不再需要购买Mac Mini”,这表明Anthropic的基础设施改进已使开源替代方案失去成本优势。从时间线看,Anthropic在Claude Code上的迭代速度惊人,短短数周内就融合了文本处理、数千个MCP技能集成和自主bug修复能力。OpenAI通过收购补强Codex时,Anthropic已将Claude Code送进开发者聊天窗口。两家公司虽目标一致,但路线不同,OpenAI聚焦“2028年的全自动研究员”,Anthropic则致力于打造“当下可用的智能体工具”。
然而,实现这一目标并非一帆风顺。帕乔基在专访中罕见地主动提及安全和可控性挑战,且十分坦诚。他表示,公司计划用其他大语言模型“监控AI研究员的便签”,在行为出现问题前捕捉不良行为,但同时承认“对大语言模型的理解程度不足以完全控制它们,要真正解决问题还需很长时间”。一家公司首席科学家承认尚未完全掌握控制力,却宣布要在2028年推出全自动AI研究系统,这一矛盾值得深思。这也反映出OpenAI内部对这条道路的艰难有清醒认识。
从技术层面看,研究者总结的“卡帕西循环”提供了参考。该循环指出,成功的自动化AI研究框架需具备三个要素:能修改单个文件的智能体、可客观测试的单一指标以及固定的实验时间限制。这一框架已在实际环境中取得成果,Shopify首席执行官托比亚斯·吕特克(Tobias Lütke)公开分享案例,其让autoresearch智能体在夜间运行,第二天早上,智能体完成37次实验,将模型性能提升19%。这表明从概念到落地,这一过程比想象中更近。
“北极星”项目不仅是技术突破,更是商业竞争的关键。保罗·罗特泽(Paul Roetzer)援引OpenAI内部预测数据称,到2029年,智能体业务年收入可达290亿美元,其中包括月费2000美元的“知识代理”和月费2万美元的“研究代理”。月费2万美元的“研究代理”,价格仅为资深研究员年薪的几分之一,却能24小时不间断工作,同时运行37个实验。这并非简单替代某个人,而是重新定义“研究生产力”。这也印证了卡帕西所说的“最终的BOSS战”,这里的“BOSS”并非竞争对手,而是AI能力的天花板。一旦AI能自主推进科学研究,其进步速度将不再受人类研究员数量和工时的限制。帕乔基也表达了类似观点,只是表述更为谨慎,他称“一旦系统能在数据中心长时间自主运行,这将是我们真正依赖的东西”。2026年9月将推出的AI研究实习生,只是一个重要起点。








