ITBear旗下自媒体矩阵:

AlphaGo核心人物戴维·席尔瓦创业:绕开大模型,探索强化学习新路径

   时间:2026-02-21 00:03:28 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

前谷歌DeepMind首席科学家、AlphaGo项目核心负责人戴维·席尔瓦(David Silver)近日宣布在伦敦创立人工智能公司"Ineffable Intelligence",引发科技界广泛关注。这家初创企业正推进总额达10亿美元的种子轮融资,规模已接近OpenAI前首席科学家伊利亚·苏茨克维(Ilya Sutskever)创立的Safe Superintelligence(SSI)所创下的融资纪录。

与当前主流的大语言模型技术路径不同,席尔瓦提出要突破现有框架,回归强化学习的本质。他主张构建能够自主探索未知领域的智能系统,而非依赖人类既有知识库。这种技术理念源于其长期研究实践——作为图灵奖得主查理·萨顿(Charlie Sutton)的门生,席尔瓦的学术论文累计被引用超过28万次,2019年更获得ACM计算奖。

2025年4月,席尔瓦与导师联合发表的《欢迎来到经验时代》论文系统阐述了其技术主张。他们认为新一代AI系统应通过持续与环境交互获取经验,而非单纯依赖静态数据训练。这种思路直接体现在新公司的技术方向上:开发能够自我迭代、通过试错积累知识的超级智能系统。

资本市场对这位技术领袖的押注颇具战略眼光。接近交易的投资人透露,10亿美元融资的达成主要基于两点考量:席尔瓦在强化学习领域的权威地位,以及其提出的"后大模型时代"技术路线可能带来的颠覆性突破。当前主流AI模型均采用"预训练+微调"模式,通过海量文本数据学习语言规律,但席尔瓦指出这种路径存在根本性局限——AI的能力上限被人类数据规模所束缚。

在席尔瓦看来,现有技术路线过度依赖人类反馈强化学习(RLHF),导致模型认知水平难以突破评估员的认知边界。"要实现超越人类的智能,必须让AI具备自主探索能力。"他在近期播客节目中强调,"真正的突破需要发现人类尚未掌握的规律。"

科技界正经历显著的技术路线分化。除席尔瓦外,参与AlphaGo项目的多名科学家近期创立Reflection AI,meta则在杨立昆(Yann LeCun)带领下重组"超级智能实验室",探索非Transformer架构的新路径。行业观察家指出,当前局面类似于深度学习爆发前的技术探索期,各大实验室都在寻找突破大语言模型局限的新方案。

不过,强化学习路线也面临现实挑战。批评者认为,该技术在围棋等规则明确的环境中表现优异,但在现实世界这种开放环境中,稀疏的反馈信号和模糊的规则体系可能限制其有效性。完全摒弃语言学习路径意味着需要构建极其复杂的数字孪生系统,其算力需求可能呈指数级增长。

目前,Ineffable Intelligence已在伦敦组建核心团队,并启动全球顶尖强化学习专家的招募工作。虽然尚未公布具体产品时间表,但这家初创企业的技术方向和资源投入,已被视为影响AI技术演进的关键变量。其能否突破现有技术瓶颈,或将重新定义人工智能的发展轨迹。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version