ITBear旗下自媒体矩阵:

开源模型大放异彩!宽德Will联合顶尖高校,让试错成为科研“利器”

   时间:2026-04-26 17:51:48 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

在科学探索的征程中,究竟是依赖“更聪明的大脑”进行深度推理,还是通过高效组织试错与评估来突破极限?近期,宽德智能学习实验室联合斯坦福、清华、北大等顶尖高校发布的一项新研究,给出了一个令人瞩目的答案:一套名为SimpleTES的通用框架,正让普通开源模型在科学发现领域实现“逆袭”。

长期以来,大模型的发展叙事围绕着“更聪明的大脑 + 更深的推理”展开,人们相信凭借强大的模型能力就能逼近真理。然而,宽德智能学习实验室的研究却指出,科学发现的上限,不仅取决于模型的聪明程度,更在于如何巧妙地组织试错与评估。这一观点颠覆了传统认知,为科学探索开辟了新的路径。

宽德智能学习实验室是顶级量化私募宽德投资独立孵化的研究机构,秉持“AI for Good”与长期主义理念,致力于构建服务科学与技术的通用人工智能(ASI)基础平台。该实验室不仅是一个深度融合研究与工业落地的全栈式“创新中枢”,在北京、上海、纽约均设有办公室,还依托顶级算力与数据资源,利用全链路工程实践解决真实挑战,用极致工程水准定义未来的科学发现。

此次研究提出的SimpleTES框架,将试错拆解为三个可调度的维度,并在此基础上实现“测试时扩展”(test-time scaling)。这一创新让开源模型在21项前沿科学任务中表现出色,不仅刷新了多项SOTA(State-of-the-Art,当前最优水平),甚至在数学构造、代码优化等领域反超人类专家和顶级闭源模型。

在寻找使自卷积比R最大化的非负函数f这一任务中,以推理为中心和以评估为中心的方法都因专注于单一轴线的扩展而陷入平台期,增长停滞。而SimpleTES通过四项独立学术突破,实现了双轴协同扩展,达到新的行业领先水平。实验表明,针对不同类型的科学任务,动态平衡三个轴的算力分配,是超越现有SOTA解的关键。

SimpleTES框架的核心在于将试错、探索转化为一套可调度、可扩展、可优化的计算流程。它包含三个关键维度:并行度(Concurrency,C),即同时启动多少条独立轨迹进行探索;轨迹深度(Length,L),每条轨迹走多深;候选数量(K-candidates,K),每一步生成多少候选解。通过精细分配算力,将资源从单纯堆砌模型能力转移到优化搜索成本上,使科学发现从“灵光一现”转变为可系统性放大的过程。

在具体操作中,SimpleTES框架展现出独特优势。在并行探索方面,同时启动多条独立轨迹,避免因开局方向选择错误而导致全盘皆输,在复杂科学问题中先“看得更广”再“想得更深”。在迭代改进上,每条轨迹在评估器的驱动下持续迭代,评估器不仅是“打分器”,更是“方向控制器”,通过反馈微调搜索路径,将模型推向更优解。在局部筛选环节,每一步生成多个候选解,只保留最优的,在局部进行“小进化”,避免劣质解影响后续轨迹。

面对历史轨迹增多、上下文装不下的难题,SimpleTES框架将历史当作“资源池”,而非“记录”。引入类似UCB策略的RPUCG,优先选择高分或曾启发出好结果的节点,同时给低频节点加探索补偿,在prompt层进行“探索-利用权衡”,避免搜索过早收敛到局部最优。

SimpleTES框架还解决了AI在科研决策中的短视问题。传统方法优化每一步的奖励,使模型越来越保守,而科学发现需要允许早期“走弯路”。该框架采用Trajectory-Level Post-training方法,以整条轨迹的最终最好结果作为监督信号,只保留精英轨迹,截断无效后缀,用replay buffer累积经验,让模型学会选择更可能成功的探索路径,形成接近“科研直觉”的能力。

在六大领域、21个科学问题上,SimpleTES框架展现出强大实力。在算法工程领域,对于LASSO路径求解这一统计学、生物信息学和金融建模中广泛使用的算法,SimpleTES在保证精度完全一致的前提下,平均比标准解法glmnet快2.17倍,比sklearn快14倍以上。它演化出一套按问题结构动态切换的混合解法,根据问题所处几何区间选择不同算法,使算法设计成为可大规模试错搜索的内容。

在量子电路编译领域,量子比特路由任务要求在保证所有操作可执行的前提下,尽量减少SWAP数量。这是一个长程组合优化问题,目前主要由顶尖科学家设计的启发式算法处理。SimpleTES在不同量子计算机平台架构上展现出强大编译优化能力,在超导架构上比经典算法SABRE提升21.7%,比改进版LightSABRE提升14.9%,在IBM Q20实例上将SWAP门开销降低24.5%;在分区中性原子架构上,使36个多样化电路的平均执行时间缩短33.2%,稳定提升绝大多数测试用例表现。

在数学极值分析领域,Erdős最小重叠问题是一个典型的极值构造难题,搜索空间巨大且崎岖。人类和现有AI基本都卡在0.38087附近,而SimpleTES将结果推进到0.380868,甚至在额外搜索中达到0.380856。这一提升主要来自搜索过程本身的高效,而非模型大小。

不过,SimpleTES框架并非没有边界。其能力本质上受评估器限制,在评估昂贵、主观或依赖真实世界反馈的领域会变得吃力。三个维度的算力分配目前还需手动调节,不同任务和阶段的最优分配不同,理想状态是系统能根据搜索进展动态调整。该框架天然适合“有连续分数”的世界,在定理证明等离散场景中,因缺乏细粒度反馈,搜索信号可能模糊甚至误导方向。

目前,基于SimpleTES方法构建的试用平台已在相关官网上线,人们可申请加入等待名单,率先体验这一全新的科研范式。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version