滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

开源模型大放异彩！宽德Will联合顶尖高校，让试错成为科研“利器”

时间：2026-04-26 17:51:48 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在科学探索的征程中，究竟是依赖“更聪明的大脑”进行深度推理，还是通过高效组织试错与评估来突破极限？近期，宽德智能学习实验室联合斯坦福、清华、北大等顶尖高校发布的一项新研究，给出了一个令人瞩目的答案：一套名为SimpleTES的通用框架，正让普通开源模型在科学发现领域实现“逆袭”。

长期以来，大模型的发展叙事围绕着“更聪明的大脑 + 更深的推理”展开，人们相信凭借强大的模型能力就能逼近真理。然而，宽德智能学习实验室的研究却指出，科学发现的上限，不仅取决于模型的聪明程度，更在于如何巧妙地组织试错与评估。这一观点颠覆了传统认知，为科学探索开辟了新的路径。

宽德智能学习实验室是顶级量化私募宽德投资独立孵化的研究机构，秉持“AI for Good”与长期主义理念，致力于构建服务科学与技术的通用人工智能（ASI）基础平台。该实验室不仅是一个深度融合研究与工业落地的全栈式“创新中枢”，在北京、上海、纽约均设有办公室，还依托顶级算力与数据资源，利用全链路工程实践解决真实挑战，用极致工程水准定义未来的科学发现。

此次研究提出的SimpleTES框架，将试错拆解为三个可调度的维度，并在此基础上实现“测试时扩展”（test-time scaling）。这一创新让开源模型在21项前沿科学任务中表现出色，不仅刷新了多项SOTA（State-of-the-Art，当前最优水平），甚至在数学构造、代码优化等领域反超人类专家和顶级闭源模型。

在寻找使自卷积比R最大化的非负函数f这一任务中，以推理为中心和以评估为中心的方法都因专注于单一轴线的扩展而陷入平台期，增长停滞。而SimpleTES通过四项独立学术突破，实现了双轴协同扩展，达到新的行业领先水平。实验表明，针对不同类型的科学任务，动态平衡三个轴的算力分配，是超越现有SOTA解的关键。

SimpleTES框架的核心在于将试错、探索转化为一套可调度、可扩展、可优化的计算流程。它包含三个关键维度：并行度（Concurrency，C），即同时启动多少条独立轨迹进行探索；轨迹深度（Length，L），每条轨迹走多深；候选数量（K-candidates，K），每一步生成多少候选解。通过精细分配算力，将资源从单纯堆砌模型能力转移到优化搜索成本上，使科学发现从“灵光一现”转变为可系统性放大的过程。

在具体操作中，SimpleTES框架展现出独特优势。在并行探索方面，同时启动多条独立轨迹，避免因开局方向选择错误而导致全盘皆输，在复杂科学问题中先“看得更广”再“想得更深”。在迭代改进上，每条轨迹在评估器的驱动下持续迭代，评估器不仅是“打分器”，更是“方向控制器”，通过反馈微调搜索路径，将模型推向更优解。在局部筛选环节，每一步生成多个候选解，只保留最优的，在局部进行“小进化”，避免劣质解影响后续轨迹。

面对历史轨迹增多、上下文装不下的难题，SimpleTES框架将历史当作“资源池”，而非“记录”。引入类似UCB策略的RPUCG，优先选择高分或曾启发出好结果的节点，同时给低频节点加探索补偿，在prompt层进行“探索-利用权衡”，避免搜索过早收敛到局部最优。

SimpleTES框架还解决了AI在科研决策中的短视问题。传统方法优化每一步的奖励，使模型越来越保守，而科学发现需要允许早期“走弯路”。该框架采用Trajectory-Level Post-training方法，以整条轨迹的最终最好结果作为监督信号，只保留精英轨迹，截断无效后缀，用replay buffer累积经验，让模型学会选择更可能成功的探索路径，形成接近“科研直觉”的能力。

在六大领域、21个科学问题上，SimpleTES框架展现出强大实力。在算法工程领域，对于LASSO路径求解这一统计学、生物信息学和金融建模中广泛使用的算法，SimpleTES在保证精度完全一致的前提下，平均比标准解法glmnet快2.17倍，比sklearn快14倍以上。它演化出一套按问题结构动态切换的混合解法，根据问题所处几何区间选择不同算法，使算法设计成为可大规模试错搜索的内容。

在量子电路编译领域，量子比特路由任务要求在保证所有操作可执行的前提下，尽量减少SWAP数量。这是一个长程组合优化问题，目前主要由顶尖科学家设计的启发式算法处理。SimpleTES在不同量子计算机平台架构上展现出强大编译优化能力，在超导架构上比经典算法SABRE提升21.7%，比改进版LightSABRE提升14.9%，在IBM Q20实例上将SWAP门开销降低24.5%；在分区中性原子架构上，使36个多样化电路的平均执行时间缩短33.2%，稳定提升绝大多数测试用例表现。

在数学极值分析领域，Erdős最小重叠问题是一个典型的极值构造难题，搜索空间巨大且崎岖。人类和现有AI基本都卡在0.38087附近，而SimpleTES将结果推进到0.380868，甚至在额外搜索中达到0.380856。这一提升主要来自搜索过程本身的高效，而非模型大小。

不过，SimpleTES框架并非没有边界。其能力本质上受评估器限制，在评估昂贵、主观或依赖真实世界反馈的领域会变得吃力。三个维度的算力分配目前还需手动调节，不同任务和阶段的最优分配不同，理想状态是系统能根据搜索进展动态调整。该框架天然适合“有连续分数”的世界，在定理证明等离散场景中，因缺乏细粒度反馈，搜索信号可能模糊甚至误导方向。

目前，基于SimpleTES方法构建的试用平台已在相关官网上线，人们可申请加入等待名单，率先体验这一全新的科研范式。

更多>同类资讯

理想L9 Livis凭三大技术实力出圈，“理想没技术”言论不攻自破

05-28

AI数学竞赛再升温！OpenAI后Anthropic Claude Mythos也攻克80年难题

05-28

工信部发布2026汽车标准化体系聚焦多领域标准研究助力产业升级

05-28

AI大模型也有“疲惫时刻”？引入睡眠机制，助力深度推理能力升级

05-28

大模型需担社会责任：平衡技术商业与公共价值方赢未来

05-28

利润腰斩宇树科技坦承：人形机器人行业尚处早期阶段

05-28

台积电3nm工艺又要涨价？消息称计划下半年再次上调最高15%

05-28

Q1全球NAND Flash市场规模达428.15亿美元企业级SSD需求激增成主推力

05-27

AI影像“硬科技”领军者睿魔创新全球总部落户天府新区赋能产业生态升级

作为睿魔创新于2016年4月创立的产品品牌，OBSBOT寻影专注未来影像领域，聚焦人工智能与影像、机器人方向的应用型技术研究，通过独具创意的产品革新视频记录方式，变革人们的社交与生活方式。未来，睿魔创新将立足…

05-27

深度智联发布房地产垂类大模型DeepLink RE-LLM 驱动行业智能化升级

他详细拆解四层核心架构：最底层为模型核心基座，依托TB级行业数据、知识深耕训练，搭配行业专家内容对齐与合规机制，实现与通用AI的差异化突破；第二层为行业数据知识层，搭建15个数据集、100多个知识库，完善知…

05-27

杉岩数据获亿元级D轮融资，AI数据基建升级，创始人陈坚华为背景深厚

瑞财经王敏5月27日，深圳市杉岩数据技术有限公司（以下简称“杉岩数据”）宣布完成亿元级D轮融资。本轮融资由福田资本运营集团旗下的长胜产业基金领投，达晨财智湖南中小二期基金跟投。依托本轮资金，杉岩数据将…

05-27

智慧光伏电站数字孪生系统：以科技赋能，开启电站智能运维新时代

智慧光伏电站数字孪生系统是一个能够实时更新的动态智能体，可将光伏板的发电情况到电站的整体运行状态，每一秒都在虚拟世界中同步刷新。智慧光伏数字孪生系统的应用助力电站的运维优化，从被动抢修到事前预防，从数据孤岛…

05-27

2026广州光伏展蓄势待发：光伏清洗设备与机器人共绘清洁能源新蓝图

这场备受瞩目的行业盛会，就像一颗即将引爆的能量炸弹，即将在广州掀起一场关于光伏清洗技术与设备的风暴。 2026 广州太阳能光伏展 - 清洗设备- 光伏清洗机器人展览会，在全球积极推动清洁能源发展的大背景下…

05-27

从华为剥离到服务器巨头，超聚变IPO能否借算力东风再攀高峰？

05-27

睿触机器人赴港上市申请公开研发成果与市场布局引关注

05-27

点击查看更多 +

全站最新

HPE发布AI智能体存储新品，以数据智能引擎驱动企业AI转型新未来

小红书首届RED新生代创作盛典落幕，多元赋能创作者生态未来可期

抖音生活服务开放日：聚焦体验升级，以安心服务构建消费新生态

杉岩数据斩获亿元级D轮融资，领航AI原生数据赛道，创始人华为履历亮眼

从日语运营到AI探索者：于远主动破局，以学习拥抱未来行业变革

小米MiMo大模型降价引关注，国内大模型企业超万家且资金密集特征明显

热门内容

本栏最新

从日语运营到AI探索者：于远主动破局，以学习拥抱未来行业变革

上海世外教育集团携手华为：共探教育数字化新路径共绘智慧教育新蓝图

别克至境L7纯电版来袭！800V架构配6C快充，续航超700km值得期待

零跑D99即将亮相粤港澳车展！舱驾一体+多种空间模式，中旬上市引期待

光互连成AI算力新战场，谢崇进携奇点光子如何抢占窗口期？

昇腾AI开发者峰会2026北京启幕：共探前沿技术，携手开发者共筑AI新未来

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.