滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

前OpenAI安全VP翁荔停更13个月后发声：Scaling Laws或误导，模型数据配比或已跑偏

时间：2026-06-26 20:22:45 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

前OpenAI安全研究副总裁、现Thinking Machines Lab联合创始人翁荔在停更个人博客13个月后，以一篇题为《Scaling Laws， Carefully》的万字技术长文引发行业震动。这位自称“迟到了三年多”的研究者，通过系统性拆解支撑大模型行业数百亿美元投入的核心理论，指出当前主流模型的数据配比策略可能从诞生之初就存在方向性错误。

2020年，OpenAI研究员Jared Kaplan提出的“参数优先”理论曾主导行业方向。其研究显示，在双对数坐标系下，模型训练损失随参数量、数据量和算力的增长呈现幂律下降趋势，并得出“模型规模扩张速度应快于数据增长”的结论。这一理论直接催生了GPT-3的架构设计——1750亿参数搭配仅3000亿token的训练数据，成为后续大模型开发的范式标杆。

转折发生在2022年。DeepMind团队通过对比2800亿参数的Gopher与700亿参数的Chinchilla模型，发现参数仅为前者四分之一的Chinchilla，在配备四倍训练数据（1.4万亿token）的情况下，在所有基准测试中全面超越Gopher。这项研究颠覆了既有认知，指出参数与数据应保持1:20的等比增长关系。后续Llama、DeepSeek等模型虽参数规模不及GPT-3，却因遵循新比例实现性能反超，印证了该结论的普适性。

翁荔在长文中深入剖析了Kaplan理论的偏差根源。其研究指出，原实验基于最大仅15亿参数的模型得出结论，小规模区间的拟合误差在参数扩张至万亿级时被系统性放大。更关键的是，Kaplan团队在参数计数时排除了embedding层，这一操作在小模型中影响显著，但在参数规模指数级增长后被错误延续。2024年Epoch AI团队的代码复现工作进一步发现，Chinchilla原始代码中存在两处致命错误：损失函数错误使用均值而非求和导致优化器误判收敛，核心幂律指数被四舍五入至两位数引发虚假精度。修正后的数据再次验证了参数与数据等比增长的科学性。

当前行业面临的更严峻挑战在于数据枯竭危机。高质量文本数据预计将在2026至2028年间耗尽，而重复使用训练数据的边际效益呈指数级衰减。翁荔在文中嵌入的交互式模拟器显示，拟合精度或噪声水平的细微调整，可能导致外推预测结果产生数量级差异。这种对工程细节的极端敏感性，使得Scaling Laws更接近“观测性指南”而非传统物理定律。

这场持续三年的理论修正，正在重塑大模型研发的底层逻辑。从参数竞赛转向数据效率优化，从规模扩张转向架构创新，行业正经历着比表面参数数字更深刻的技术变革。当翁荔在文末写下“Scaling Laws是对工程细节高度敏感的观测性指南”时，或许正预示着大模型时代将进入更注重内在质量的新阶段。

更多>同类资讯

AI算力需求激增引爆存储市场，扩产受限致紧缺周期或延至2027年末

06-26

钉钉“悟空”通过全球首个人工智能管理体系认证引领AI治理标准化新征程

06-26

粉末冶金六十载深耕东睦股份凭“金刚钻”卡位多条黄金赛道

06-26

德邦基金新帅履新，数智化布局与固收优势能否助力信誉重塑？

06-26

领益智造6月26日港交所敲钟上市 “A+H”两地布局募资超80亿港元

06-26

赵建：AI革命浪潮下，市场高波动成常态，投资当紧握AI主线

06-26

元璟资本王琦：18年投资路，于趋势浪潮中捕捉未来“新物种”

06-26

硅晶圆市场回暖：三大厂商释放涨价信号，产业迎来新复苏周期

06-26

6月26日ETF收评：长三角ETF领涨，半导体设备走强，通信金融科技ETF回调

06-26

火山引擎发布豆包大模型2.1，日均调用量破180万亿，多领域应用潜力凸显

火山引擎总裁谭待介绍，在一项芯片设计RTL的测试中，豆包2.1 Pro连续运行近18小时，经历9轮迭代，还跑通了仿真、测试、综合检查等完整工程流程，展现出模型在真实工程场景里的生产级Coding交付能力；依…

06-26

千问高考出分期间咨询量飙升，已免费送出超千万份志愿报告

06-26

DeepSeek发布大规模招聘各部门规模扩容至少一倍

06-26

行业首个！大晓「晓途」开启机器狗开放场景7×24小时自主运营新模式

06-26

十年磨一剑：理想以具身智能破局，引领汽车从工具向“硅基生命”进化

06-26

领益智造港股上市募资超82亿港元加速布局AI硬件新赛道

06-26

点击查看更多 +

全站最新

雷军“高调”背后：汽车业务难离发布会光环，手机业务却求稳保利润

奥迪E5 Sportback迎OTA升级：Momenta大模型加持，驾控与交互双提升

从专业支持到生态优化：中小学校长如何全方位筑牢教师身心健康防线？

10万级纯电SUV新选择！东风奕派纳米06智趣版上市舒适智驾续航全拿捏

代码AI研发热潮涌动：头部团队差距小，开源与商业博弈下排名或生变

热门内容

本栏最新

领益智造港股上市募资超82亿港元加速布局AI硬件新赛道

研究报告：生成式AI经济表现亮眼过去12个月销售额达1100亿美元

零跑D99正式登场：科技豪华MPV新标杆，六大旗舰体验引领出行新风尚

零跑D99正式登场：24.98万起售，科技豪华MPV市场新选择来了

零跑D99上市：25万级价格享高端配置，增程纯电续航双突破搅局市场

零跑D99震撼登场！25万级标配空悬四驱，终结MPV续航焦虑新标杆

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.