滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

OpenAI深夜放大招：两大开源推理模型上线，性能直逼o4-mini

时间：2025-08-06 12:53:37 来源：新智元编辑：快讯 IP：北京 发表评论无障碍通道

在深夜的一则震撼消息中，OpenAI悄然放出了两大开源语言模型——gpt-oss 20B与gpt-oss 120B，这一举动无疑在AI界投下了一枚“开源核弹”。这两款模型不仅性能上可与OpenAI自家的o3-mini和o4-mini相媲美，更令人惊喜的是，它们能够在消费级显卡乃至智能手机上流畅运行。

随着这两款模型的发布，OpenAI终于兑现了自GPT-2以来的开源承诺。奥特曼，这位AI界的领航者，带着他的新作品，悄然降临。gpt-oss 120B拥有1170亿总参数，其中51亿为激活参数；而gpt-oss 20B则拥有210亿总参数，激活参数为36亿。这两款模型的问世，标志着OpenAI在开源领域的重大回归。

在性能表现上，gpt-oss 120B针对高推理能力的生产级和通用型场景游刃有余，其核心推理基准测试成绩与o4-mini不相上下，且能在配备80GB显存的GPU（如H100）上高效运行。而gpt-oss 20B则更适合低延迟、本地或专业化场景，其在常用基准测试中的表现与o3-mini相似，更能在仅具16GB显存的边缘设备上流畅工作。

不仅如此，这两款模型在工具使用、少样本函数调用、CoT推理以及HealthBench评测中均展现出强劲实力，甚至在某些方面超越了OpenAI的专有模型如o1和GPT-4o。它们还具备诸多亮点：宽松的Apache 2.0许可证、可配置的推理投入、完整的思维链访问、支持微调、智能体能力以及原生MXFP4量化等。

尤为OpenAI还为这两款模型准备了一个在线体验平台，供用户亲身体验其强大功能。用户只需访问https://gpt-oss.com/，即可开启AI之旅。同时，GitHub项目页面（https://github.com/openai/gpt-oss）也提供了丰富的资源和社区支持。

技术层面，gpt-oss系列模型采用了最先进的预训练和后训练技术。它们基于Transformer架构，并融入了MoE设计以减少处理输入时的激活参数量。同时，模型还借鉴了GPT-3的设计理念，采用了交替的密集注意力和局部带状稀疏注意力模式。为了提升推理和内存效率，还引入了分组多查询注意力机制和旋转位置编码（RoPE），原生支持128k上下文。

在训练数据上，gpt-oss模型以英语为主，聚焦于STEM、编程和通用知识领域。OpenAI采用了o200k_harmony分词器对数据进行分词处理，该分词器是OpenAI o4-mini和GPT-4o所用分词器的“超集”，并同步开源。

gpt-oss系列模型与Responses API兼容，专为智能体工作流打造。它们能够自主调整推理投入以适应复杂推理或极低延迟输出的任务需求。同时，模型完全可定制，并提供完整的思维链（CoT）以及支持结构化输出。据悉，整个预训练成本低于50万美元。

在后训练阶段，gpt-oss模型的流程与o4-mini相似，包含了监督微调和高算力强化学习阶段。团队以“OpenAI模型规范”为目标对齐，教导模型在生成答案前使用CoT推理和工具。通过采用与专有o系推理模型相同的技术，gpt-oss在后训练中展现出卓越能力。

在多个基准测试中，gpt-oss 120B的性能堪比甚至超越旗舰级o系模型。在编程竞赛、通用问题解决以及工具调用方面，它直接超越了o3-mini，达到甚至超越了o4-mini的水平。同时，在健康相关查询和数学竞赛基准中，gpt-oss 120B的表现也优于o4-mini。尽管gpt-oss 20B规模较小，但在相同评估中表现同样出色，甚至在AIME、健康领域基准上超越了o3-mini。

此次开源不仅为开发者提供了强大的工具，补充了托管模型的生态，加速了前沿研究与创新，更重要的是降低了新兴市场及缺少算力的小企业的准入门槛。一个健康的开放模型生态系统对于AI的普及与惠及所有人具有重要意义。奥特曼骄傲地表示，gpt-oss是OpenAI“数十亿美元”研究成果的结晶，是全世界最出色、最实用的开放模型。

更多>同类资讯

半人马座α星A星宜居带现气态巨行星，椭圆轨道或拓展行星演化新认知

09-22

10倍地球质量！开普勒-725c现身宜居带，或藏生命新可能

09-22

木星磁层电子加速奇景：“擀面杖”效应下的粒子运动探秘

09-22

多学科视角下中国古代家猪驯化与饲养的学术探索与成果分享

09-22

太阳系边缘神秘天体：起源成谜，科研逐梦探寻未知奥秘

09-22

WASP-121b：极端温差下的钛云世界，系外行星的奇幻探索

09-22

土星环步入“中年危机”：物质流失下光环何时彻底消散？

09-22

18国携手观测：“躺转”天王星平流层季节冷暖为何如此极端？

09-22

谷神星阿胡纳穹丘：冰火山中的“盐泥密码”，解锁太阳系早期演化之谜

09-22

火星南极春日“变装”：冰盖消退现多边形霜边与暗色地形，探秘红色星球

09-22

海卫一：冰火山间歇泉喷涌，宇宙冷秘中藏着生命可能？

09-22

早期宇宙现“超级吃货”黑洞：每年吞噬300至3000个太阳质量，挑战生长理论

09-22

冥王星冰火山喷发物藏玄机：或为地下海洋与岩石接触提供关键证据

09-22

NASA“毒蛇”月球车项目复活 2027年将随“蓝月亮”着陆器探月南极

09-22

神舟二十一号发射在即，杨利伟转型引路人，中国航天续写新传奇

09-22

点击查看更多 +

全站最新

百度AI“多边形”发力：从技术深耕到生态重构，中国AI新叙事启幕

百度AI全栈布局显锋芒：从芯片到生态，中国AI龙头开启价值重构新篇章

百度地图智舱大模型赋能：端到端语音革新，携手车企共筑智能座舱新未来

金桥汽车嘉年华展多元魅力，智能网联生态圈建设再提速

捷尼赛思拓展产品线：全新越野SUV对标奔驰G级，多款新车蓄势待发

仰望U9X以496.22km/h登顶极速榜首纽北6分59秒157展现中国超跑技术突破

热门内容

本栏最新

NVIDIA50亿美元投资Intel，台积电风险可控，先进制程优势或延续至2030年

复旦团队绘制代谢组图谱：解锁疾病早期预警密码，助力精准医疗

国庆中秋假期将至，租台无人机记录美好旅程成热门新选择

国庆假期出行新选择：无人机租赁受热捧，3C数码租赁市场火热升温

字节跳动凌晨发声：TikTok美国业务将依法推进，服务美国用户不停歇

对话松延动力姜哲源：25岁团队如何从创业民房走向“千台俱乐部”并冲刺交付？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.