滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

OpenAI新开源模型引热议，性能媲美o4-mini，用户反馈却存疑

时间：2025-08-06 12:56:10 来源：赛博禅心编辑：快讯 IP：北京 发表评论无障碍通道

近期，OpenAI宣布了一项重大举措，向公众开源了两款全新的大型语言模型——gpt-oss-120b与gpt-oss-20b。这两款模型的问世，标志着自GPT-2之后，OpenAI再次向开源社区贡献了其研究成果。

据悉，gpt-oss-120b与gpt-oss-20b分别拥有1170亿和210亿参数，其中激活参数分别为51亿和36亿。尽管规模庞大，但这两款模型却表现出极高的运行效率。gpt-oss-120b仅需80G内存，便可在单张H100 GPU上流畅运行；而gpt-oss-20b更为亲民，16G内存的显卡，如4060 Ti，便能轻松驾驭。

在性能表现上，gpt-oss-120b被设计为与OpenAI自家的o4-mini相媲美，而gpt-oss-20b则对标o3-mini。根据OpenAI的评测数据，gpt-oss-120b在Codeforces（代码竞赛）、MMLU&HLE（多模态语言理解及人类常识评估）及TauBench（工具调用基准测试）等多个领域展现出强劲实力，与o4-mini各有千秋。尤其在HealthBench（健康信息查询）及AIME（数学竞赛）方面，gpt-oss-120b更是实现了超越。gpt-oss-20b同样不俗，其能力与o3-mini旗鼓相当，甚至在部分测试中更胜一筹。

值得注意的是，这两款模型均采用了Apache 2.0开源协议，这意味着开发者可以放心地进行商业化应用，无需担心专利纠纷。OpenAI还为这两款模型提供了可调推理强度、透明思维链条、支持微调及Agent友好等特性。特别是原生MXFP4量化的引入，使得oss-120b能在单张H100显卡上高效运行，oss-20b也仅需16GB显存。

为了方便开发者使用，OpenAI已将这两款模型上架Hugging Face平台。开发者可以通过Transformers、vLLM、PyTorch/Triton、Ollama及LM Studio等多种框架直接调用模型。同时，OpenAI还提供了详细的部署指南，帮助开发者快速上手。

然而，尽管gpt-oss系列模型备受瞩目，但社区内也传来了一些不同的声音。有用户表示，在对比测试中，gpt-oss-120b的表现似乎并未如预期般领先其他同类模型，如106B参数的GLM-4.5-Air。这一发现引发了广泛讨论，不少开发者开始重新审视gpt-oss系列模型的性能表现。

面对这些质疑，OpenAI方面表示，将持续关注社区反馈，不断优化模型性能。同时，他们也鼓励开发者积极参与到gpt-oss系列模型的测试与调优中来，共同推动人工智能技术的发展。

更多>同类资讯

半人马座α星A星宜居带现气态巨行星，椭圆轨道或拓展行星演化新认知

09-22

10倍地球质量！开普勒-725c现身宜居带，或藏生命新可能

09-22

木星磁层电子加速奇景：“擀面杖”效应下的粒子运动探秘

09-22

多学科视角下中国古代家猪驯化与饲养的学术探索与成果分享

09-22

太阳系边缘神秘天体：起源成谜，科研逐梦探寻未知奥秘

09-22

WASP-121b：极端温差下的钛云世界，系外行星的奇幻探索

09-22

土星环步入“中年危机”：物质流失下光环何时彻底消散？

09-22

18国携手观测：“躺转”天王星平流层季节冷暖为何如此极端？

09-22

谷神星阿胡纳穹丘：冰火山中的“盐泥密码”，解锁太阳系早期演化之谜

09-22

火星南极春日“变装”：冰盖消退现多边形霜边与暗色地形，探秘红色星球

09-22

海卫一：冰火山间歇泉喷涌，宇宙冷秘中藏着生命可能？

09-22

早期宇宙现“超级吃货”黑洞：每年吞噬300至3000个太阳质量，挑战生长理论

09-22

冥王星冰火山喷发物藏玄机：或为地下海洋与岩石接触提供关键证据

09-22

NASA“毒蛇”月球车项目复活 2027年将随“蓝月亮”着陆器探月南极

09-22

神舟二十一号发射在即，杨利伟转型引路人，中国航天续写新传奇

09-22

点击查看更多 +

全站最新

百度AI“多边形”发力：从技术深耕到生态重构，中国AI新叙事启幕

百度AI全栈布局显锋芒：从芯片到生态，中国AI龙头开启价值重构新篇章

百度地图智舱大模型赋能：端到端语音革新，携手车企共筑智能座舱新未来

金桥汽车嘉年华展多元魅力，智能网联生态圈建设再提速

捷尼赛思拓展产品线：全新越野SUV对标奔驰G级，多款新车蓄势待发

仰望U9X以496.22km/h登顶极速榜首纽北6分59秒157展现中国超跑技术突破

热门内容

本栏最新

NVIDIA50亿美元投资Intel，台积电风险可控，先进制程优势或延续至2030年

复旦团队绘制代谢组图谱：解锁疾病早期预警密码，助力精准医疗

国庆中秋假期将至，租台无人机记录美好旅程成热门新选择

国庆假期出行新选择：无人机租赁受热捧，3C数码租赁市场火热升温

字节跳动凌晨发声：TikTok美国业务将依法推进，服务美国用户不停歇

对话松延动力姜哲源：25岁团队如何从创业民房走向“千台俱乐部”并冲刺交付？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.