滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

OpenAI开源GPT-oss大模型：AI Agent专属，支持商用，训练时长超200万小时

时间：2025-08-06 12:25:19 来源：ITBEAR编辑：快讯团队 IP：北京 发表评论无障碍通道

OpenAI在近日凌晨震撼发布了名为GPT-oss的大型语言模型，该模型分为1200亿参数和200亿参数两个版本，并慷慨地采用了Apache 2.0许可协议，允许商业使用。

这款新模型针对AI Agent进行了专门优化，不仅支持函数调用、网络搜索，还能执行Python代码，为开发者提供了前所未有的便捷工具，助力他们快速打造出既安全又功能强大的智能体。

在性能表现上，GPT-oss-120B展现出了与o4-mini相当的实力，尽管它需要80GB的GPU资源来运行。而GPT-oss-20B则能媲美o3-mini，且对硬件配置的要求更为亲民，仅需16GB GPU即可流畅使用。

OpenAI透露，为了训练GPT-oss，他们在英伟达H100上投入了超过200万小时的计算资源，使其成为目前开源模型中训练时长名列前茅的佼佼者。

OpenAI的掌门人Sam Altman亲自撰写长文，深入解读了GPT-oss模型的重要性。他强调，GPT-oss是当下最先进的开放权重推理模型，在现实应用中表现出色，性能直追o4-mini，更令人兴奋的是，用户甚至可以在自己的电脑上进行本地运行，小规模的版本理论上也能在手机上流畅运作。

Altman表示，OpenAI很荣幸能将这款凝聚了巨额研发资金的模型推向全球，让更多人有机会接触并受益于人工智能技术。他坚信，GPT-oss带来的正面影响将远超其潜在的负面影响。

在具体应用场景中，GPT-oss-120B在复杂健康问题上的表现与o3不相上下，OpenAI还全力以赴地缓解了最严重的安全问题，特别是在生物安全领域。在安全基准测试中，GPT-oss模型的表现同样令人瞩目，与OpenAI的前沿模型不相上下。

Altman还强调了个人赋能的理念，他认为虽然大多数人可能更倾向于使用像ChatGPT这样便捷的服务，但在需要时，人们应该能够直接控制和修改自己的人工智能，这在隐私保护方面具有显著优势。

对于此次发布，OpenAI满怀期待，希望它能激发新的研究灵感和产品开发。他们预测，这一领域的创新速度将大幅提升，能够参与并推动这一进程的人数也将大幅增加。

OpenAI致力于确保通用人工智能（AGI）能够为全人类带来福祉。他们为能在基于美国创造的、以民主价值观为基础的开放人工智能技术栈上进行开发而感到兴奋，这一技术栈将免费向所有人开放，旨在实现广泛的益处。

然而，Altman关于GPT-oss-20B能在手机上运行的言论也引发了一些质疑。不少网友表示，既然20B版本需要16GB GPU，那么如何在普通手机上运行仍是个谜。

尽管存在这样的疑问，但不可否认的是，GPT-oss的发布意义重大。它标志着开源运动获得了前所未有的认可，整个行业的行事准则正在发生深刻变革。

从技术细节来看，GPT-oss-120b采用了混合专家（MoE）模型架构，由36层组成，总参数量高达1168亿，其中每token前向传递中活跃的参数为51亿。相比之下，GPT-oss-20b由24层组成，总参数量为209亿，每token前向传递中活跃的参数为36亿。这种参数分布使得模型在处理复杂任务时能够更高效地分配计算资源。

GPT-oss模型中的MoE模块包含固定数量的专家，负责处理不同的输入特征。GPT-oss-120b的每个MoE模块包含128个专家，而GPT-oss-20b的每个MoE模块则包含32个专家。这些专家通过一个标准的线性路由器进行选择，确保模型能够根据输入数据的复杂性动态分配计算资源。

在注意力模块设计方面，GPT-oss借鉴了GPT-3的架构，采用带状窗口和全密集模式交替的方式，带宽为128个token。这种设计使得模型在处理长序列数据时能够保持高效性能。

GPT-oss在推理和工具调用能力方面同样表现出色，与OpenAI的前沿模型o4-mini不相上下。例如，在AIME美国数学邀请赛测试中，GPT-oss-120b模型在高推理模式下达到了96.6%的准确率；在编程领域，GPT-oss-120b在Codeforces编程竞赛问题测试中的Elo评分也接近o4-mini。

GPT-oss在多语言能力测试中也展现出了强大的适应性，在法语、德语和西班牙语等语言的测试中，高推理模式下的准确率均达到了较高水平。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

MiniMax战略投资负责人魏瀚曈离职，大模型行业人事变动频现

08-06

DeepMind发布Genie 3：打造持久记忆与多分钟交互3D世界模型

08-06

OpenAI开源两款轻量级语言模型，性能强劲，个人电脑手机均可运行

08-06

OpenAI开源两大语言模型，转变策略或意在推动AI创新竞争

08-06

维基百科出台新政，快速清理AI生成劣质条目

08-06

AI三强同台竞技：OpenAI开源新模型，Claude领跑编程，Google发布可交互世界模型

08-06

ISC.AI 2025北京启幕，智能体时代来临，360周鸿祎论道AI安全新篇章

08-06

淘宝全新大会员体系来袭，整合阿里系资源，88VIP权益全面焕新

08-06

抖音“随心团”独立入口上线，享受部分商品免费配送服务

08-06

网红“疆域阿力木”坚称被误解，公开证据力证清白，等待法院裁决

08-06

盒马会员店全面停业，战略收缩聚焦硬折扣与下沉市场

08-06

《恋与深空》陷争议：玩家重氪后发现货不对板，叠纸回应将强化信息提示

08-06

宗馥莉隐身背后：娃哈哈内忧外患，新掌门改革之路何去何从？

08-06

盒马调整战略：会员店退场，深耕下沉市场寻求新增长

08-06

百度智能云首推AI数字员工，开启企业效率新纪元

08-06

点击查看更多 +

全站最新

百度智能云首推AI数字员工，开启企业效率新纪元

百度智能云发布AI数字员工，引领企业效率革命，重塑组织新形态

本土会员店集体“熄火”，网红模式缘何难以为继？

欧米茄“密语时空”腕表展成都启幕，至8月10日邀您共赏精湛工艺

盒马X会员店五年新零售梦碎，全线关停背后何因？

本田CB1000F SE复古街车震撼登场，复古风味与科技配置并存

热门内容

本栏最新

百度智能云首推AI数字员工，开启企业效率新纪元

百度智能云发布AI数字员工，引领企业效率革命，重塑组织新形态

本土会员店集体“熄火”，网红模式缘何难以为继？

盒马X会员店五年新零售梦碎，全线关停背后何因？

百度智能云首推AI数字员工，重塑企业组织形态，驱动营销增长新引擎

Data+AI赋能大模型，共筑决策智能新时代

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.