OpenAI在沉寂五年后,终于再次向公众敞开了大语言模型的大门。近日,该机构宣布了两款全新的开源模型——GPT-oss-120b与GPT-oss-20b,为开发者们带来了前所未有的惊喜。
这两款模型的发布,让OpenAI的首席执行官难掩自豪之情,他赞誉这是技术领域的巨大突破,并强调这些模型不仅性能卓越,而且极为实用,甚至可以在个人电脑或智能手机上实现本地运行。
据介绍,GPT-oss-120b与GPT-oss-20b作为轻量级语言模型,能够在保持低成本的同时,展现出强大的实际应用效能。为了验证它们的实力,OpenAI对这两款模型进行了多项标准学术基准测试,涵盖了编程、竞赛数学、医疗以及智能体工具使用等多个领域,并将它们与OpenAI自家的其他推理模型进行了对比。
测试结果显示,GPT-oss-120b在竞赛编程、通用问题解决以及工具调用方面,表现均优于OpenAI的o3-mini模型,甚至与更高级的o4-mini模型不相上下,甚至在某些方面还超越了它。特别是在处理健康相关查询和竞赛数学问题时,GPT-oss-120b展现出了比o4-mini更出色的能力。而尽管GPT-oss-20b规模较小,但在这些相同的测试中,它的表现也毫不逊色,甚至在竞赛数学和医疗领域还超越了o3-mini。
值得注意的是,GPT-oss-120b模型能够在单个80GB的GPU上高效运行,而GPT-oss-20b则更加亲民,它可以在仅配备16GB内存的边缘设备上运行,这使得它成为设备端应用、本地推理或需要快速迭代的理想选择,尤其适合那些无法承担昂贵基础设施的组织或个人。
OpenAI还强调,这两款开源模型与OpenAI的回复API完全兼容,专为智能体工作流设计,具备出色的指令执行能力、工具使用能力(如网页搜索或Python代码执行)以及推理能力。它们能够根据任务需求灵活调整推理力度,特别适用于那些无需复杂推理且/或需要极低延迟最终输出的场景。这些模型完全可定制,支持结构化输出,并提供完整的思维链。
为了探索这些开放模型的实际应用场景,OpenAI还与AI Sweden、Orange和Snowflake等早期合作伙伴展开了合作,共同研究如何在本地部署这些模型以确保数据安全,以及在专用数据集上进行微调。
OpenAI表示,GPT-oss-120b和GPT-oss-20b的发布标志着开放大型模型领域取得了重要进展。这两款模型在推理能力和安全性方面均实现了显著提升,通过将它们整合到现有的API服务中,OpenAI旨在加速前沿研究,促进创新,并推动在更广泛的应用场景下实现更安全、更透明的AI开发。
更重要的是,这些开放模型为新兴市场、资源受限行业以及小型组织提供了采用AI技术的全新机遇。这些群体往往因为预算或灵活性限制而无法采用专有模型,而现在,他们有了更加强大且易于获取的工具来构建创新应用,为自己和他人创造新的机遇。这无疑将有力推动AI技术的民主化进程。