在科技界的一次深夜惊喜中,OpenAI 宣布了重大进展,正式推出了两款高性能且开源的语言模型——gpt-oss-120b 和 gpt-oss-20b。这两款模型不仅展现了卓越的推理和工具使用能力,更以亲民的成本和高效的部署性吸引了广泛关注。
据OpenAI介绍,gpt-oss-120b 和 gpt-oss-20b 均采用了 Apache 2.0 许可证,确保了高度的可部署性和灵活性。其中,gpt-oss-120b 的性能直逼 o4-mini,却能在单张80GB GPU上流畅运行,这对于追求高性能而预算有限的用户来说,无疑是个巨大的福音。而 gpt-oss-20b 则以其接近 o3-mini 的表现,以及仅需16GB内存即可运行的特性,成为了端侧部署和本地推理的理想选择。
这两款开源模型不仅在工具使用、思维链(CoT)推理和结构化输出方面表现出色,更在多个基准测试中超越了 GPT-4o 和 o1 等专有模型,展现了其强大的实力。这一成就,无疑为开源社区注入了新的活力,也为人工智能的发展开辟了新的道路。
OpenAI 在推出这两款模型时,还特别强调了它们的安全性。经过强化学习与对抗性微调,这两款开源模型的安全性能已经与专有模型同等级别,这无疑为用户提供了更加可靠的选择。
对于想要深入了解这两款模型的开发者来说,OpenAI 已经将它们上传到了 GitHub 和 HuggingFace 平台上。在 GitHub 上,开发者可以找到模型的源代码和相关文档,而在 HuggingFace 上,则可以体验到模型的预训练权重和示例代码。这无疑为开发者提供了极大的便利,也加速了技术的传播和应用。
此次 OpenAI 的开源之举,不仅展示了其在人工智能领域的领先地位,更为整个行业的发展注入了新的动力。我们有理由相信,在不久的将来,这两款开源模型将会在各个领域发挥巨大的作用,推动人工智能技术的不断前进。