OpenAI近期推出了两款开源模型——GPT-oss-120b与GPT-oss-20b,为AI领域注入了新的活力。
据悉,GPT-oss-120b模型在核心推理基准测试中表现出色,与OpenAI的o4-mini模型几乎不相上下,且能够在单个80GB GPU上高效运行,这一特性使其在处理大规模数据时更具优势。而GPT-oss-20b模型则在常见基准测试中与o3‑mini模型取得了类似的结果,更为引人注目的是,它能够在仅配备16GB内存的边缘设备上运行,这对于设备端应用、本地推理或需要快速迭代的场景来说,无疑是一个理想的选择。
这两款模型不仅与OpenAI的回复API兼容,还特别为智能体工作流设计。它们具备出色的指令执行能力、工具使用能力(例如网页搜索或Python代码执行)以及灵活的推理能力,能够根据任务需求调整推理力度。尤其适用于那些无需复杂推理且/或需要极低延迟最终输出的任务。这些模型还完全可定制,提供完整的思维链(CoT)并支持结构化输出,进一步提升了其应用范围和灵活性。
OpenAI还宣布与AI Sweden、Orange和Snowflake等早期合作伙伴携手,共同探索这些开放模型的实际应用场景。这些合作涵盖了数据安全方面的本地部署,以及在专用数据集上的微调等,旨在推动AI技术的更广泛应用和创新。
OpenAI表示,GPT-oss-120b和GPT-oss-20b的发布标志着开放大型模型领域的重要突破。这些模型在推理能力和安全性方面均实现了显著提升,通过将它们整合到现有的API服务中,OpenAI旨在加速前沿研究、促进创新,并推动在更多应用场景下实现更安全、更透明的AI开发。这一举措无疑将为AI领域带来新的发展机遇和挑战。
这些开放模型还降低了新兴市场、资源受限行业及小型组织采用专有模型的门槛。这些群体可能因预算或灵活性限制而难以采用专有模型,但有了这些强大的、易于获取的开放模型工具,他们也能够构建创新应用、为自己和他人创造新的机遇。这有助于推动AI技术的民主化进程,让更多人能够受益于AI技术的发展。
OpenAI的这一举措无疑为AI领域注入了新的活力,也为更多人提供了参与和受益于AI技术发展的机会。随着这些开放模型的不断推广和应用,我们有理由相信,AI技术将在更多领域发挥更大的作用,为人类社会的进步和发展做出更大的贡献。