ITBear旗下自媒体矩阵:

AMD、高通力挺OpenAI gpt-oss模型,推动边缘设备与AI融合新进程

   时间:2025-08-07 02:56:14 来源:IT之家编辑:快讯团队 IP:北京 发表评论无障碍通道
 

OpenAI近日宣布了一项重要进展,正式推出了两款基于Apache 2.0许可证的gpt-oss系列开放推理模型。这一系列包括两个版本:参数较少的gpt-oss-20b和参数更多的gpt-oss-120b。这两款模型分别针对边缘设备和高端GPU进行了优化。

据介绍,gpt-oss-20b模型设计轻巧,能够在仅配备16GB内存的边缘设备上流畅运行。而gpt-oss-120b模型虽然参数规模更大,但经过优化后,可以在单个80GB的GPU上实现高效运行。这一特性使得这两款模型能够满足不同应用场景的需求。

在硬件支持方面,AMD和高通均宣布旗下产品将支持gpt-oss系列模型。AMD锐龙AI Max+ 395处理器能够运行gpt-oss-120b模型,成为全球首款支持该模型的消费级AI PC处理器。AMD Radeon RX 9070 16GB显卡也宣布支持gpt-oss-20b模型。高通方面则表示,其旗舰骁龙平台同样支持gpt-oss-20b模型。

AMD锐龙AI Max+ 395处理器在gpt-oss-120b模型上的表现尤为出色,拥有30 Token/s的输出速率,并支持该模型的MCP模型上下文协议实现。得益于“Strix Halo”平台的支持,该处理器能够在128GB统一内存下将96GB分配给GPU,从而轻松满足gpt-oss-120b模型的显存需求。

另一方面,AMD Radeon RX 9070 16GB显卡在gpt-oss-20b模型上也展现出了卓越的性能。该显卡在首Token输出时间(TTFT)和每秒Token输出数量方面均表现出色,进一步证明了gpt-oss系列模型的兼容性和高效性。

高通方面表示,根据早期测试,gpt-oss-20b模型在端侧设备上实现了出色的思维链推理表现。开发者可以通过Hugging Face和Ollama等热门平台,在搭载骁龙芯片的设备上访问gpt-oss-20b模型,并充分发挥其功能。这一进展为AI应用在移动端的普及奠定了坚实基础。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version