滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

AMD联手IBM与Zyphra发布ZAYA1：14T tokens预训练，架构创新性能对标Qwen3

时间：2025-11-28 01:29:22 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

全球人工智能领域迎来一项重要突破——AMD联合IBM与AI初创企业Zyphra共同推出名为ZAYA1的混合专家（MoE）基础模型。该模型成为首个完全基于AMD硬件架构完成训练的同类产品，在数学、科学推理等核心能力上展现出与头部模型竞争的实力，标志着AMD在AI训练生态中的技术突破。

训练集群采用IBM Cloud部署的128个节点，每个节点配备8张AMD Instinct MI300X加速器，总计1024张GPU通过InfinityFabric互联技术构建。该集群依托ROCm软件栈实现高效协同，峰值算力达750PFLOPs。训练过程消耗14万亿tokens数据，采用渐进式课程学习策略，从通用网页数据逐步过渡到数学、代码及推理专项数据集。Zyphra团队表示，当前版本为预训练基础模型，后续将发布经过指令微调的增强版本。

模型架构包含两项关键创新：其一为卷积压缩注意力（CCA）机制，通过将卷积操作与注意力头压缩技术结合，在保持性能的同时降低32%显存占用，长序列处理吞吐量提升18%；其二为线性路由混合专家系统，通过细化专家粒度并引入负载均衡正则化，在Top-2路由策略下实现2.3个百分点的精度提升，即使在70%稀疏度条件下仍能维持90%以上的硬件利用率。

基准测试显示，ZAYA1-Base版本在MMLU-Redux、GSM-8K、MATH、ScienceQA等综合评估中与Qwen3-Base持平，在CMATH数学推理和OCW-Math专业测试中表现显著优于对比模型。值得注意的是，该模型未经指令微调即在STEM领域展现出接近专业版本的推理能力，验证了架构设计的有效性。Zyphra计划于2026年第一季度推出指令微调版本和强化学习对齐（RLHF）版本，届时将开放API接口及模型权重下载。

AMD方面透露，此次合作验证了MI300X加速器与ROCm软件栈在大规模MoE模型训练中的可行性。公司正与多家云服务提供商推进"纯AMD"训练集群的标准化部署，目标在2026年训练超千亿参数模型时，使总拥有成本（TCO）达到与NVIDIA方案相当的水平。这项进展为AI训练硬件生态的多元化发展提供了新的技术路径选择。

11-28

Tulip收购Akooda：借AI之力，为工业智能运营注入新动能

11-28

AI赋能社会组织新征程：静安以科技之力解锁发展新路径

11-28

DeepSeekMath‑V2模型发布：自验证机制突破，引领数学推理新方向

11-28

2025智能座舱变革：从功能比拼到场景数据深度适配新赛道

11-27

ChatGPT上线购物研究功能：交互对话选商品，智能导购时代开启

11-27

李想预言：未来十年具身智能汽车将成最具价值“机器人”形态

11-27

二十载融合创新：交大医学院医工交叉，绘就医学发展新蓝图

11-27

金山办公章庆元：AI赋能协同办公构建“知识容器”与“数字员工”新生态

11-27

金山办公WPS 365升级：推出新品并升级AI核心，定义协同办公新形态

11-27

Ilya最新深度访谈全揭秘：AGI瓶颈、超级智能展望与AI未来蓝图

11-27

AIoT浪潮奔涌向前！2025“物联之星”大众投票开启，共寻行业标杆

截止到目前，众多行业龙头企业与创新新锐力量纷纷携核心成果参与到评选中来，从AI大模型与物联网的深度融合，到无源物联网的技术突破，再到工业智能体的落地实践，每一份申报材料都彰显着中国AIoT产业的活力与实力。 …

11-25

AI绘就智慧农业新图景广西电信以科技之力激活“桂字号”发展动能

在同期召开南宁智慧农业博览会上，中国电信广西公司携“千万龘云”平台、“神农一号”大模型等创新成果亮相的“翼联万物智兴三农”展区，更让这一论断有了扎实的实践支撑，印证着依托广西面向东盟的独特区位优势，AI已成…

11-25

5G+工业互联网赋能多领域智能升级引领生产新变革

记者从工业和信息化部了解到，我国将打造5G+工业互联网升级版，实施工业互联网和人工智能融合赋能行动。浙江菲达环保股份有限公司总经理助理于立元：将智能感知监测、数据分析决策、物联网协同控制等新技术与5G+工…

11-25

2025中端拍照手机大比拼：荣耀OPPOvivo影像实力谁更胜一筹？

此外，S40的屏幕尺寸与握持手感适合偏好小屏拍摄的用户，但整体影像灵活性不及荣耀全系影像算法支持下的2亿像素主摄。相比Reno15和S40，荣耀500系列在人像表现力、低光环境表现以及影像创意功能方面均处于领…

11-25

点击查看更多 +

全站最新

吉利第三代豪越L上市，多重权益加持，空间智能动力亮点纷呈

广州车展看仰望：技术堆砌之后，如何筑起品牌豪华护城河？

阿斯顿·马丁DB12 Volante：优雅与性能并存，敞篷GT市场新选择

宝马全新燃油与纯电3系谍照流出，外观内饰差异明显，动力配置有亮点

纽约现身！仅约2700台的帕杰罗Evo，21.8万公里仍受越野收藏者追捧

fudi牵手京东开启即时零售新篇，打造“30分钟新鲜生活圈”

热门内容

本栏最新

机器人产业兴起：传统工厂借势转型，开启智能制造新篇章

“5G+工业互联网”蓬勃发展现存超79万家5G企业助力产业升级新征程

别克至境世家广州车展首秀，以“五恒”座舱开启新能源豪华MPV新境界

吉利银河V900：以全能实力，开启百万银河高端MPV新征程

六七万预算选家用代步电动车，缤果S、海鸥、极狐T1谁更值得入手？

首月狂销超2.6万台！缤果S凭啥力压海鸥、极狐T1成爆款？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.