滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

DeepSeek V4助力！AMD ROCm两周内推理性能飙升75倍直追NVIDIA CUDA

时间：2026-05-11 10:55:45 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

SemiAnalysis旗下InferenceX性能测试平台最新披露的数据显示，AMD ROCm软件栈在适配DeepSeek V4大模型过程中展现出惊人的优化效率。自该模型发布后的两周内，其推理吞吐性能实现了75倍跃升，测试周期覆盖FP4与FP8精度下的8K/1K上下文典型应用场景，数据采集截止至5月8日。

此次性能突破完全基于软件层面优化，未涉及任何硬件改动。测试表明，在保持相同交互响应水平的前提下，系统token处理能力同步提升，有效将大模型推理延迟压缩至更低水平，为终端用户带来更流畅的使用体验。这充分验证了AMD在AI软件生态构建中的快速迭代能力。

技术团队通过两大核心优化实现性能质变：其一将mHC操作与RoPE哈达玛变换深度融合，显著降低CPU运算负荷的同时提升HBM内存带宽利用率；其二对索引器、键值缓存压缩器等关键计算模块采用TileLang与Triton语言重构，使开发迭代效率提升数倍。这些创新使得软件栈能够更高效地调度硬件资源。

尽管取得显著进展，当前ROCm单节点性能与英伟达B200仍存在差距。数据显示，其聚合性能约为B200的20%，距离PD解耦版本则有60%的提升空间。不过技术路线图显示，AMD计划在未来数周内完成剩余优化目标，重点突破内存访问模式与并行计算调度等关键环节。

值得关注的是，AMD ROCm团队在未获取模型权重参数的情况下启动适配工作，仅凭模型接口文档便在14天内完成全流程优化。这种"盲适配"能力不仅体现技术实力，更为AI生态开发者提供了新的协作范式。随着软件栈持续进化，AMD与英伟达在AI计算领域的竞争格局或将迎来新变量。

更多>同类资讯

贾跃亭履新FF全球CEO 发布EAI机器人并回应质疑：只为造车成功

05-11

贾跃亭重返法拉第未来，宣布公司转型为物理 AI 生态企业

05-11

英伟达2026年初承诺400亿美元股权投资，300亿重金加码OpenAI

05-11

AI界的“方言天才”来了，藏语大模型惊艳北京科博会！

05-11

2026 年全球 IT 支出将达 6.31 万亿美元，AI 成本激增引发关注

05-11

阶跃语音模型位列全球评测前三，创下中国大模型听感新高

05-11

中国移动推出全新 AI 模型服务平台 MoMA，让智能触手可及

05-11

影像创作进入“赛博乙方”时代，美图RoboNeo迎重大升级

05-11

贾跃亭回归出任法拉第未来全球CEO，FF官宣将升级为物理AI生态公司

05-11

具身智能新赛道：Uncharted Dynamics融资，为机器人筑牢物理基石

05-11

DeepSeek入驻苹果本：本地部署成现实，开源生态迎来新变局？

05-11

从“接不住”到“稳稳接住”：大模型语言能力背后的训练细节与突破

05-11

科博会“黑科技”大揭秘：人形机器人领航能源芯片创新齐绽放

05-11

国产大模型崛起：以创新之力，铸全球人工智能发展新基座

05-11

藏语大模型北京科博会首秀：以科技之力跨越语言壁垒助力藏语传承发展

05-11

点击查看更多 +

全站最新

车企掌门人“扎堆”直播间：以个人信誉背书，重塑行业竞争新格局

科大讯飞T30 Pro学习机深度评测：科技赋能教育，助力孩子高效学习

北京现代艾尼氪V申报图引热议赛博轿跑造型独特能否获市场认可待考

2026年5月商用车行业新动态：解放出海、DeepWay交付、福田人事调整

2026北京车展专访易航智能陈禹行：智驾转型与机器人渐进式发展新路径

小米YU7入门版来袭！标配激光雷达续航超600km，24万内或成新爆款

热门内容

本栏最新

2026北京车展专访易航智能陈禹行：智驾转型与机器人渐进式发展新路径

MG 07官图发布：定位新能源轿跑，提供双动力形式，年内有望上市

2026北京车展聚焦易航智能：陈禹行谈智驾转型与机器人渐进式发展路径

2026汽车圈动态：吉利ESG成果亮眼比亚迪神州租车携手推进绿色出行

奥迪E7X入局30万级纯电市场：以诚意定价与技术革新开启豪华电动新篇

一汽模具长春揭牌：以智造新姿，为中国汽车工业发展再添新动力

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.

DeepSeek V4助力！AMD ROCm两周内推理性能飙升75倍 直追NVIDIA CUDA

DeepSeek V4助力！AMD ROCm两周内推理性能飙升75倍直追NVIDIA CUDA