滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

英伟达Blackwell GPU助力AI推理速度飞跃，达成千TPS/用户新高度

时间：2025-05-24 13:12:09 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

英伟达近日宣布了一项令人瞩目的成就：其最新推出的Blackwell GPU在meta的Llama 4 Maverick模型上，成功刷新了大型语言模型（LLM）推理速度的世界纪录。这一突破发生在周四，当时英伟达正式对外公布了这一消息。

据悉，为了达到这一里程碑，AI基准测试权威机构Artificial Analysis采用了配置了8块Blackwell GPU的DGX B200节点。这一配置使得系统每用户每秒能够生成高达1000个tokens（TPS），这在之前是难以想象的。

英伟达的技术团队通过深度优化TensorRT-LLM软件栈，并结合EAGLE-3技术，对推测解码草稿模型进行了训练。这种加速技术通过小型快速草稿模型预测token序列，再由大型目标LLM进行并行验证。英伟达表示，这种方法的优势在于单次迭代可能生成多个token，尽管这需要额外的草稿模型计算开销。经过这些优化，整套服务器系统在峰值吞吐配置下，每秒能够处理72,000个tokens。

英伟达进一步解释说，Blackwell架构与Llama 4 Maverick级别的超大规模语言模型完美适配，这得益于其专为大型语言模型推理加速设计的EAGLE3软件架构。这一架构与GPU硬件架构形成了协同效应，从而实现了性能的显著提升。

英伟达还强调，他们在提高性能的同时，也确保了响应的准确性。测试结果显示，使用FP8数据格式的准确性与人工分析的BF16数据格式相当。这意味着，在保持高准确性的前提下，英伟达成功地大幅提高了系统的性能。

英伟达的这一突破，不仅展示了其在GPU技术领域的领先地位，也为大型语言模型的推理加速提供了新的解决方案。随着人工智能技术的不断发展，这一突破将对未来的AI应用产生深远的影响。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

华为昇腾超节点技术突破：384卡高速互联，引领AI模型训练新纪元

05-25

耶鲁谷歌联手突破！多能级量子系统纠错首超“盈亏平衡点”

05-25

蔡崇信：阿里五年磨砺坚韧，电商云计算为核心，AI全面渗透业务重归正轨

新榜讯 5 月 21 日至 24 日，第五届 BEYOND 国际科技创新博览会（BEYOND Expo 2025）举行。闭幕式上，阿里巴巴集团董事长蔡崇信透露，过去五年，阿里遭遇众多挫折，在此阶段学会了坚韧，…

05-25

腾讯混元大模型加速冲刺AGI，与阿里字节激战AI智能体商业化

事实上，腾讯很早就布局AI技术，2021年腾讯就推出千亿和万亿参数的NLP稀疏大模型，但是在混元问题上，截至2024年底，腾讯混元一直落后于OpenAI，并且未与豆包、阿里通义、DeepSeek等模型拉开差…

05-25

智元机器人灵犀X2：2025下半年规模化出货，灵动交互能力引关注

05-25

OpenAI奥特曼新展望：何时首艘自我复制宇宙飞船将升空成新焦点

OpenAI创始人奥特曼发文称，我们应该停止争论AGI（通用人工智能）将在哪一年到来，而应该开始争论第一艘自我复制的宇宙飞船将在哪一年升空。…

05-25

蔡崇信谈阿里：历经五年挫折，如今已重新站稳脚跟，聚焦电商与云计算

第五届BEYOND国际科技创新博览会（BEYOND Expo 2025）于5月21日至24日举行。在闭幕式上，阿里巴巴集团董事长蔡崇信表示，过去5年，阿里经历了很多挫折，在这个阶段我们学会了韧性，始终想着多活…

05-25

蔡崇信坦言：阿里巴巴国际化之路有得有失，中国科技力量备受瞩目

在闭幕式上，阿里巴巴集团董事长蔡崇信表示，阿里巴巴在国际化方面并非完美，我们在一些国家取得成功，也在另一些国家经历了失败。阿里巴巴被视为国际化的公司，很大程度上是因为公司总部位于中国。 “如今，中国在全球享有…

05-25

华曦达冲刺港股：年营收超25亿，净利下滑近两成，李波持股近三七成

05-25

昇腾AI开发者峰会：共筑未来，开启智能时代新篇章

05-24

九章云极DataCanvas：以普惠算力为核心，驱动数字经济新飞跃

05-24

深开鸿开鸿Bot系列发布，助力开发者点亮开源鸿蒙生态新篇章

05-24

诺顿Neo浏览器来袭：AI如何重新定义你的网络冲浪之旅？

05-24

甲骨文豪掷400亿美金购英伟达芯片，力挺OpenAI打造全球顶级AI数据中心？

05-24

OpenAI升级Operator智能体，o3模型让浏览器交互更稳更准

05-24

点击查看更多 +

全站最新

新能源渗透率“过山车”，市场热度波动传递何信号？

丰田RAV4新款上市，多样化选择背后是创新还是消费陷阱？

电车降价潮来袭，谁能扛住？外资车成最后防线？

iCAR与Keep联袂，城市K马北京站见证“汽车+运动”新潮流

iCAR与Keep共跑城市K马北京站，开启“汽车+运动”潮流新篇章

本田雅阁新款上市，价格亲民配置升级，销量下滑能否靠它逆转？

热门内容

本栏最新

华为昇腾超节点技术突破：384卡高速互联，引领AI模型训练新纪元

腾讯混元大模型加速冲刺AGI，与阿里字节激战AI智能体商业化

智元机器人灵犀X2：2025下半年规模化出货，灵动交互能力引关注

OpenAI奥特曼新展望：何时首艘自我复制宇宙飞船将升空成新焦点

蔡崇信坦言：阿里巴巴国际化之路有得有失，中国科技力量备受瞩目

华曦达冲刺港股：年营收超25亿，净利下滑近两成，李波持股近三七成

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.