滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

英伟达Blackwell平台发力：DeepSeek V4单Token成本骤降，推理效率大提升

时间：2026-07-02 04:00:46 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

英伟达近日宣布，在Blackwell平台上通过全栈推理优化，成功将DeepSeek V4模型的单Token处理成本大幅降低。相较于该模型上线初期，当前成本已缩减至原来的五分之一，这一成果使其在行业同类方案中达到最低水平。英伟达明确将单Token成本列为评估AI总拥有成本的关键指标，凸显其在降低AI应用门槛方面的技术突破。

技术实现层面，英伟达构建了覆盖生产运营、应用加速和基础设施访问的三层优化体系。生产运营层通过分布式服务架构实现资源动态调配，结合自动扩缩容机制和内存管理策略，确保系统高效运行；应用加速层聚焦运行时优化，采用计算通信重叠、内核融合等技术提升处理效率；基础设施访问层则直接调用GPU算力、网络带宽及系统内存资源，形成硬件与软件的深度协同。

在性能提升方面，Blackwell平台通过多项创新技术实现突破。分离式服务架构将模型推理与资源管理解耦，大规模专家并行策略使复杂计算任务得以分散处理，基于NVLink的并行通信技术显著减少数据传输延迟。NVFP4精度格式在保持模型准确性的同时降低计算负载，多token预测技术则通过并行处理提升吞吐量。综合优化后，单GPU的token处理能力最高可提升20倍。

此次成本优化不仅体现在硬件效率提升，更得益于软件栈的深度定制。英伟达针对DeepSeek V4模型特性，重新设计了推理流程中的关键环节，包括动态批处理策略、内存访问模式优化以及异构计算资源分配。这些改进使得Blackwell平台在处理大规模语言模型时，既能保持低延迟响应，又能实现高吞吐量输出，为AI商业化应用提供了更具竞争力的解决方案。

更多>同类资讯

中科宇航加速研发力箭三号火箭预计2029年盈利蓝箭航天同预期

07-02

陆家嘴国泰人寿20亿增资“强体魄”，上半年8家险企密集增资“稳根基”

07-02

首创证券人事调整：方杰提前离任，“85后”陈磊接棒分管投行与债务融资

07-02

贵州沿河：无人机飞防作业“一喷多促” 护航大豆玉米稳产增收

近日，在贵州省铜仁市沿河自治县板场镇蒲楠村，一台植保无人机正在低空盘旋，忙着开展飞防作业，喷出细雾状的药液，均匀地洒向连片的大豆玉米带状复合种植田。肖鹰正在操作无人机（沿河自治县融媒体中心供图）无人机开展…

07-02

让 Agent 加入群聊当同事，飞书从多维表格开始打样

07-02

Anthropic承认了！Claude Code木马门被抓包，明天回滚

07-02

高德内测专属超级AI助手「高德产业大脑」

07-02

卫星自主轨道修复：智能调控让低轨卫星运行更稳寿命更长

近地轨道卫星长期受大气残余阻力、太阳风、星体微弱引力扰动，飞行轨道会持续缓慢偏移。传统轨道修正完全依赖地面测控站指令调控，响应滞后、操作繁琐，且偏远时段无法及时干预，容易导致卫星姿态失衡、任务精度下降。卫星…

07-02

守护地球安全！我国构建近地小行星天地协同监测与防御体系

虽然小行星撞击地球属于低概率事件，但一旦发生，可能对区域甚至全球造成严重影响，因此也被视为人类需要共同应对的太空安全风险之一。专家表示，我国正在论证中国小行星防御系统，要防御，必须先预警，而天地一体化监测…

07-02

中国空间站升级扩容：180吨级新构型将至，梦舟飞船与长征十号同步推进

在这一进程中，新一代载人火箭长征十号与新一代梦舟飞船也将陆续迎来首飞。现在的空间站：90吨，3个人，T字构型先来看我们目前已经建成并稳定运行的空间站系统。现阶段的神舟飞船一次最多只能搭载3名航天员，…

07-02

美媒紧盯长征十号乙发射窗口，中国火箭回收探索之路能否再进一步？

他们还指出，长征十号乙其实早在更早阶段就应该完成首飞，在今年4月甚至已经进行过所谓湿式彩排（即发射前加注推进剂的关键流程测试），但不知何种原因，这次任务并未在随后几周内如期推进，发射计划因此被延后。失败与调整…

07-02

北京揽宇方圆卫星影像合作全流程指南：从技术核验到项目高效落地

通过层层把控技术能力、影像质量、场景匹配与成本管控，可有效规避项目风险，充分依托企业全链条遥感服务优势，保障卫星影像数据精准适配项目需求，实现项目技术合规、质量达标、经费可控、落地高效，为各类遥感应用项目提供…

07-02

中国空间站新货运飞船轻舟2027年初发射，与天舟有何差异？未来有何影响？

我国轻舟试验飞船第二批在轨试验成果发布，当然，这只是初样货运飞船的成果，而正样发射时间也确定了，将前往中国空间站，这也将是中国第二艘货运飞船，有什么不一样呢？所以，中国空间站未来是一个国家化大平台，是真正意…

07-02

大熊座方向M101星系：超新星爆发揭示恒星生命循环的壮丽画卷

根据日本国立天文台、京都大学等组成的国际研究团队于2025年1月发表的研究成果，通过日本VLBI观测网（JVN）等设施开展的高精度射电观测发现，这颗发生超新星爆发的大质量恒星，在爆发前几十年就已经开始剧烈地…

07-02

物理学家另辟蹊径：借宇宙微波背景探寻宇宙最大黑洞踪迹

但此前，牛津大学突破聆听项目的天文学家布莱恩拉基提出了另一种探测SLABs的方法，这种方法包括寻找它们在宇宙微波背景（CMB）上投下的阴影——宇宙微波背景是大爆炸刚结束时释放的光，如今弥漫整个宇宙。我思考宇宙…

07-02

点击查看更多 +

全站最新

MG07设计风波背后：品牌话语权之困与车圈舆论生态的双重审视

科技赋能出行新选择，小米克系列智能平衡车，带你畅享多元骑行乐趣

6月新势力销量揭晓：零跑破9万领跑鸿蒙理想小米各展风采

中国L3自动驾驶新规落地：安全底线划定，商业化黎明前的“紧箍咒”

邬贺铨：智能体融入工业互联网，发展脉络、机遇挑战与应对全解析

半程销量领跑，上汽自主新能源海外三线并进开启新篇章

热门内容

本栏最新

Claude Sonnet 5 正式发布：智能体能力升级，部分性能直追Opus 4.8

极核AE2 Pro首发：3000W动力+TCS加持，行驶质感不输油车，4199元起售

中车大连公司闪耀第四届“链博会” 展现硬核实力与风采

地平线HSD V2.0开启最大规模OTA升级，以双引擎驱动智驾新进化

DeepSeek V4正式版7月中旬上线性能优化还引入峰谷定价新机制

地平线HSD V2.0：以迭代效率与双引擎驱动，开启智驾自主进化新篇章

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.