滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

AI算力重心转移：推理时代来临，英伟达谷歌华为等厂商竞逐新赛道

时间：2026-04-23 22:30:31 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

随着人工智能应用从模型训练向实际推理场景加速迁移，全球算力市场正经历结构性变革。头部企业纷纷调整战略布局，将重心转向推理芯片研发与生态建设，国产算力厂商凭借差异化技术路线，在算力重构浪潮中抢占先机。

市场调研机构数据显示，推理工作负载占比预计将在2028年攀升至73%，智能体规模化应用成为主要驱动力。这类应用需要处理多轮对话、工具调用和长上下文记忆，单个任务消耗的算力较传统对话式AI提升数十倍。某云服务厂商架构师透露，不同行业对推理时延要求差异显著：在线游戏需控制在15毫秒内，电商场景约20毫秒，而智能客服可放宽至100毫秒。这种需求分化迫使硬件厂商在吞吐量、时延和成本间寻求平衡。

英伟达通过生态整合巩固领先地位，将推理芯片公司Groq纳入CUDA体系，开辟高响应速度细分市场。其创始人黄仁勋指出，推理token价值分层趋势明显，高端用户愿为更低延迟支付溢价。谷歌则在Google Cloud Next大会上发布第八代TPU，首次将产品线拆分为训练专用TPU 8t和推理专用TPU 8i。后者通过优化内存配置和片内数据吞吐，使推理性价比提升近80%，特别针对多智能体协同等复杂场景。

国产算力厂商选择差异化突围路径。华为昇腾950系列采用Prefill-Decode分离架构，950PR专注预填充阶段和推荐场景，搭配自研HBM内存实现低成本部署；950DT则强化解码能力，144GB内存容量和4TB/s带宽支持千亿参数模型训练。更引人注目的是其超节点计划，2026年四季度将推出支持8192颗芯片的Atlas 950集群，在总算力、内存容量和互联带宽等指标上全面超越英伟达同类产品。

寒武纪构建训推一体化生态，第五代MLUarch微架构实现FP16算力2.048PFLOPS，支持Chiplet异构集成。其NeuWare软件平台通过"一次开发、多端部署"特性，兼容主流AI框架并开源工具链，思元590芯片已在互联网企业千卡集群中商用。该公司自研指令集已迭代至第四代，形成覆盖云边端的统一生态基础，显著降低模型迁移成本。

通用GPU路线成为另一重要方向。摩尔线程等企业突破多卡互联技术瓶颈，曦望等初创公司则聚焦细分场景优化，在推荐系统、长上下文处理等领域推出专用芯片。这种多元化布局正在打破国际巨头的垄断格局，国际投资机构预测，中国AI芯片国产化率将从2023年的17%跃升至2027年的55%。

生态建设成为竞争关键。面对英伟达CUDA二十年的技术积累，国产厂商通过开源策略降低迁移门槛。华为计划2025年底前开源CANN编译器和Mind套件，寒武纪持续开放NeuWare工具链。DeepSeek等开源大模型与国产芯片的深度适配取得突破，当主流模型实现"开箱即用"，应用厂商的迁移意愿显著增强。某证券机构分析指出，云服务涨价周期与算力稀缺性叠加，将加速国产硬件替代进程，形成技术迭代与市场扩张的良性循环。

04-23

京东“新品全域通千亿计划”出炉，2025新品爆发，力推千款亿元新品

04-23

特斯拉Q1财报会：Optimus将内置智能，H3难实现无监督FSD，AI5进展披露

04-23

字节跳动Seed3D 2.0发布：MoE架构助力，3D生成更精细逼真

04-23

OpenAI推出Workspace Agents：为企业团队打造专属AI数字员工新体验

04-23

DeepSeek V4将至，小米携罗福莉团队推Mimo-V2.5，AI落地竞争升温

04-23

宁德时代“狂飙”：日赚2.3亿，产业链“链主”地位稳固

04-23

抖音电商阅读新图景：短视频与直播拓宽阅读边界，激活图书消费新活力

04-23

抖音专项治理AI侵权乱象：下架超53.8万条视频，严惩4000余违规账号

04-23

谷歌云大会引3万人参与：TPU芯片挑战英伟达，智能体“全家桶”落地加速

在这次大会上谷歌推出了两款芯片：针对AI模型训练的TPU 8t和更适合推理任务的TPU 8i。随后在11月，又有消息称Meta正在考虑从2027年起在其数据中心部署谷歌的TPU，价值达到数十亿美元，还可能在…

04-23

特斯拉2026年资本支出增至250亿美元加速布局AI与机器人赛道

财报会议上，特斯拉宣布将2026年资本支出预期大幅上调至250亿美元，加速从传统汽车制造商向以AI、自动驾驶出租车（Robotaxi）和人形机器人为核心的科技公司转型。另外，特斯拉正加速剥离传统汽车制造商的…

04-23

特斯拉人形机器人再升级：第三代年中亮相，马斯克断言其将成关键里程碑

据了解，截至目前，特斯拉在人形机器人领域已经推出了Optimus第一代(Gen1)和第二代(Gen2)。Gen2在2023年发布，步行速度提升30%，配备了22自由度灵巧手，2024年进入工厂测试。当地时…

04-23

特斯拉第三代人形机器人年中亮相，2026年量产或达百万台规模

去年7月，有报道称援引特斯拉相关人士消息称，特斯拉第三代机器人已在美国工厂进行实测，预计2025年面向中国C端市场推出，将进入家庭等消费场景，预计2026年实现量产。特斯拉在2026年第一季度财报中披露称…

04-23

Steam注册人机验证反复卡壳？5个亲测有效方法助你轻松破局

或者更简单一点，直接使用浏览器的“无痕模式”或“隐私模式”打开Steam官网注册，这种模式下浏览器是最干净的状态，没有乱七八糟的插件和缓存干扰，通过率会高很多。Steam的验证机制对时间同步要求很高，如果你的…

04-23

中国移动5G-A超级上行启航：单用户上行速率破1Gbps 开启千兆新篇章

中国移动构建“3+2+3”上行增强技术体系，通过SUL补充上行、多频协同、载波聚合等关键突破，在浙江率先实现单用户上行峰值速率超1Gbps，完成从百兆到千兆的跨越。中国移动同步发布技术演进规划白皮书，成立…

04-23

点击查看更多 +

全站最新

三一重工(06031.HK)获摩根大通增持21.9万股

樾系标杆落地！香山樾交付，彰显越秀在京高端人居打造硬实力

海尔智家(06690.HK)获Pzena Investment Management, LLC增持180.92万股

康臣药业（01681.HK）投资者交流日：稳增长、高分红双轮驱动获青睐

华为乾崑智驾里程突破100亿公里，迟林春称10月有望超特斯拉登顶全球

当乳业进入"科技时代"，飞鹤以"原料自研、鲜活标准、全龄布局"给出答案

热门内容

本栏最新

宝马i3长轴距版国内首秀：加长尺寸不改经典韵味，尽显宝马本色

宝马全球首发三款新车：新世代长轴距版iX3、i3与全新7系齐亮相

国产新能源车冲击40万市场：是消费新趋势还是时代必然选择？

从面包车到祥菱U7：跑车人王日龙的舒适之选与省钱之道

京东七鲜“粉芭乐樱樱茶”：AI全链路赋能，开启零售商品创新新篇章

科大讯飞携手清华团队布局“AI+量子”，量智开物首秀亮剑多项硬核成果

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.