ITBear旗下自媒体矩阵:

大模型架构创新浪潮涌动,AI应用与算力端共迎产业链新变革

   时间:2026-01-06 19:10:57 来源:天脉网编辑:快讯 IP:北京 发表评论无障碍通道
 

新年伊始,人工智能领域迎来架构创新热潮,多家顶尖机构和学者相继推出突破性成果。元旦当天,DeepSeek公布了名为mHC的架构改进方案,普林斯顿大学与加州大学洛杉矶分校联合团队则同步提出DDL架构。与此同时,meta前首席科学家、被誉为“人工智能教父”的Yann LeCun在接受《金融时报》专访时透露,其主导的新型模型架构将于一年内完成初步版本开发。

当前,OpenAI下一代模型Orion的性能提升遭遇瓶颈,谷歌与Anthropic的研发节奏也因高质量数据短缺而放缓。基于Scaling Law的模型能力提升路径逐渐显现边际效应,新架构的突破被视为打破行业僵局的关键力量。在AI技术向应用阶段过渡的背景下,用户体验的优化正从终端创新与场景适配主导,转向三者协同驱动的新模式,架构创新与算力扩张的融合将推动行业进入新一轮发展周期。

不同技术路线的分化正加剧大模型厂商的能力差异。联想集团、Manus等企业通过整合式策略形成竞争优势,其场景拓展战略与模型选择能力面临严峻考验。以联想天禧AI为例,该平台月活跃用户已突破2.8亿,年分发量达40亿次,注册开发者超23万,孕育出5000余款智能体及应用。AI编程工具Cursor年化收入突破10亿美元,AI agent平台Manus用8个月实现1亿美元营收,AI搜索工具Perplexity拓展代理功能后年化收入达2亿美元。这些规模化企业的崛起,迫使初创企业重新评估技术路线与场景适配策略。

领先企业的地位并非稳固。传统场景渗透率不足、新场景尚未成熟的市场格局下,联想集团等企业仍需持续优化模型选择策略。联想天禧AI采用多模型接入方案,整合DeepSeek、豆包、文心一言等主流大模型,用户可按需调用不同模型。其企业端产品联想百应智能体同样集成多个大模型,配合全时空记忆、知识库管理等核心技术,构建“AI Twin”个人数字分身体验。这种策略既规避了单一架构的技术风险,又覆盖了工业、政务、科研等全场景需求。

近期两大行业动向印证了多模型整合策略的价值。meta以数十亿美元收购采用同类策略的Manus,英伟达CEO黄仁勋在与联想集团CEO杨元庆对话中提出,未来AI系统将融合公有云前沿模型与企业私有定制模型,这种融合需要强大载体支撑。作为全球AI芯片龙头与服务器市场重要参与者,两大巨头的战略选择标志着产业链闭环的形成——从底层芯片到模型架构,再到应用场景的完整生态正在构建。

算力基础设施领域同步迎来变革。mHC架构依赖FP32高精度计算,对内存带宽和互联性能提出更高要求,主要适配英伟达生态。DDL与JEPA架构同样需要新型硬件支持。联想集团同步推进两条技术路线:1月4日发布的问天WR5215 G5服务器采用第五代AMD EPYC处理器,AI工作负载性能提升25%,功耗降低25%,散热能力翻倍,且100%兼容国产软硬件生态;与英伟达联合开发的RTX Pro服务器则搭载其最先进芯片,强调通用性优势。这种双线布局既满足差异化需求,又降低客户适配成本。

作为全球第三大服务器供应商、AI服务器市场亚军,联想集团的策略或成行业主流。尽管可能错失谷歌TPU、亚马逊Trainium3等定制芯片市场,但主流厂商仍难以完全摆脱对英伟达的依赖。市场预测英伟达明年GB300系列服务器机柜出货量将达5.5万台,其中谷歌、亚马逊采购量占3000至4000台。联想集团与两大云服务商的长期合作,为其保留了定制化芯片适配空间。硬件性能与模型需求的匹配过程,正考验着供应商的市场预判与响应能力,联想近期推出的两款服务器布局值得行业持续关注。

业界普遍预期DeepSeek将在春节前后发布重大更新,可能是推迟已久的R2模型或通用模型V4,mHC架构是否被纳入成为关注焦点。这些动向折射出市场对架构创新的期待,而大模型厂商与应用、算力企业的应对策略,将持续重塑行业竞争格局。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version