ITBear旗下自媒体矩阵:

浪潮信息发布AI计算系统:破解智能体落地难题,为企业智能化转型添翼

   时间:2025-10-14 08:23:42 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

“智能体概念虽火,落地却困难重重。”如今,几乎所有企业都在积极探索人工智能技术的实际应用,智能体更是被视为企业AI转型的关键突破口。然而,在推进过程中,企业面临着诸多阻碍,这些问题如同横亘在智能化道路上的巨石,严重制约着企业的转型步伐。

浪潮信息首席AI战略官刘军在相关交流中指出:“大模型时代,企业面临的挑战是多维度的。技术层面的问题首当其冲,数据质量参差不齐、模型适配困难、算力投入巨大,同时还要在成本与效益之间找到精准的平衡点。”这些挑战,让企业在智能体落地过程中举步维艰。

为帮助企业突破智能体落地的困境,在近期举办的一场人工智能计算大会上,浪潮信息发布了面向智能体优化的AI计算系统,为企业指明了方向。

随着模型参数量的急剧增长,企业面临的压力与日俱增。刘军表示:“按照Scaling Law的发展趋势,模型参数量会持续增大。如何在一台机器上运行更大参数的模型,是企业必须攻克的难题。”从最初的几亿参数到如今的上万亿参数,模型的复杂度和计算需求呈指数级攀升,这对硬件的计算能力、系统的扩展性和稳定性都提出了前所未有的高要求。

在智能体商业化进程中,能力、速度和成本是决定成败的三大要素。模型能力随着大模型的发展不断提升,但速度和成本问题却成为企业亟待解决的痛点。刘军在专访中提到:“速度越快,客户体验就越好,能解决的场景问题也就越多。但速度提升往往伴随着成本增加,企业需要在两者之间找到最佳平衡点,才能实现商业化成功。”

在此背景下,企业迫切需要一种全新的计算系统架构来应对挑战,面向智能体优化的AI计算系统应运而生。浪潮信息推出的元脑SD200超节点AI服务器和元脑HC1000超扩展AI服务器,正是为解决智能体产业化面临的交互速度和token成本两大瓶颈而设计,为多智能体协同与复杂任务推理的规模化落地提供了高速度、低成本的算力支撑。

刘军介绍:“浪潮信息不会盲目追求技术和指标,而是紧密结合产业发展需求,聚焦算力应用中的核心挑战、痛点和瓶颈,针对性地进行优化和设计,确保产品能有效解决客户问题。”

在速度方面,浪潮信息通过技术创新,让智能体响应进入“毫秒级”时代。刘军将智能体交互比作高速公路上的车辆行驶:“智能体交互通常是小数据包,关键不在于道路宽度,而在于上下高速是否顺畅。浪潮信息通过技术优化,让数据直通上下高速,将延迟压到极致。”

以元脑SD200超节点AI服务器为例,它成功将DeepSeek R1大模型的token生成速度降低至8.9毫秒,引领国内大模型token生成速度进入“10毫秒时代”。为实现极低的通信延迟,元脑SD200采用精简高效的三层协议栈,原生支持多种内存语义操作,避免冗余数据拷贝,将基础通信延迟降至百纳秒级。同时,硬件化链路层重传与分布式预防式流控进一步适配高吞吐、低延迟的AI推理场景。

在成本方面,浪潮信息通过多种方式实现从“昂贵”到“可承受”的转变。一方面,将计算过程拆分解耦,提高每一部分资源的利用率,从而大幅节省成本;另一方面,在硬件设计上进行优化,降低能耗,提高计算模块的效率。

具体到产品架构,元脑HC1000采用全对称DirectCom极速架构,通过无损超扩展设计,聚合海量本土AI芯片,支持极大推理吞吐量。这种架构不仅提高了计算效率,还显著降低了硬件成本。在降本和软硬协同增效方面,浪潮信息创新16卡计算模组设计、单卡“计算 - 显存 - 互连”均衡设计,大幅降低单卡成本和每卡系统分摊成本。据测算,元脑HC1000通过算网深度协同、全域无损技术,实现推理性能相比传统RoCE提升1.75倍,单卡模型算力利用率最高提升5.7倍,最终实现了每百万token成本首次击破1元。

刘军强调:“Token成本决定了智能体的盈利能力,只有降低成本,才能实现大规模的商业化应用。”

这两款产品还针对不同行业的应用场景进行了优化。元脑SD200针对金融和能源等对延迟敏感的行业用户,能够快速响应客户需求,提升客户体验;元脑HC1000则能以更低的成本提供更多的Token服务,满足大规模商业部署的需求。

在数智化时代,智能体已成为企业数字化转型的核心驱动力。它不仅能提高企业的运营效率,还能创造新的商业模式,帮助企业实现更高效的客户互动、更精准的市场预测和更智能的决策支持。

浪潮信息通过元脑SD200和元脑HC1000,为医疗、能源等行业提供了强大的算力支持。在医疗行业,元脑SD200的高精度和高安全性计算架构,支持医疗影像分析和疾病诊断,大幅缩短诊断时间,提高医疗服务质量和效率;在能源行业,元脑HC1000的超扩展性和高可靠性,支持大规模的能源管理和优化,实现对能源生产、传输和消费的全链条智能监控与优化,提高能源利用效率,降低运营成本。

刘军指出:“未来5年,需要实现单Token成本同等数量级的下降,才能保持Token消耗量增加的相对平衡。这不仅需要技术创新,还需要企业与生态伙伴的紧密合作。”浪潮信息通过开放生态,与上下游伙伴、生态伙伴和客户紧密合作,共同推动数字化转型,加速转型速度,提高转型成功率。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version