ITBear旗下自媒体矩阵:

科大讯飞与华为携手,LogAnalyzer成果发布,开启智能运维新篇章

   时间:2025-09-25 21:01:37 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

在华为全联接大会2025期间,科大讯飞与华为联合宣布推出LogAnalyzer运维大模型应用成果,标志着国内智能运维(AIOps)领域实现从“被动响应”到“主动运维”的关键跨越。该成果已在超大规模集群运维场景中验证显著经济效益,科大讯飞AI工程院副院长吴婷与华为计算CCAE领域总裁鲁驰共同出席发布仪式。

当前智算集群运维面临多重挑战:大模型训练进入强化学习阶段后,训推迭代引发的故障模式动态变化,叠加新硬件与业务应用带来的未知故障,导致传统3个月周期的故障库更新机制难以应对现网问题。未覆盖故障需依赖跨领域专家手工分析,耗时从数天至数周不等,直接影响集群可用性。

针对上述痛点,双方自2024年5月起开展深度合作,将华为CCAE集群运维软件深度融入日常流程,并首次引入基于日志大模型的AI辅助分析引擎LogAnalyzer。该系统通过智能体架构实现疑难故障的快速定位,有效破解传统运维效率瓶颈。科大讯飞AI工程院副院长吴婷在发布现场演示了系统运行逻辑。

技术突破体现在三个维度:数据层面整合昇腾集群底层设备日志、CANN基础软件日志及十年故障诊断经验;分析层面通过异常日志感知提取关键信息,结合NPU领域知识生成进程级故障时间线;算法层面构建故障传播链模型,实现作业级异常事件的全链路追踪。这种多维技术融合使系统具备行业领先的智能诊断能力。

实际应用数据验证了技术价值:在科大讯飞超大规模集群中,LogAnalyzer上线4个月累计定位83个疑难故障,平均诊断时长压缩至10分钟,诊断准确率达88%。该成果不仅突破传统运维效率极限,更为行业树立了智能化运维的新标杆。双方表示将持续深化合作,从日志分析向多AI Agent系统演进,构建全球领先的智算集群运维解决方案。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version