国内知名第三方评测机构SuperCLUE近期揭晓了中文原生工业大模型测评新成果,其发布的SC-Industry(SuperCLUE-Industry)榜单上,北电数智的骄阳·工业大模型以总分83.44的高分勇夺榜首。
SuperCLUE作为业界权威的通用大模型综合评测平台,此次发布的SC-Industry测评基准特别针对中文语义环境和国内工业场景设计,旨在全面评估工业大模型在解决行业实际问题方面的能力。该评测不仅考量了模型的知识库储备,更侧重于其通用性与可拓展性在工业领域的应用表现。
SC-Industry的评测体系涵盖了基础能力和应用能力两大方面,具体包括工业常规问答、工业数据分析、工业文档问答、工业智能体Agent、工业理解计算、工业代码生成六大核心能力。通过构建专业的测评数据集,并结合严格的评估流程、标准和规则,SuperCLUE对参评大模型进行了全面而细致的评估。
在榜单中,骄阳·工业大模型不仅总分领先,其应用能力更是以90.07分的优异成绩独占鳌头。在工业数据分析这一细分维度上,骄阳·工业大模型凭借90.38分的最高分,展现了对表格类数据的卓越分析能力和深刻洞察。同时,在工业智能体Agent的评测中,它以89.97分的高分领跑,显示出在复杂工业环境中强大的自主或半自主执行任务能力,以及与其他系统交互优化或辅助工业流程的高效决策能力。
SuperCLUE在报告中强调,产业级应用能力已成为新的竞争分水岭。骄阳·工业大模型在工业数据分析上的出色表现,不仅彰显了国产模型在工业任务能力上的突破,也预示着在基础能力日益趋同的背景下,工业数据分析与智能体表现将成为拉开差距的关键因素。
北电数智在推动工业大模型发展方面,采取了产业协同和技术突破双轮驱动的战略。一方面,公司致力于建立工业数据标准和开放协议体系,利用可信数据空间技术实现数据的安全共享;另一方面,公司重点研发场景化微调数据生成和复杂任务强化学习等核心技术,有效提升了模型的行业认知能力。目前,骄阳·工业大模型已成功构建了精准的垂类认知、高质量数据治理体系和严格的安全合规管控机制三大优势。
据悉,在即将召开的2025 WAIC世界人工智能大会上,北电数智将正式发布骄阳·工业大模型,并围绕工业企业最为关注的“AI+生产、AI+产品、AI+运营、AI+基础设施”等核心业务场景,分享其创新能力和标杆实践。此次发布将进一步展示北电数智在垂类大模型领域的阶段性研发成果,以及依托北京电控深厚工业基因的差异化竞争能力。