海光信息近日宣布,其自主研发的DCU(深度计算单元)已成功与上海人工智能实验室旗下的OpenDataLab团队和DeepLink团队展开深度技术协作,完成了与智能文档语料解析引擎MinerU的全栈适配工作。这一合作标志着海光在AI算力与数据处理领域的生态布局迈出关键一步。
据介绍,MinerU作为一款专注于非结构化文档解析的智能引擎,能够将各类复杂文档转化为AI模型可直接使用的结构化数据。通过与海光DCU的深度适配,该引擎在数据转化效率上实现显著提升,同时大幅降低了计算资源消耗,为AI训练提供了更经济、更高效的数据预处理方案。
此次技术突破得益于海光"自研AI软件栈+开放生态"的战略布局。海光DCU凭借其异构计算架构优势,与MinerU的解析算法形成高效协同,在保持低延迟的同时,实现了对PDF、Office文档、扫描件等多类型文件的精准解析。测试数据显示,适配后的系统在处理速度上较传统方案提升超过40%,能耗降低近30%。
上海人工智能实验室相关技术负责人表示,此次合作构建了"算力+数据"的协同创新模式。海光DCU提供的强大底层算力支持,与MinerU在数据解析层面的技术优势形成互补,为AI大模型训练提供了从原始文档到高质量训练数据的完整解决方案,特别在金融、医疗、法律等文档密集型行业具有广泛应用前景。
目前,双方已启动下一阶段合作计划,将针对多模态文档处理、实时解析等场景展开联合研发。海光信息透露,其DCU生态已接入超过50家AI上下游企业,未来将持续通过开放合作模式,推动AI基础设施技术的创新突破与应用落地。











