智谱公司近日在官方渠道宣布,其自主研发的轻量级专业OCR模型GLM-OCR已正式对外发布并开源。该模型以0.9B的参数量级实现了高效能表现,在文档解析领域展现出显著优势。
作为一款专为复杂文档场景设计的工具,GLM-OCR支持通过vLLM、SGLang和Ollama等多种框架进行部署。这种多平台兼容性使其能够灵活适配不同技术栈的开发需求,为开发者提供了更便捷的应用选择。
在权威评测基准OmniDocBench V1.5中,该模型以94.6分的成绩刷新了榜单纪录,在文本识别、公式解析、表格结构还原及信息抽取四个关键维度均超越同类专用模型。其综合性能表现已接近国际领先水平的Gemini-3-Pro模型,而参数量仅为后者的约百分之一。
技术团队透露,GLM-OCR通过创新的架构设计实现了算力与精度的平衡。其轻量化特性不仅降低了部署成本,更在保持专业级解析能力的同时,显著提升了处理速度。这种特性使其在移动端设备、边缘计算等资源受限场景中具有广阔应用前景。





