ITBear旗下自媒体矩阵:

Mistral AI推出OCR4模型:170种语言支持,文档识别领域挑战GPT与Gemini

   时间:2026-06-26 20:24:14 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

在光学字符识别(OCR)领域,法国人工智能初创企业Mistral AI近期成为行业焦点。该公司正式发布了一款名为OCR 4的文档内容识别模型,凭借其出色的性能和多语言支持能力,迅速引发市场关注。这款模型不仅支持横跨10个语族的170种语言,还在权威基准测试OmniDocBench中取得了93.07分的高分,其输出质量甚至超越了GPT 5.5 Pro、Gemini 3.1 Pro Preview等知名竞争对手,获得了人类评审的高度认可。

与传统追求参数规模的模型不同,OCR 4走的是高效专精路线。它专注于文档识别任务,能够在输出识别文本的同时,提供边框定位、区域分类及置信度评分等附加信息。这种设计使其能够灵活应用于多种下游场景,包括RAG语义分块、智能体结构化基本单元以及连接器结构化内容处理等,为文档智能处理提供了强大的技术支撑。

在定价策略上,Mistral AI也展现了其市场敏锐度。OCR 4基础API的调用费用为每千页4美元,若采用批处理方式,用户还可享受50%的折扣优惠。公司还提供了文档人工智能服务,定价为每千页5美元,进一步满足了不同用户的需求。

作为欧洲AI领域的代表性初创公司,Mistral AI此前已通过开源与闭源并行的模型策略在全球市场崭露头角。此次OCR 4的推出,标志着该公司将业务范围从通用大语言模型扩展至文档智能处理这一垂直赛道。这一举措不仅展现了Mistral AI的技术实力,也使其直接与OpenAI、Google等科技巨头在基础工具层展开了激烈竞争。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version