ITBear旗下自媒体矩阵:

百度PaddleOCR3.1升级:多语种识别强化,推出文档翻译与MCP服务器功能

   时间:2025-07-08 11:08:01 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道

百度AI团队近期正式推出了PaddleOCR3.1版本,这一新版本在多语种识别、复杂文档处理以及大模型连接方面实现了显著升级。新版本PaddleOCR3.1支持多达37种语言的文本识别,其识别精度相较于之前版本有了超过30%的提升。

为了满足全球化场景下的多语言需求,PaddleOCR3.1引入了全新的PP-OCRv5多语种模型。这一模型不仅涵盖了法语、西班牙语、俄语等多种语言,还借助文心4.5多模态大模型的视觉与文本理解能力,实现了高置信度的文本检测与数据标注。特别是在拉丁语系和东斯拉夫语言场景中,新模型的识别准确率有了大幅提升,例如韩文识别的错误率从8.7%显著降低到了2.1%,俄文复杂排版文档的解析速度也提升了两倍。

PaddleOCR3.1还推出了PP-DocTranslation翻译产线,这一工具结合了PP-StructureV3文档解析引擎与文心大模型的能力,能够智能识别PDF、图片中的复杂元素,如表格、公式、手写文字等,并将其转换为Markdown格式后进行多语言翻译。对于法律、医疗等专业领域,用户还可以上传术语对照表,实现专业术语的精准翻译。据悉,某跨国药企在使用该功能后,药品说明书的翻译效率提高了40%,专业术语的一致性也达到了99.2%。

为了降低AI应用开发的门槛,PaddleOCR3.1还特别推出了MCP(Model Context Protocol)服务器功能。通过标准化的协议,开发者可以轻松地将OCR能力无缝接入到下游应用中。搭建MCP服务的过程也非常简便,开发者只需几步操作,就可以通过本地Python库、飞桨星河社区或自托管服务来调用包括图像文字识别、文档版面分析在内的核心功能。

感兴趣的用户可以访问PaddleOCR的开源地址:https://github.com/PaddlePaddle/PaddleOCR,了解更多详情并进行下载使用。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version