滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

百度推出新一代轻量级OCR模型PP-OCRv5，仅0.07B参数量实现高效精准多语言文本识别

时间：2025-09-14 00:14:52 来源：IT之家编辑：快讯 IP：北京 发表评论无障碍通道

百度近日在开源平台Hugging Face正式推出新一代光学字符识别方案PP-OCRv5，该模型针对大型视觉语言模型（VLMs）在文本定位精度和计算效率方面的短板进行专项优化，为轻量化OCR应用提供全新解决方案。

作为模块化设计的双阶段模型，PP-OCRv5通过独立优化文本检测与识别流程，突破了传统VLMs在复杂场景下的边界框定位难题。其核心架构包含四大功能模块：图像预处理系统可自动校正拍摄角度与畸变；高精度检测器能精准定位文本行坐标；方向分类器确保文字正向排列；最终识别模块将图像像素转化为可编辑文本。这种解耦式设计使模型在保持0.07B参数量的同时，实现了移动端与边缘设备的实时处理能力。

性能测试显示，该模型移动版本在英特尔Xeon Gold 6271C处理器上可达每秒370字符的处理速度，在中文手写体、印刷体及英文、日文、拼音混合场景中，识别准确率显著优于Gemini 2.5 Pro、Qwen2.5-VL等通用VLM模型。其特有的边界框优化算法，可将文本定位误差控制在像素级，这对财务报表、法律文书等结构化数据提取具有关键价值。

语言支持方面，模型内置简体中文、繁体中文、英文、日文四大文字体系的识别引擎，同时通过扩展模块兼容超过40种国际语言。研发团队特别针对中文多字体、多排版特性进行优化，在古籍扫描、票据识别等垂直场景中展现出独特优势。

目前开发者可通过Hugging Face平台获取完整模型包，包含预训练权重、推理代码及场景化部署指南。该方案特别适用于移动端文档扫描、智能办公、工业检测等对延迟敏感的场景，其轻量化特性可使嵌入式设备在不增加硬件成本的前提下，实现专业级OCR性能。

更多>同类资讯

金山办公7月将推“企业大脑”WPS Comate 助力中大型组织AI办公升级

06-20

英国政府计划强制Meta、YouTube平台主推本土新闻内容

06-20

长沙国际工程机械展非洲分展启幕首日签约1.894亿美元拓展海外新市场

06-20

曹德旺谈内卷：我从来不怕竞争，优秀的企业需要强有力的对手

06-20

3月份，世界银行天然气价格指数上涨了24%

06-20

阳泉天文学会“追星”科普行：点亮校园星空播撒科学种子

06-20

神舟二十三号太空健身新升级！乘组每日锻炼有何奥秘？谁将挑战在轨一年？

06-20

外星人视角下的宇宙层界：灵魂的旅程与地球未解之谜探讨

06-20

智谱GLM 5.2登顶Design Arena网页设计AI榜单

06-20

一年500元授权一张脸：AI短剧缺脸严重律师提醒警惕陷阱

06-20

宇宙轮回新猜想：千万亿年后末日灰烬或成新宇宙起点，科学探索永无止境

他在2010年的书《宇宙的轮回》里抛出一个想法：宇宙会无限地循环迭代，前一次循环走到尽头的那个＂无限远＂，恰恰就是下一次大爆炸的奇点。彭罗斯模型给的答案是——或许宇宙已经试错了无数遍，前一茬的死亡，为后一…

06-20

Aura推出13.3英寸彩色墨水屏电子相框，低功耗+优化算法，售价499美元

06-20

智谱GLM 5.2登顶Design Arena榜单：性能提升显著性价比优势突出

06-20

安阳钢铁二炼轧作业部成功实现高锰无磁钢2炉连浇新突破

06-20

夏至日真相揭秘：白昼最长是真，日出最早日落最晚气温最高是假？

06-20

点击查看更多 +

全站最新

Jeep首款纯电硬派越野SUV Recon EV开售起售价66995美元续航未达预期引关注

摒弃旧路创新局，启境GX7以原生大五座重塑家庭SUV新标杆

7月1日起两项电动汽车新国标实施，安全要求升级保障出行安全

本田Super-N英国上市：轻量化设计+Boost模式，17万起售打造纯电驾驶乐趣小车

涨价潮下汽修店如何破局？嘉实多线下专供润滑油成门店盈利新选择

汽车市场竞争白热化，比亚迪凭技术产能优势下半年能否持续领跑？

热门内容

本栏最新

油田绿电制氮车邂逅氢能：开启多功能综合能源应用新前景

绿电制氮车：从试点到推广，为国内油田注入绿色高效新动能

云桌面革新企业智慧办公：集中管理、远程运维，提升IT管理效能与安全

AI多智能体协同开发：轻量APP从灵感到Demo的4步高效实践

视觉中国拟赴港上市谋“A+H”格局近三年营收波动净利下滑

支付宝政务AI“晓政”服务超1亿次，助力政务升级让群众办事更便捷高效

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.