ITBear旗下自媒体矩阵:

OpenAI再升级!ChatGPT实现图像识别+语音指令 自动补全表单信息

   时间:2026-05-23 18:33:29 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

OpenAI近日宣布为ChatGPT赋予全新功能,用户上传表单文件后,可通过语音指令或文字描述直接完成信息填写。系统能够自动识别表单字段,并根据用户输入的内容智能补全信息,彻底改变了传统逐项手动录入的交互模式。

在官方演示场景中,用户上传健身俱乐部会员申请表后,仅需口头说明"姓名张三""住址朝阳区""健身目标减脂增肌",ChatGPT便自动识别表单结构并完成填写。整个过程如同与智能助手对话般自然流畅,无需反复切换输入界面或手动定位填写区域。

这项突破性功能整合了多模态技术能力,实现图像理解、语音交互与内容生成的协同工作。系统可同步解析上传图片中的文字信息,接收语音指令并生成符合上下文的填写内容。演示中更展示表单填写完成后,系统自动生成配套的会员卡设计图,展现多任务处理能力。

技术团队指出,当前版本生成的表单内容以静态图片形式输出,暂不支持直接编辑PDF或交互式文档格式。这意味着在法律文件签署等正式场景中,用户仍需将图片内容转录为可编辑格式。文件清晰度直接影响信息提取准确率,模糊或倾斜的表单可能导致字段识别错误。

该功能支持中英文等主流语言,可处理各类结构化表单,包括但不限于会员注册、问卷调查、订单确认等场景。OpenAI表示将持续优化图像解析算法,未来计划增加对复杂表格、手写字体及多页文档的支持能力。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version