据科技媒体Techcrunch披露,人工智能领域领军企业OpenAI正加速布局音频技术赛道。该公司近期完成跨部门资源整合,将工程、产品及研发团队集中投入音频模型升级项目,旨在打造具备颠覆性交互体验的语音交互系统。
消息人士透露,这家科技巨头计划在2026年春季推出新一代音频模型,该系统将突破现有技术瓶颈,实现接近人类对话的音质表现。其核心突破在于支持实时打断功能,用户可在系统播报过程中随时插入指令,同时系统还能同步处理双向语音流,这种多线程交互能力在现有语音助手中尚未实现。
在硬件布局方面,OpenAI被曝正在研发多款消费级设备。知情人士称,研发团队正测试两种形态的产品原型:一种是集成语音交互的智能眼镜,另一种是突破传统形态的无屏智能音箱。这些设备的设计理念强调情感陪伴属性,试图重新定义人机交互的边界。
值得关注的是,该公司近期以65亿美元收购的io公司,其核心技术团队已全面参与新项目研发。行业观察家指出,此次收购标志着OpenAI正式进军消费电子领域,试图通过音频优先的设计理念,解决现有智能设备在自然交互方面的核心痛点。据内部文件显示,新系统将深度整合多模态感知能力,在语音交互中融入环境感知与情感识别功能。











