腾讯自研语音通话模型即将上线,挑战豆包AI视频通话功能。近日,据钛媒体透露,腾讯旗下的大模型研发团队混元,正在紧锣密鼓地筹备其首个端到端语音通话模型Hunyuan-Voice的发布。据预计,这一创新技术最快将于今年6月亮相于腾讯元宝App,旨在为用户带来更加流畅的语音通话体验。
Hunyuan-Voice的问世,不仅标志着腾讯在语音技术领域的又一次突破,更被视为其对当前市场上热门AI视频通话功能的一次有力竞争。特别是与豆包AI的视频通话功能相比,Hunyuan-Voice凭借其端到端的优化设计和腾讯的技术底蕴,有望为用户带来更为自然、高效的通话体验。
不仅如此,腾讯在AI技术上的探索并未止步于此。据内部规划显示,腾讯已对多模态和全模态路线进行了深入布局。其中,备受瞩目的全球首个“全模态模型”更是被提上了日程。这一神秘的全模态模型,代号混元-O,被腾讯寄予厚望,旨在打造一个能够覆盖多种感知和认知能力的“世界模型”。
混元-O的推出,不仅将进一步巩固腾讯在AI技术领域的领先地位,更有望为全球AI技术的发展注入新的活力。随着技术的不断进步和应用的日益广泛,腾讯的AI技术将如何改变我们的生活和工作方式,无疑成为了业界和公众共同关注的焦点。