ITBear旗下自媒体矩阵:

千问APP接入万相2.5模型,视频创作升级,激发网友创意新热潮

   时间:2025-12-02 18:18:48 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

阿里旗下千问APP近日完成重大技术升级,正式接入万相系列最新模型Wan2.5,在移动端AI视频创作领域实现突破性进展。该模型不仅成为首个支持音视频同步输出的移动端解决方案,更在动作精度、肢体协调性等核心指标上达到行业领先水平,标志着多模态生成技术进入全新发展阶段。

技术评测数据显示,万相2.5在LMArena权威榜单中以显著优势领跑国内市场,其图生视频能力位居全球第三。该模型突破传统单模态限制,实现文本、图像、视频、音频的跨模态理解与生成,用户输入任意组合的多媒体素材均可获得高质量输出。特别在音画同步技术上,通过自研的动态对齐算法,使生成内容的口型匹配准确度提升至98.7%,动作流畅度达到专业级水准。

实际应用层面,千问APP推出"一键唱跳"功能引发创作热潮。用户仅需上传单张照片并输入描述文字,系统即可自动生成1080P高清视频,最长支持10秒动态呈现。测试覆盖人物、宠物、卡通、文物等20余类主体,均能保持高度自然的肢体表现。更值得关注的是,该功能突破模板化限制,支持用户自定义融合多张图片生成特色形象,再通过文字指令实现合唱、群舞等复杂场景的动态演绎。

技术团队透露,此次升级重点优化了三个维度:首先通过3D骨骼重建技术提升动作精度,使肢体运动轨迹误差控制在0.5像素以内;其次采用分层渲染引擎增强画面质感,确保高速运动场景下的细节保留;最后开发智能剪辑模块,自动匹配镜头运动与音乐节奏。这些创新使普通用户无需专业设备即可创作电影级动态内容。

市场反响超出预期,公测首周下载量突破千万次,在多个应用商店登顶工具类榜单。社交平台涌现大量创意作品,从历史人物现代舞到虚拟偶像演唱会,用户开发出图片融合、场景切换、多角色互动等进阶玩法。技术观察家指出,这种"低门槛、高自由度"的创作模式,正在重新定义数字内容生产范式。

据内部人士透露,研发团队正持续优化模型效率,未来计划将生成时长扩展至30秒,并增加实时互动功能。随着多模态技术的普及,AI视频创作有望从专业领域走向大众市场,为短视频、数字营销、在线教育等行业带来变革性影响。当前千问APP已开放企业级API接口,为开发者提供定制化解决方案。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version