滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

阿里Qwen3.5-Omni全模态大模型来袭！实测50分钟视频，解锁“用嘴编程”新技能

时间：2026-04-02 02:05:47 来源：快讯编辑：快讯 IP：北京 发表评论无障碍通道

阿里巴巴近日正式发布新一代全模态大模型Qwen3.5-Omni，标志着多模态人工智能技术迈入新阶段。该模型突破传统单一模态限制，支持文本、图像、音频及音视频的混合输入与输出，其中音频输出与文本输出可同步生成，为智能交互领域带来全新可能。

技术团队披露，Qwen3.5-Omni系列包含Plus、Flash、Light三种规格模型，最大支持256k长上下文处理能力。在音频处理方面，该模型可连续解析超过10小时的语音内容，音视频输入时长扩展至400秒（720P分辨率，1帧/秒）。经实测验证，模型在215项多模态任务中刷新多项最佳纪录，其音频理解、推理及翻译能力已超越Gemini-3.1 Pro，音视频综合处理水平与之持平。

该模型最引人注目的创新在于"视听编程"能力。在演示场景中，用户通过手机摄像头拍摄手绘草图并语音描述需求，模型即可实时生成对应的前端代码。当测试团队上传50分钟美剧《老友记》时，系统在1分钟内完成全片解析，不仅精准标注时间轴与人物关系，还能识别关键剧情转折点。更令人惊叹的是，模型可根据游戏直播画面自动检测违规内容，展现出色的多模态内容审核能力。

方言支持成为另一大亮点。模型现已兼容39种中国方言与74种外语的语音识别，可合成7种方言及29种语言的语音输出。在闽南语对话测试中，系统准确理解方言语义并生成地道语音回应，仅在极少数专业词汇上自动切换普通话。配合实时网络搜索功能，模型甚至能主动提供当日天气等动态信息，整个交互过程延迟控制在1-2秒。

交互体验实现质的飞跃。新模型引入语义打断机制，允许用户在系统"说话"时随时插入新指令，模型可智能区分有效指令与背景噪音。通过整合端到端语音控制技术，用户能直接调节输出语音的音量、语速甚至情绪表达。更突破性的是音色克隆功能，用户上传30秒语音样本后，模型即可复现该音色并完成多语言转换，在交替传译场景中实现声纹保持。

技术架构方面，Qwen3.5-Omni延续Thinker-Talker分工模式但进行全面升级。Thinker模块采用混合注意力MoE架构，通过TMRoPE编码技术实现长序列高效处理；Talker模块引入RVQ编码替代传统DiT运算，配合ARIA自适应对齐技术，使语音合成稳定性提升40%。经基准测试，新模型在长音频处理效率较前代提升3倍，音视频理解任务响应速度加快2.5倍。

该模型已开放API调用服务，支持离线与实时两种模式。定价体系采用阶梯计费，128k以下输入场景中，音频处理价格为4.96元/百万tokens，文本/图像/视频输入为0.8元/百万tokens。输出端文本+音频综合价格为61.322元/百万tokens，纯文本输出降至9.6元/百万tokens。开发者可通过阿里云百炼平台、魔搭社区及Hugging Face等渠道体验模型能力。

更多>同类资讯

雷军4月2日晚19时开启拆车直播，深度剖析小米新SU7全方位细节

月 1 日消息，今天午间，小米汽车官微宣布：4 月 2 日 19 时 ~24 时，雷军准备了一场拆车直播，拆一台新 SU7。据IT之家了解，小米新一代 SU7 车型于 3 月 23 日正式开启交付，当日上午…

04-02

雷军4月2日晚开启5小时直播深度拆解2026款小米SU7各细节

来源：环球网【环球网科技综合报道】4月1日消息，小米集团创办人、董事长兼CEO雷军通过社交媒体公布，其将于4月2日19:00至24:00开启一场长达5小时的“拆车直播”。在这场直播中，雷军将亲自带领技术…

04-02

小米新一代SU7上市表现亮眼首周交付超7000台备产充足销量可期

4月1日，小米汽车宣布，2026年3月，小米汽车交付量超过20000台，新一代SU7，自3月23日开启交付起，累计交付已超7000台。新一代小米SU7于3月19日正式发布，售价21.99万起，凭借硬核安全设…

04-02

小米YU7 GT纽北赛道展实力，高性能配置拉满，能否冲击量产SUV圈速榜首？

作为参考，目前位居纽博格林北环量产SUV圈速榜第一的是奥迪RSQ8Performance，成绩为7分36秒698。根据此前官方消息，小米SU7Ultra原型车纽北圈速6:22.091，总榜第三；量产车7:04…

04-02

特斯拉“王牌厂长”宋钢或加盟小米，助力小米汽车攻克产能交付难关

宋钢在特斯拉积累的从零开始建厂、快速产能爬坡、以及应对“产能地狱”的实战经验，将直接帮助小米汽车优化生产流程、提升效率、保障质量一致性，这是实现55万辆年交付目标的根本保障。（）值得一提的是，今天我们还得到消…

04-02

武汉萝卜快跑系统故障致车辆熄火，乘客高架滞留数小时等救援

3月31日晚20时起，百度旗下萝卜快跑因系统故障，导致多辆自动驾驶车辆于武汉市内高架环线熄火停驶，引发严重交通拥堵及事故。据网友反映，现场多车并排停滞在最左侧车道，造成三股车道被压缩至一股，部分区域拥堵达…

04-02

从萌芽到领跑：广州游戏产业20年狂飙，年营收1532亿铸就“中国第一城”传奇

04-02

Maison Margiela首登上海时装周，与小米跨界合作秀场亮点抢先看

04-02

AI赋能内容生态新飞跃：快手以可灵AI开启第二增长曲线

04-02

张雪机车WSBK夺冠：从修车学徒到身价7亿，资本与品牌共狂欢

04-02

牛奶界“新花样”大赏：非均质、A2奶、水牛奶……总有一款戳中你

04-02

小米汽车引入特斯拉前高管孔艳双，补强销售体系助力规模化交付

04-02

从应急到正餐：康师傅如何以创新重塑方便面，稳坐国人餐桌“C位”？

04-01

何享健“放手”交班方洪波：彻底放权下美的如何实现逆势增长？

04-01

电解质水赛道激战正酣：农夫山泉入局，谁能在这场巨头博弈中突围？

04-01

点击查看更多 +

全站最新

因湃电池拟IPO：从广汽自产项目到动力电池储能赛道竞逐者

小米YU7 GT纽北赛道展实力，高性能配置拉满，能否冲击量产SUV圈速榜首？

武汉萝卜快跑系统故障致车辆熄火，乘客高架滞留数小时等救援

公告精选︱沪电股份：拟68亿元投建印制电路板生产项目及其配套设施；江顺科技：未向海外公司寄送数据中心液冷板样

美股存储芯片概念股集体大涨

光明乳业解锁上海专属味道，"梧桐树下享浓上海"新品首发

热门内容

本栏最新

铜文创：借IP与国潮“破圈”，却难逃成本、结构掣肘成“泡泡玛特”难？

字节Seed大模型校招全球揽才 2027届AI新秀将获高起点与广阔成长空间

2026美妆行业新动向：精准细分、场景拓展等引领消费新潮流

网易智企阮良：企业拥抱AI正当时，用错可调不用则错失时代机遇

奥迪车主与雷军打赌后购小米SU7，上汽奥迪大气喊话：随时欢迎回归比脚感

字节Seed大模型校招全球启幕招募百位AI精英共探智能新边界

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.