滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

‍阿里9月12日开源Qwen3-Next-80B-A3B系列模型，带来四大核心架构改进‍

时间：2025-09-12 13:45:40 来源：ITBEAR编辑：快讯团队 IP：北京 发表评论无障碍通道

阿里巴巴近日宣布推出全新一代基础模型架构Qwen3-Next，并同步开源了基于该架构的Qwen3-Next-80B-A3B系列模型。这一突破性成果标志着阿里在人工智能基础研究领域迈出了重要一步，为行业提供了更高效的模型开发解决方案。

相较于前代Qwen3采用的MoE模型结构，Qwen3-Next在架构设计上实现了多项关键升级。其中最引人注目的是混合注意力机制的引入，该机制通过动态调整不同层级特征的关注权重，显著提升了模型对复杂语义的理解能力。同时，高稀疏度MoE结构的应用使得模型在保持高性能的同时，计算资源消耗大幅降低。

在训练优化方面，研发团队开发了一套全新的稳定训练框架。这套框架通过动态调整梯度更新策略和参数初始化方式，有效解决了大模型训练中常见的梯度消失和参数震荡问题。多token预测机制的加入使模型推理效率得到质的飞跃，能够同时处理多个语义单元的预测任务，大幅提升了实际应用场景中的响应速度。

开源的Qwen3-Next-80B-A3B系列模型包含不同参数规模的版本，可满足从移动端到云端的多场景部署需求。该系列模型在保持800亿参数规模优势的同时，通过架构优化实现了3倍以上的推理加速，为智能客服、内容生成等实时性要求高的应用提供了有力支撑。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

阿里百度自研芯片训练AI模型，阿里美股大涨8%创52周新高

09-12

阿里通义深夜发布Qwen3-Next架构，3B激活参数媲美旗舰，成本效率双突破

09-12

蚂蚁集团推出gPass技术框架，以金融级安全赋能AI眼镜，解锁自然无感交互新体验

09-12

抖音电商严打服饰直播违规：今年已中断7.4万直播间，6400余人权限被收回

09-12

京东“广谱自营”战略解析：深耕供应链，拓展老用户消费版图

09-12

小红书热搜引争议后加速电商布局，架构调整能否破解商业化难题？

09-12

《这个保镖太无敌了》爆火出圈，阅文短剧爆款频出背后的方法论是什么？

09-12

动漫之家2025年9月10日正式停运，曾是国内首个综合性动漫社区终落幕

09-12

西贝与罗永浩“过招”：上架同款菜单，店员透露可称“老罗菜单”且后厨将开放

09-12

对话西贝前员工：西贝菜品制作全流程曝光，预制菜争议背后有何隐情？

09-12

罗永浩9月12日谈视频播客：网友提议西贝老板上节目，我为何直言“不想毁了他”？

09-12

罗永浩“仗义执言”引波澜，贾国龙折腾史下预制菜风波何解？

09-12

预制菜争议再起：罗永浩发声VS西贝力证，餐饮业透明化之路何去何从？

09-12

《中国企业家》副总编透露：西贝风波致全国门店日营收骤减超200万

09-12

罗永浩“预制菜”质疑后，记者实地探访西贝后厨操作实况

09-12

点击查看更多 +

全站最新

斯堪尼亚中国版重卡亮相：全新中文车标加持，40吨牵引力配环视系统

自动挡车开长下坡别慌！掌握这个操作，降低刹车负担，安全又稳当

自驾游时同行人开车有这3个表现？小心！他的驾驶水平可能不过关

传统豪华阵营量价齐跌困境凸显奔驰新能源转型遇阻亟待破局突围

8年纯电车主亲历：电费虽省但保值率低，续航衰减成痛点，电车稳定性待提升

百年宝马的坚守：全景iDrive如何诠释电动时代“纯粹驾驶”新逻辑

热门内容

本栏最新

大润发快消品领域换帅！吕国铭退休李春德接任，老牌商超如何破局？

跨境电商玩具卖家必看：TIC验证如何助你产品合规稳住销量？

蚂蚁财富外滩大会推三大AI助手，助力金融机构提效赋能投资者体验升级

科技股蓄势待发！深度携手甲骨文、英伟达、华为的这五家公司值得关注

私域电商名词大揭秘：掌握这些，轻松搭建私域运营体系！

realme真我新耳机专利曝光：耳夹式设计或适配运动户外场景并具健康监测功能

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.