ITBear旗下自媒体矩阵:

阿里千问Qwen3.5或即将发布 全新混合注意力机制引业内关注

   时间:2026-02-09 15:54:56 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

全球最大人工智能开源社区HuggingFace近日迎来重要动态,其开源项目页面中新增了一项关于Qwen3.5并入Transformers框架的代码合并申请(PR)。这一技术动向引发行业高度关注,多方推测阿里旗下千问大模型系列即将推出新一代基座模型Qwen3.5。

据技术社区披露的信息显示,Qwen3.5在架构设计上实现重大突破,首次采用混合注意力机制替代传统架构。更值得关注的是,该模型可能具备原生视觉理解能力,成为具备多模态处理能力的视觉语言模型(VLM)。这种技术特性使其在处理图文混合内容时具有显著优势,有望拓展人工智能在复杂场景中的应用边界。

开源策略方面,消息人士透露Qwen3.5将采取分层开放模式。基础版本计划开源至少包含20亿参数的密集型模型,同时提供参数规模在350亿至3000亿之间的混合专家模型(MoE)版本。这种多规格的开源方案既能满足学术研究需求,也为工业应用提供了不同量级的解决方案选择。

技术社区对Qwen3.5的期待源于其潜在的性能跃升。混合注意力机制被认为能有效提升长文本处理效率,而多模态能力则填补了当前开源模型在视觉理解领域的空白。若相关技术指标得到验证,这将成为继GPT系列之后开源领域最具影响力的模型升级之一。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version