阿里通义千问近期发布了一款名为Qwen3-30B-A3B-Instruct-2507的模型新版本,并已向公众开放源代码。这一新版本模型在技术上实现了重要突破。
据了解,Qwen3-30B-A3B-Instruct-2507采用了非思考模式设计,显著提升了长文本处理能力,最大可处理256K的文本长度。尤为引人注目的是,该模型在仅激活30亿参数的情况下,便展现出了与Gemini 2.5-Flash(非思考模式)和GPT-4o等未开源模型相当的性能水平。
阿里通义千问近期发布了一款名为Qwen3-30B-A3B-Instruct-2507的模型新版本,并已向公众开放源代码。这一新版本模型在技术上实现了重要突破。
据了解,Qwen3-30B-A3B-Instruct-2507采用了非思考模式设计,显著提升了长文本处理能力,最大可处理256K的文本长度。尤为引人注目的是,该模型在仅激活30亿参数的情况下,便展现出了与Gemini 2.5-Flash(非思考模式)和GPT-4o等未开源模型相当的性能水平。