阿里通义千问一周三连击，开源模型实力问鼎全球开闭源巅峰

时间：2025-07-26 22:33:32 来源：智东西编辑：快讯团队 IP：北京 发表评论无障碍通道

近日，阿里巴巴的通义千问团队在人工智能领域再次投下了一枚震撼弹，宣布开源其最新升级的Qwen3-235B-A22B推理模型——Qwen3-235B-A22B-Thinking-2507。

这款新模型拥有2350亿参数，其中激活参数为220亿，支持高达256K的上下文长度。在编程、数学、知识推理、人类偏好对齐等多个维度的测评中，Qwen3-235B-A22B-Thinking-2507的表现堪比Gemini-2.5 pro、o4-mini等顶尖闭源模型，甚至在某些测试中大幅超越了DeepSeek-R1等开源竞品，树立了全球开源模型的新标杆。

Qwen3-235B-A22B-Thinking-2507的发布，正值阿里巴巴一周内连续开源三款重量级模型的高潮阶段。此前，团队已推出了Qwen3-235B-A22B非思考模式的更新版本，以及专为编程任务设计的Qwen3-Coder-480B-A35B-Instruct模型。这三款模型在全球权威测评中均取得了优异成绩，分别在基础模型、编程模型和推理模型领域夺得开源冠军。

值得注意的是，Qwen3-235B-A22B-Thinking-2507的推出，是通义千问团队积极响应开发者社区反馈的结果。团队在X平台上表示，经过深思熟虑，决定停止使用混合思考模式，转而分别训练Instruct和Thinking模型，以追求最佳质量。这一决策得到了开发者们的广泛赞誉，也进一步增强了团队的“最听劝”形象。

在Qwen3-235B-A22B-Thinking-2507发布后，开发者们纷纷在社交平台上分享和点赞。有网友称赞其为“名副其实的‘思考模式’”，并惊叹于其在基准测试中的卓越表现。从编程能力的LiveCodBenchV6测试，到知识能力的SuperGPQA测试，再到推理能力的HMMT25测试，Qwen3-235B-A22B-Thinking-2507均展现出了强大的实力。

具体来看，在知识测评方面，Qwen3-235B-A22B-Thinking-2507在MMLU-Redux、GPQA、SuperGPQA等测试中均超越了DeepSeek-R1-0528，得分直逼OpenAI o3、Gemini-2.5 Pro等顶尖闭源模型。在推理测评中，该模型在AIME25、HMMT25、LiveBenc、HLE等测试中同样表现抢眼，得分远超Deepseek-R1-0528、OpenAI o3、Claude4 Opus Thinking等竞品。在编码、一致性、Agent和多语言能力等测评中，Qwen3-235B-A22B-Thinking-2507也均取得了优异成绩。

此次开源的Qwen3-235B-A22B-Thinking-2507模型，已在魔搭社区和Hugging Face平台上架，采用Apache2.0开源协议，允许用户免费下载并用于商业用途。用户还可以通过QwenChat体验该模型，感受其强大的思考和推理能力。

随着Qwen3系列模型的连续开源，阿里巴巴通义千问团队在全球AI领域的影响力日益增强。开发者们对团队的响应速度和开源态度表示赞赏，纷纷催更更多尺寸的模型版本。面对开发者的热情期待，团队相关负责人表示，将继续努力推出更多高质量的开源模型，为开发者们提供更多选择和可能性。

海管家智链logicforce大模型是苏州海管家物流科技有限公司（简称“海管家”）自主研发的货代业务领域专业大模型，作为国际物流行业首个通过生成式人工智能服务备案的企业级应用，通过货代领域海量专业训练语料的…

尽管“AI工厂”可以扩展，但张建中指出，一开始可能1000张卡针对千亿参数的大模型，当到一万张卡的时候，能力就不一样了，需要重新搭建物理拓扑结构、管理方式、集群系统，所有的任务调度以及各种不同的算子和效率需…

通过将模型部署在企业自身掌控的基础设施中，核心目标在于实现核心数据资产完全掌控，确保业务敏感信息永不外流，同时内容生成成本显著降低，避免按次付费模式的长期支出。同时，企业级方案设计确保部署的稳定性和扩展性，为…

记者了解到，“磐石·科学基础大模型”是采用专业科学知识和数据进行训练、服务于科学任务的智能底座，实现了对波、谱、场等多种科学模态数据的深入理解，具备科学文献萃取融合、科学知识表征推理和科学工具编排规…

该文档是辰木互动2025年5月推出的小红书情绪营销白皮书，核心围绕情绪营销展开，阐述其在消费新周期的重要性、应用方法、执行策略、风险及辰木相关服务等内容。整体而言，当下品牌可借情绪营销突破功能价值困局，辰…

7月26日举办的世界人工智能大会（WAIC）上，百度三大AI核心技术和产品——萝卜快跑、飞桨深度学习平台、百度智算集群，入选中国人工智能产业创新成果展。今年4月，百度智能云成功点亮了自研3万卡级超大规模计算…

例如，在生命科学领域，以蛋白质相互作用的药物靶点发现的研究，相对现有范式科研效率加速超过10倍；在高能物理领域，模型有效提升了粒子模拟速度与重建效率，为探索物质基本组成和宇宙基本规律提供了助力；在力学研究中…

从北京胡同到迪拜沙漠，这是中国自动驾驶技术首次在海外实现城市级规模化应用，这也充分展现出百度在彰显着中国科技出海的加速度。显而易见的是，百度选择了一条更艰难的路：投入1700亿研发无人驾驶和人工智能，耗时…

而原生记忆能力是大模型迈向通用人工智能的关键基石，其重要性在于不仅能够让模型记住用户是谁、曾经说过什么、喜好什么，更能在长期交互中实现知识更新、个性化演进与情境理解，在此基础上，模型才能从工具进化为真正的个…

在1985年时，我提出了一个非常小的模型，想把这两个理论结合在一起，去更好理解“人类是如何理解一个词的”，每一个词我都放了好几个不同的特征，然后把前一个词的特征记录下来，就能预测下一个词是什么、进而再预测再下…

模型基于复杂时空建模、流匹配图片视频渐进式联合训练、端到端局部可控注意力机制等创新，同时引入多模态理解信息提升对文本指令和输入条件图像视频的感知能力，联合图文交织数据训练，实现既能生成高质量的图像视频，又能进…

“磐石·工具调度台”旨在降低科研工具的使用门槛，可自主规划及调用超过300个科学计算工具，实现工具的协同编排和便捷调用，可自动识别科研任务、智能编排并调度最优工具链，提升科研流程效率，支持用户灵活接入自有智…

在现场观察发现，不同领域的观众都对于大模型公司有着极强的好奇，而类似于阶跃星辰这样的公司展示出的有趣产品，也将帮助他们更好地理解AI和现实的关联。今年展会现场，B站带来了众多站内爆款的AI及机器人主…

作为香港本地领先的科技企业，GOODDEED深耕软件开发、技术解决方案提供及本地业务运营，其技术团队凭借深厚专业功底，将大数据与AI深度融入业务场景——从软件开发注重用户体验与技术创新，到解决方案提供“咨询…

人设与回复逻辑设置是核心，需包含角色规范和思考规范，角色规范明确智能体作为关键词排名助手的任务，思考规范涵盖关键词获取、搜索引擎选择、排名查询、结果展示等步骤，且每段结尾需引导用户点击线索转化并发送知识库获取…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.