ITBear旗下自媒体矩阵:

阿里Qwen3.7系列模型来袭!实测奥赛数学编程不在话下 视觉任务轻松应对

   时间:2026-05-20 06:19:04 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

阿里最新推出的Qwen3.7系列预览版模型已正式上线,包含Max和Plus两个版本。根据大模型竞技场公布的评测数据,Qwen3.7-Max-Preview在主流基座大模型总榜中位列第13,成绩介于GPT 5.5与Grok 4.2之间,成为当前国产模型中排名最靠前的产品。该模型在数学、专家任务、软件与信息技术、编程等细分领域均取得优异成绩,其中数学领域排名第7,编程领域排名第10。

在数学能力测试中,Qwen3.7-Max-Preview仅用4分钟便正确解答了2025年IMO竞赛难题。与前代模型相比,其思维链总结显示分析过程更为简洁,自我核查环节明显减少,展现出更强的解题自信。编程任务测试中,该模型成功设计出具备计时、休息提醒、任务统计等功能的番茄钟应用,虽在首次打包时因颜色代码问题导致运行异常,但经调试后最终实现核心功能。

该模型在跨模态任务中同样表现突出。测试人员要求其直接生成HTML格式的AI社交媒体产品需求文档,模型跳过文字版中间步骤,一次性输出结构完整且包含原型设计的网页内容。在SVG动态图像生成任务中,模型准确绘制出鹈鹕骑自行车的动画场景。通用推理测试环节,模型通过分析"海龟汤"谜题中的线索,快速推断出女孩具有红绿色盲特征且非父亲亲生。

Qwen3.7-Plus-Preview在视觉任务评测中排名第16,成绩位于GPT 5.4与Gemini-3 Flash之间。面对进阶版"洗车店难题"时,模型通过分析卫星地图中的距离信息,结合现实场景逻辑,最终给出"开车洗车后步行返家"的最优解决方案。在地理识别测试中,模型根据建筑风格和山脉形态判断拍摄地位于中国北方,虽将凤凰岭误认为军都山,但实际定位误差控制在10公里范围内。

视觉与编程能力的结合测试中,Qwen3.7-Plus-Preview通过分析微信界面截图,准确识别UI设计风格并复刻出高仿真网页版聊天工具。虽然复刻版本的交互按钮暂无法使用,但整体界面布局与原版微信高度相似,展现出强大的视觉理解与代码生成能力。

据技术文档显示,Qwen3.7系列采用闭源发布模式,目前仅在Qwen Studio平台提供推理模式体验。Max版本暂不支持图像上传功能,两个版本的具体技术细节尚未完全披露。有消息称,阿里云峰会将进一步公布模型架构优化方案与训练数据构成等关键信息。

自2026年2月以来,阿里已连续发布Qwen3.5、Qwen3.6、Qwen3.7三代模型,迭代速度较2025年显著提升。这种高频更新策略使模型能够更快接收真实场景反馈,通过预览版与增量更新持续优化性能。测试人员反馈显示,新一代模型在响应速度、决策果断性方面均有明显改善,特别是在编程与视觉处理领域的能力提升尤为显著。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version