滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

AI高考数学大比拼，豆包元宝并驾齐驱，o3表现引思考！

时间：2025-06-09 11:20:59 来源：ITBEAR编辑：快讯 IP：北京 发表评论无障碍通道

近日，一场别开生面的高考数学模拟测试吸引了广泛关注。此次测试并非由传统考生参与，而是六大人工智能模型——字节的豆包、腾讯的元宝、阿里的通义、百度的文心X1Turbo、深度求索的DeepSeek以及OpenAI的o3，共同挑战2025年新课标Ⅰ卷的14道客观题。

测试环境严格，所有模型在无系统提示和联网搜索的条件下独立作答，且每个模型只有一次答题机会。测试题目总分73分，包括单选题、多选题和填空题，全面考察了模型的数学推理能力。

测试结果显示，豆包和元宝以并列第一的68分成绩脱颖而出，展现了卓越的数学解题实力。相比之下，DeepSeek和通义分别以63分和62分紧随其后，但稍显不足。而文心X1Turbo和o3的表现则令人遗憾，尤其是o3，仅得34分，显示出对高考数学题目的适应性有待提高。

深入分析各模型的答题情况，豆包、通义和元宝在单选题上表现优异，均获得了35分。DeepSeek因两道题失误而失分，最终得30分；而o3在单选题上更是表现不佳，仅得20分，错误率高达50%。然而，在多选题方面，豆包、DeepSeek和元宝均展现出了强大的稳定性，三道题全部答对。

值得注意的是，尽管通义在答题速度上表现出色，但在多选题的关键时刻出现了判断失误，导致得分不理想。此次测试不仅揭示了各模型在数学解题上的潜力和短板，也反映出它们在逻辑推理和细节处理方面的进步与不足。

与去年相比，这些人工智能模型在数学能力上有了显著提升，特别是在公式应用和逻辑推理方面。尽管仍存在一定的错误和缺陷，但此次测试无疑为AI在高考数学领域的应用和发展奠定了坚实基础。

更多>同类资讯

烟台老工业城的“隐形冠军”：借AI东风，从传统制造跃向全球核心链

07-15

消息称荣耀Robot Phone手机8月登场，影像配置曝光

07-15

亿航智能回应裁员传闻：基于AI提效背景优化低绩效岗位

07-15

智谱：公司英文名称已变更为Z.AI Co,Ltd

07-15

英伟达与三菱重工拟合作，冷却与能源技术融入AI数据中心

07-15

为什么 AI 越火，越赚不到钱？

07-15

第5代帝豪i-HEV兰州上市！以2L级超低油耗重塑国民混动家轿新标杆

07-14

长安汽车上半年净利润下滑，下半年发力海外，“天枢领航”助力新征程

07-14

比亚迪斩获5项国家科技奖，巨额研发投入如何铸就新能源技术硬实力？

07-14

固态电池：突破电车瓶颈，引领新能源产业迈向全新发展阶段

07-14

全球最大变质岩潜山油田二期组块完成海上安装，多项创新助力高效建造

07-14

面壁智能CTO曾国洋：从“打字机”到大模型，端侧AI的进化与突围

07-14

28岁面壁智能CTO曾国洋：领航端侧AI，以“知识密度”开启智能新篇

07-14

高德ABot-World Studio开放测试：单卡部署超长推理，赋能多领域交互新体验

07-14

丰台暑期航天科普体验周启幕科学实验与互动展项让青少年“探秘星辰”

07-14

点击查看更多 +

全站最新

宁德时代利润高企与车企利润走薄：同处产业链为何命运迥异？

中汽协澄清：新能源车平均车龄1.8年不等于置换周期和使用寿命

长安汽车夏季降温秘籍：远程预冷+科学对流轻松打造清凉座舱

第5代帝豪i-HEV兰州上市！以2L级超低油耗重塑国民混动家轿新标杆

博格华纳2026北京车展展锋芒，以电驱动技术赋能全球未来出行

长安汽车上半年净利润下滑，下半年发力海外，“天枢领航”助力新征程

热门内容

本栏最新

第5代帝豪i-HEV兰州上市！以2L级超低油耗重塑国民混动家轿新标杆

长安汽车上半年净利润下滑，下半年发力海外，“天枢领航”助力新征程

固态电池：突破电车瓶颈，引领新能源产业迈向全新发展阶段

腾势Z国内预售火热开启百万级定价彰显硬核实力与技术自信

回归百日张明霞操刀新叙事，奔驰纯电GLC开启电动化新征程

星瑞L PLUS首搭激光雷达破局燃油车智能体验能否借此逆袭？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.