GPT-5.2与Gemini同日“交锋”：性能与性价比的AI大模型之争升级

时间：2025-12-12 16:47:19 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在人工智能大模型领域，竞争的火药味愈发浓烈。OpenAI与谷歌等科技巨头正展开一场激烈的角逐，不断推出新产品和新技术，试图在这场变革中占据领先地位。

OpenAI近期正式上线了GPT-5.2，这一动作被视为其巩固市场地位的重要举措。此次发布的GPT-5.2包含Instant、Thinking和Pro三款不同层级的模型，旨在满足不同用户的需求。OpenAI宣称，GPT-5.2在专业工作方面表现卓越，其Thinking模型被认为是最能胜任各类现实专业用途的模型。在博士级别的专家推理评估GPQA Diamond中，该模型得分高达92.4%，在最新美国数学邀请赛（AIME2025）中更是拿到满分。在GDPval测试中，Thinking模型也获得了70.9%的高分，领先于竞争对手。

在实际应用场景中，GPT-5.2也展现出了强大的能力。它可以制作表格、整理分析数据、制作项目流程图，在编写代码、制作PPT、图像感知、理解长上下文、使用工具以及处理复杂的多步骤项目方面都表现出色，错误率较前代产品大幅降低。一些使用者给予其“最强AI打工人”“职场最佳拍档”等称号，对其在实际工作中的表现给予了肯定。

然而，GPT-5.2也面临着一些挑战。在输入输出价格方面，它比前代贵了40%，输入价格21美元，输出价格高达168美元。这一价格调整引发了一些担忧，此前OpenAI堆算力发展大模型的做法就已受到质疑，此次价格上涨可能会进一步加剧市场的质疑。一些用户反映Thinking和PRO的应答时间明显较慢，甚至比前代产品还要慢，这对于逐渐嵌入日常生活和工作的AI产品来说，可能会影响用户体验。普通即时版GPT-5.2在一些常识问题上犯错，也引发了用户的吐槽。

就在OpenAI发布GPT-5.2的同时，谷歌也展开了反击。谷歌抢在GPT-5.2前一个小时左右进行了产品更新，宣布其深度研究智能体Gemini Deep Research全面增强，并首次向开发者开放。Gemini Deep Research基于Gemini 3 PRO构建，通过多步强化学习训练，显著减少了“幻觉”，在复杂研究任务中表现出更高精度。在人类终极大考（HLE）中，Gemini Deep Research得到46.4%分，比GPT-5.2 Thinking的45.5%要高，仅低于GPT-5 Pro的50%。而且，其成本极低，谷歌产品经理透露，新版智能体在与GPT-5 Pro表现相当的同时，成本仅为后者的十分之一左右，展现出强大的性价比优势。

谷歌还同步开源了基准测试工具DeepSearchQA，包含覆盖17个领域的900项复杂任务，为科学评估研究型智能体的能力提供了支持。谷歌凭借更好的性价比、另辟蹊径的训练模式、强大的现金流以及自研专用芯片等优势，持续给OpenAI带来压力。

除了谷歌，OpenAI还面临着其他竞争对手的挑战。Anthropic等公司也在不断推出新产品，meta和DeepSeek等竞争者同样有着令人期待的新品可能面世。此前有消息称，OpenAI在加速开发自身全新的模型“Garlic”，试图通过新的方式重建绝对领先的优势。

在这场大模型之争中，AI芯片也扮演着重要的角色。英伟达最近与美银举办了一次投资者线上交流会，英伟达方面提到，只依据Gemini 3的表现比GPT5更优，就认为谷歌自研的TPU要好于英伟达的GPU是不合理的。目前大部分的大模型都是用上一代H系列芯片训练的，用Blackwell训练的大模型要到2026年才会上线，其优势到时才会显现，更不用说还未投入使用的新一代超级芯片Rubin。市场对英伟达的说法看法不一，但这场关于AI芯片的讨论也让明年的大模型之争更加引人关注。

随着各大科技巨头不断推出新产品和新技术，AI大模型领域的竞争愈发激烈。这场竞争不仅关乎大模型的能力，还涉及到大模型的训练、发展路径以及AI芯片的未来走向。2026年，这场激烈的竞争预计还将继续升级，各方的表现值得期待。

一艘正在执行常规海洋环境勘测任务的科研船，突然捕捉到一条异常信号。科研人员立即启动了应急探测程序，随后将一个筒形装置打捞出水。该装置通体采用耐腐蚀合金材质，表面覆盖仿生涂层，隐约可见外文标识。科研团队联想…

它搭载了封闭式的安卓系统，官方最后版本是2.42.118，只集成了米家、爱奇艺、B站等极少数APP，不允许用户下载第三方APP，因此才需要刷机。最新固件是基于安卓8.1内核的V5版本，刷完后不仅能装第三方…

在AI眼镜赛道，华为和苹果并非“第一个吃螃蟹的人”，Meta于2023年引爆AI眼镜市场后，小米、夸克、理想等科技公司纷纷推出相关产品。套用前百度产品副总裁、首席产品架构师俞军的产品价值公式“产品价值=（…

4月16日，来自阿里的消息，阿里巴巴（BABA.US）正式发布世界模型产品HappyOyster（快乐生蚝），基于原生多模态架构，具备多模态理解与音视频联合生成能力。阿里的HappyOyster与谷歌的Ge…

据知情人士透露，四足机器人与人形机器人均被列入了该部门的长期产品规划路线图。高德在最新声明中确认了上述业务进展，表示团队正持续迭代具身智能模型，并积极推进四足及人形机器人的研发探索，其首款四足机器人预计将于…

凤凰网科技讯 4月16日，阿里巴巴ATH事业群推出开放式世界模型产品“Happy Oyster”，主打实时世界创建与交互。该产品可生成动态三维环境，支持影视制作、游戏开发等场景。其与HappyHorse同属…

4月15日，一款标注为来自阿里巴巴的世界模型ABot-PhysWorld登顶世界模型领域的权威评测WorldArena。今年2月，高德发布两款ABot系列基座模型，分别是具身操作基座模型ABot-M0与具身…

近日，两项具身智能领域权威评测——Agibot World Challenge与World Arena相继公布结果，中国Abot-world系列世界模型实现了双双登顶，谷歌、英伟达等海外顶尖科技公司均参加了…

4月15日，一款标注为来自阿里巴巴的世界模型ABot-PhysWorld登顶世界模型领域的权威评测WorldArena。该模型在对物理规律的深度内化与长程动态预测能力上表现优异。不同于多数模型仅能生成短时、…

来源：环球网【环球网科技报道】4月14日，针对近日有消息称，阿里巴巴旗下高德地图具身业务部即将发布一款四足机器人，这也将成为阿里巴巴集团推出的首个具身机器人产品。高德相关负责人对记者表示：我们已在具身智…

在短短不到两年的时间内，可灵AI已完成了超过30次迭代，从最初的单点技术突破，进化为集图片生成、视频生成、后期编辑于一体的全链路AI生产力引擎。鸿蒙用户可以随时随地调用AI，将脑海中的灵感快速变为现实，从记录…

快科技4月16日消息，小米创始人雷军宣布将开启一场马拉松式的直播，这次直播的核心内容是对新款小米SU7进行真实的跨城长途续航压力测试。当时他驾驶SU7标准版从北京前往上海，在1300公里的高速行程中，全程竟然…

据IT之家此前报道，在今年 1 月 3 日的直播中，雷军回应“1300km 只充一次电”称，他自己从北京到上海开了很完整的一段，1300km 中间只充了一次电，当时就被实测的续航震撼住了，“太夸张了，我觉得…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.