OpenAI发布GPT-5.2：应对谷歌和Anthropic挑战

时间：2025-12-12 17:31:52 来源：鞭牛士编辑：快讯 IP：北京 发表评论无障碍通道

12月12日消息，据CNBC报道，OpenAI周四发布了其最先进的人工智能模型 GPT-5.2，并表示这是迄今为止最适合日常专业用途的产品。

OpenAI表示，该模型在创建电子表格、制作演示文稿、感知图像、编写代码和理解长上下文方面均优于以往的模型。从本周四开始，该模型将集成到OpenAI的ChatGPT聊天机器人及其应用程序编程接口（API）中。

OpenAI发布GPT-5.1模型几周后，其竞争对手Anthropico和谷歌也发布了新模型，促使 OpenAI 宣布启动“红色警报”行动，以改进 ChatGPT 并搁置其他项目。

这一切都源于领先科技公司之间一场高风险的竞争，它们都力图打造应用最广泛的模型，因为消费者和企业正日益将人工智能融入日常生活和工作流程。OpenAI 寄希望于其 GPT 系列模型来定义未来，该公司也正努力证明其 5000 亿美元的估值和超过 1.4 万亿美元的计划支出是合理的。

OpenAI 应用部门首席执行官菲吉·西莫 (Fidji Simo) 周四在新闻发布会上告诉记者：“我们发布红色警报，是为了向公司明确表明我们希望将资源集中投入到某个特定领域，这也是一种明确优先级并确定哪些项目可以降低优先级的方式。我们总体上增加了对 ChatGPT 的资源投入，我认为这有助于该模型的发布，但这并非它特意在本周发布的原因。”

OpenAI首席执行官萨姆·奥特曼周四告诉CNBC，谷歌发布Gemini 3模型对公司指标的影响小于预期。他表示，预计OpenAI将在1月份解除危机预警。

“我认为，当竞争威胁出现时，你应该集中精力，迅速应对。”奥特曼说。

OpenAI表示，GPT-5.2将推出Instant、Thinking和Pro三个版本。Instant版本在写作和信息检索方面速度更快，Thinking版本更擅长结构化工作，例如编码和规划，而Pro版本则能为难题提供最准确的答案。

该公司表示，该模型在多项行业基准测试中均名列前茅，包括评估智能体编码性能的 SWE-Bench Pro 和研究生级别科学推理基准测试 GPQA Diamond。该公司还表示，在 OpenAI 今年早些时候发布的评估工具 GDPval 上，GPT-5.2 在 70.9% 的明确定义任务中击败或与业内顶尖专家持平。

“这项工作已经筹备了好几个月了，”西莫说。“虽然我们很自豪能够快速发布新车型，但这项特定的集成工作确实已经进行了很长时间。”

Anthropic 的最新模型 Opus 4.5 在 SWE-Bench Verified 测试集上的得分高于 GPT-5.2。SWE-Bench Verified 是一个评估人工智能系统软件编码能力的测试集。OpenAI 告诉记者，与 SWE-Bench Pro 相比，该基准测试集的“抗污染能力、挑战性、多样性和工业相关性”都较差。

OpenAI 成立于 10 年前，最初是一个研究实验室，但在 2022 年推出 ChatGPT 之后，它已成为世界上增长最快的商业实体之一。现在，每周有超过 8 亿人使用其聊天机器人。（鞭牛士、AI普瑞斯编译）

IT之家注：GRPO 是一种面向强化学习训练的优化方法，会依据奖励信号调整模型策略，让模型在多步决策任务里学会更优动作。论文还把初始化、运行中、后处理拆到独立工作池，并设置 READY 缓冲区，让运行时预…

月 29 日消息，AI 编程智能体 IDE 工具 Kilo Code 今天在 X 平台发布系列图文，分享了 Grok Build 0.1实战开发报告，称构建交付服务过程零工具调用失败，且成本低于 GPT-5…

苹果公司“彻底重做”Siri，将其从一款语音助手升级为具备多模态交互能力的AI平台。核心内容包括：重新设计的Siri界面、引入谷歌Gemini技术的全新底层模型、AI驱动的网页搜索功能，以及一款对标Chat…

花旗研究把"首批基于Blackwell架构训练的模型"列为近期AI竞争中最关键的技术催化剂，逻辑很直接：目前所有排在前沿模型榜单上的产品，包括OpenAI GPT-5.5（花旗AI智能指数60）、谷歌Gem…

【环球网科技综合报道】5月29日消息，据《金融时报》报道，亚马逊公司宣布关闭内部 AI 评分排行榜 “Kirorank”，针对部分员工为追求排名、过度消耗算力资源的现象及时纠偏，明确倡导人工智能技术回归实用…

2026年5月26日，中国信息安全测评中心与国家保密科技测评中心联合发布《安全可靠测评结果公告（2026年第2号）》，首次将人工智能训练推理芯片纳入安全可靠测评体系。随着大模型和AI应用在政务、国防、金融…

指的是教学从来不止局限于方寸教室，走出课堂、奔赴户外，在广阔天地间开展社会实践。对于课堂而言，教师应该保留一些“无目的时间”“无标准答案的问题”以及“无考核压力的角落”，让漫风草思维自然发生。晨读不再是任务…

马斯克还透露，SpaceX正在与其他公司洽谈类似的算力租赁合作，轨道数据中心也在规划中。更关键的是，和A社抢算力的竞争者恰恰是老马自家人，Grok系列需要训练，Tesla的自动驾驶业务对算力的胃口也在快速…

据日本共同社5月29日报道，美国人工智能企业Anthropic于28日宣布，其企业估值已达到9650亿美元（约154万亿日元），实现对OpenAI的超越，反映全球高性能AI普及推动的爆发式增长。公司同时表…

2024年双方携手成功将杜比视界引入小红书，在此基础上，此次新增对杜比全景声的支持标志着杜比与小红书持续合作，并在以真实创作者驱动的社交媒体体验领域持续拓展的又一重要进展。通过将杜比视界与杜比全景声引入小红书…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.