ITBear旗下自媒体矩阵:

OpenAI发布GPT-5.2:应对谷歌和Anthropic挑战

   时间:2025-12-12 17:31:52 来源:鞭牛士编辑:快讯 IP:北京 发表评论无障碍通道
 

12月12日消息,据CNBC报道,OpenAI周四发布了其最先进的人工智能模型 GPT-5.2,并表示这是迄今为止最适合日常专业用途的产品。

OpenAI表示,该模型在创建电子表格、制作演示文稿、感知图像、编写代码和理解长上下文方面均优于以往的模型。从本周四开始,该模型将集成到OpenAI的ChatGPT聊天机器人及其应用程序编程接口(API)中。

OpenAI发布GPT-5.1模型几周后,其竞争对手Anthropico和谷歌也发布了新模型,促使 OpenAI 宣布启动“红色警报”行动,以改进 ChatGPT 并搁置其他项目。

这一切都源于领先科技公司之间一场高风险的竞争,它们都力图打造应用最广泛的模型,因为消费者和企业正日益将人工智能融入日常生活和工作流程。OpenAI 寄希望于其 GPT 系列模型来定义未来,该公司也正努力证明其 5000 亿美元的估值和超过 1.4 万亿美元的计划支出是合理的。

OpenAI 应用部门首席执行官菲吉·西莫 (Fidji Simo) 周四在新闻发布会上告诉记者:“我们发布红色警报,是为了向公司明确表明我们希望将资源集中投入到某个特定领域,这也是一种明确优先级并确定哪些项目可以降低优先级的方式。 我们总体上增加了对 ChatGPT 的资源投入,我认为这有助于该模型的发布,但这并非它特意在本周发布的原因。”

OpenAI首席执行官萨姆·奥特曼周四告诉CNBC,谷歌发布Gemini 3模型对公司指标的影响小于预期。他表示,预计OpenAI将在1月份解除危机预警。

“我认为,当竞争威胁出现时,你应该集中精力,迅速应对。”奥特曼说。

OpenAI表示,GPT-5.2将推出Instant、Thinking和Pro三个版本。Instant版本在写作和信息检索方面速度更快,Thinking版本更擅长结构化工作,例如编码和规划,而Pro版本则能为难题提供最准确的答案。

该公司表示,该模型在多项行业基准测试中均名列前茅,包括评估智能体编码性能的 SWE-Bench Pro 和研究生级别科学推理基准测试 GPQA Diamond。该公司还表示,在 OpenAI 今年早些时候发布的评估工具 GDPval 上,GPT-5.2 在 70.9% 的明确定义任务中击败或与业内顶尖专家持平。

“这项工作已经筹备了好几个月了,”西莫说。“虽然我们很自豪能够快速发布新车型,但这项特定的集成工作确实已经进行了很长时间。”

Anthropic 的最新模型 Opus 4.5 在 SWE-Bench Verified 测试集上的得分高于 GPT-5.2。SWE-Bench Verified 是一个评估人工智能系统软件编码能力的测试集。OpenAI 告诉记者,与 SWE-Bench Pro 相比,该基准测试集的“抗污染能力、挑战性、多样性和工业相关性”都较差。

OpenAI 成立于 10 年前,最初是一个研究实验室,但在 2022 年推出 ChatGPT 之后,它已成为世界上增长最快的商业实体之一。现在,每周有超过 8 亿人使用其聊天机器人。(鞭牛士、AI普瑞斯编译)

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version