在人工智能大模型领域,竞争的火药味愈发浓烈。OpenAI与谷歌等科技巨头正展开一场激烈的角逐,不断推出新产品和新技术,试图在这场变革中占据领先地位。
OpenAI近期正式上线了GPT-5.2,这一动作被视为其巩固市场地位的重要举措。此次发布的GPT-5.2包含Instant、Thinking和Pro三款不同层级的模型,旨在满足不同用户的需求。OpenAI宣称,GPT-5.2在专业工作方面表现卓越,其Thinking模型被认为是最能胜任各类现实专业用途的模型。在博士级别的专家推理评估GPQA Diamond中,该模型得分高达92.4%,在最新美国数学邀请赛(AIME2025)中更是拿到满分。在GDPval测试中,Thinking模型也获得了70.9%的高分,领先于竞争对手。
在实际应用场景中,GPT-5.2也展现出了强大的能力。它可以制作表格、整理分析数据、制作项目流程图,在编写代码、制作PPT、图像感知、理解长上下文、使用工具以及处理复杂的多步骤项目方面都表现出色,错误率较前代产品大幅降低。一些使用者给予其“最强AI打工人”“职场最佳拍档”等称号,对其在实际工作中的表现给予了肯定。
然而,GPT-5.2也面临着一些挑战。在输入输出价格方面,它比前代贵了40%,输入价格21美元,输出价格高达168美元。这一价格调整引发了一些担忧,此前OpenAI堆算力发展大模型的做法就已受到质疑,此次价格上涨可能会进一步加剧市场的质疑。一些用户反映Thinking和PRO的应答时间明显较慢,甚至比前代产品还要慢,这对于逐渐嵌入日常生活和工作的AI产品来说,可能会影响用户体验。普通即时版GPT-5.2在一些常识问题上犯错,也引发了用户的吐槽。
就在OpenAI发布GPT-5.2的同时,谷歌也展开了反击。谷歌抢在GPT-5.2前一个小时左右进行了产品更新,宣布其深度研究智能体Gemini Deep Research全面增强,并首次向开发者开放。Gemini Deep Research基于Gemini 3 PRO构建,通过多步强化学习训练,显著减少了“幻觉”,在复杂研究任务中表现出更高精度。在人类终极大考(HLE)中,Gemini Deep Research得到46.4%分,比GPT-5.2 Thinking的45.5%要高,仅低于GPT-5 Pro的50%。而且,其成本极低,谷歌产品经理透露,新版智能体在与GPT-5 Pro表现相当的同时,成本仅为后者的十分之一左右,展现出强大的性价比优势。
谷歌还同步开源了基准测试工具DeepSearchQA,包含覆盖17个领域的900项复杂任务,为科学评估研究型智能体的能力提供了支持。谷歌凭借更好的性价比、另辟蹊径的训练模式、强大的现金流以及自研专用芯片等优势,持续给OpenAI带来压力。
除了谷歌,OpenAI还面临着其他竞争对手的挑战。Anthropic等公司也在不断推出新产品,meta和DeepSeek等竞争者同样有着令人期待的新品可能面世。此前有消息称,OpenAI在加速开发自身全新的模型“Garlic”,试图通过新的方式重建绝对领先的优势。
在这场大模型之争中,AI芯片也扮演着重要的角色。英伟达最近与美银举办了一次投资者线上交流会,英伟达方面提到,只依据Gemini 3的表现比GPT5更优,就认为谷歌自研的TPU要好于英伟达的GPU是不合理的。目前大部分的大模型都是用上一代H系列芯片训练的,用Blackwell训练的大模型要到2026年才会上线,其优势到时才会显现,更不用说还未投入使用的新一代超级芯片Rubin。市场对英伟达的说法看法不一,但这场关于AI芯片的讨论也让明年的大模型之争更加引人关注。
随着各大科技巨头不断推出新产品和新技术,AI大模型领域的竞争愈发激烈。这场竞争不仅关乎大模型的能力,还涉及到大模型的训练、发展路径以及AI芯片的未来走向。2026年,这场激烈的竞争预计还将继续升级,各方的表现值得期待。






