在科技界的最新动态中,OpenAI于近日震撼发布了其最新的大型语言模型——GPT-5。据官方介绍,GPT-5不仅是OpenAI迄今为止最智能、响应速度最快的模型,还内置了强大的思维能力,旨在将专家级的智能普及至每一位用户。GPT-5在编程、数学、写作、健康咨询以及视觉智能等多个领域展现了卓越的性能,并能根据情境判断快速回应或深入思考。目前,该模型已向全球用户开放,但免费用户需稍作等待,才能完全体验其推理功能。
值得注意的是,OpenAI强调GPT-5在减少幻觉输出及降低对人类过度恭维方面有所改进。尽管在一些基准测试中,GPT-5的得分超越了其前辈,但与前代模型的差距并不显著,其是否能代表人工智能的最前沿水平,仍有待观察。有趣的是,GPT-5发布后,特斯拉CEO马斯克随即表示,其公司旗下的Grok 4在ARC-AGI基准测试中击败了GPT-5。
与此同时,OpenAI还宣布了两款开源模型的发布,分别是gpt-oss-120b和gpt-oss-20b,这是OpenAI六年来首次开源模型。gpt-oss-120b拥有1170亿参数,采用先进的MoE架构,而gpt-oss-20b则拥有210亿参数,同样基于MoE设计。这两款模型分别能够在高端和入门级GPU上运行,显示了OpenAI在开源策略上的新动向。
紧接着,AI创业公司Anthropic也不甘落后,发布了Claude Opus 4.1版本。据称,该模型在代理任务、现实世界编码及推理能力上有所提升,尤其擅长处理复杂的多步骤问题,被视为更有效的AI智能体。Anthropic表示,未来将更加频繁地推出产品的渐进式更新,以提高AI的实用性和可用性。
在谷歌方面,其最新发布的世界模型Genie 3允许实时交互,能够模拟自然现象、生成生态系统,甚至创造动画角色,展现了世界模型在迈向通用人工智能(AGI)道路上的重要一步。尽管Genie 3在动态世界模拟方面取得了突破,但仍面临动作空间有限、多智能体交互模拟困难等挑战。
社交应用小红书也加入了多模态大模型的竞争,开源了其dots.vlm1模型。该模型基于DeepSeek V3打造,配备了小红书自研的视觉编码器NaViT,具备强大的多模态理解与推理能力。dots.vlm1能够理解复杂的图文信息,分析配料表差异,甚至辨别文物和画作名称,显示了小红书在大模型领域的雄心壮志。
马斯克旗下的xAI公司也传来消息,计划下周开源其Grok 2大语言模型。Grok 2自发布以来,因其出色的推理能力和独特的“反觉醒”特性而备受瞩目。此次开源将为开发者提供更多研究和应用xAI核心技术的机会。
在AI应用市场方面,QuestMobile发布的《2025年AI应用市场半年报》显示,AI应用发展迅速,形成了四大梯队的产业格局。然而,原生APP市场正经历洗牌,近七成原生APP玩家的月活跃用户规模出现负增长。特别值得注意的是,DeepSeek的月活跃用户数虽有所下降,但其影响力并未减弱,用户分流至其他渠道。
半导体巨头AMD也公布了其2025年第二季度的财报,营收同比增长32%,创下新高。尽管数据中心收入增长放缓,未达到分析师预期,但AMD表示,市场对计算与AI产品组合的需求依然旺盛。然而,AI芯片出口限制对AMD的业绩产生了一定影响。
最后,在AI搜索对网站流量的影响方面,谷歌发表了不同看法。谷歌指出,其搜索引擎的点击量总体保持稳定,与第三方报告所声称的总流量急剧下降相矛盾。谷歌强调,其研究结果基于准确的数据分析,而一些第三方报告则可能采用了有缺陷的方法论。