AI大模型领域正迎来新一轮技术突破的关键节点。以英伟达Blackwell架构训练的首批旗舰模型即将面世,花旗研究将其定义为当前行业竞争格局中的核心驱动力。在此之前,多家头部实验室已密集发布或预告新品,技术迭代速度显著加快,模型能力跃迁进入加速期。
Anthropic本周正式推出Claude Opus 4.8,在智能体协作、可控推理及诚实度方面实现全面升级,发布时间较外界预期提前近一个月。该模型新增“投入控制”机制,允许用户根据需求调节推理资源投入强度,平衡速度、成本与深度;推出“动态工作流”预览版,支持数百个并行子智能体协同完成复杂任务,例如处理数十万行代码的大型库迁移;诚实度显著提升,代码缺陷未提示通过的概率降至前代模型的四分之一。基准测试显示,其在浏览器智能体能力测试中得分达84%,优于GPT-5.5等竞品。定价方面,输入输出token价格维持与前代一致,新增“快速模式”速度提升2.5倍,成本降至此前模型的三分之一。
马斯克在社交平台披露,参数量达1.5万亿的Grok-5训练已完成,预计2至3周内发布,参数规模为现役Grok-4的三倍。该模型纳入大量来自AI编程工具Cursor的训练数据,后者年经常性收入已达20亿美元,开发者交互数据为编程能力建模提供高质量素材。SpaceX与Cursor的合作框架下,Grok-5在编程场景的升级将进一步强化与OpenAI Codex、Anthropic Claude Code的竞争力。
MiniMax工程主管预告采用全新稀疏注意力机制的MiniMax-M3即将登场,预填速度提升9.7倍,解码速度提升15.6倍。其前代模型M2.7以每百万tokens仅0.22美元的低价占据性价比市场,M3的推出有望延续这一优势。DeepSeek V4 Pro、Qwen3.6 Plus、Kimi K2.6等模型相继入场,前沿竞争格局呈现多极化趋势。
需求端呈现“垂直拉升”态势。谷歌每月处理tokens量达3.2千万亿,同比增长7倍;Anthropic二季度收入预测环比增幅约130%,二季度末年化收入预计达500亿美元;OpenAI一季度收入超去年上半年总和。花旗研究指出,企业端AI采用仍处于早期阶段,需求天花板远未到来。然而,Intuit、meta等企业裁员潮暗示AI对传统生产效率的冲击正在显现,生产力红利的分配方向仍待观察。
定价体系形成双轨格局。谷歌将AI Ultra订阅价格下调至200美元/月,并推出100美元/月新档位;而GPT-5.5价格较前代上涨2倍,显示头部厂商通过订阅分层与前沿推理溢价进行市场切割。企业端成本压力显现,GPT-5.5不同工作负载下成本增幅达49%至92%,部分被输出token减少抵消。
供给端约束推动算力服务模式变革。OpenAI推出“保证容量”方案,允许企业通过1至3年期合约锁定算力并享受折扣;Blackstone与Google Cloud达成合作,Anthropic完成多项推理服务协议。这些举措实质是构建“预留实例”机制,以系统性方式锁定稀缺推理产能。花旗分析指出,前沿能力供给的核心瓶颈仍在人才层面,顶尖AI研究员的争夺持续加剧,即便Blackwell算力到位,模型能力跃迁最终仍取决于研究团队的实力。










