在科技界万众瞩目的8月5日,谷歌、Anthropic与OpenAI三大人工智能巨头不约而同地亮出了各自的“杀手锏”,上演了一场精彩绝伦的“三国鼎立”大戏。
谷歌DeepMind率先出击,揭开了第三代通用型世界模型Genie 3的神秘面纱。这款模型以其前所未有的交互性和通用性,成为了通向通用人工智能(AGI)征途上的重要里程碑。用户只需简单的文本、图片甚至草图输入,Genie 3便能实时生成一个逻辑自洽、风格一致的3D环境,并支持用户在其中自由行动与互动。无论是“向左走”还是“跳起来”,Genie 3都能迅速响应,呈现出流畅的第一人称视角画面,其画面流畅度已媲美传统游戏引擎。
紧接着,Anthropic推出了编程能力大幅提升的Claude Opus 4.1模型,直击编程这一高价值领域。据测试,Opus 4.1在SWE-bench Verified基准测试中的编码性能达到了74.5%,相较于前一版本有了显著提升。而在衡量代码生成、调试和逻辑推理能力的Humaneval+基准测试中,其得分更是首次超越了GPT-4o,展现了强大的编程实力。Opus 4.1在定价上保持了与Opus 4的一致性,实现了“加量不加价”,进一步巩固了Anthropic在编程领域的竞争力。
压轴登场的OpenAI则选择了以“开源”为武器,推出了gpt-oss-120b和gpt-oss-20b两款开放权重模型,标志着其时隔六年重返开源领域。这一举措不仅降低了AI应用的门槛,更旨在构建庞大的开发者生态,为未来的AI应用提供基础设施。gpt-oss-120b拥有1170亿参数,专为高推理能力、生产级通用场景打造;而gpt-oss-20b则更具普惠性,可在消费级笔记本电脑或手机等边缘设备上部署。两款模型在多项基准测试中的表现均十分出色,媲美甚至超越了专有模型。
然而,OpenAI的开源并非毫无保留。其采用的“OpenAI Model License 1.0”中包含了“毒丸条款”,禁止年收入超过1亿美元或日活跃用户超过100万的商业实体使用gpt-oss来开发与OpenAI核心产品竞争的服务。这一策略巧妙地排除了大公司竞争对手,同时吸引了广大中小开发者和研究者进入其生态。
这场AI界的“三国杀”不仅展现了三大巨头在战略布局上的截然不同,更预示着AI产业竞争已进入了一个全新的阶段。谷歌押注未来,以Genie 3推进世界模型研发;Anthropic深耕编程领域,深挖商业护城河;OpenAI则以开源为饵,构建底层生态。而这场“混战”还远未落幕。Anthropic预告未来几周内将发布“重大改进”,而OpenAI也被传即将推出GPT-5,8月的AI圈注定将“好戏连台”。