谷歌近日突然发布了Gemini 2.5 Pro的最新预览版——Gemini 2.5 Pro Preview 06-05 Thinking,这一版本在多个关键领域的测试中展现出了卓越的性能,迅速引起了业界的广泛关注。
据悉,Gemini 2.5 Pro Preview 06-05 Thinking在推理能力、科学以及编程能力等方面的测试中,超越了OpenAI的o3、DeepSeek R1和Claude Opus 4等竞争对手。特别是在编程能力测试中,该版本更是领跑Aider Polyglot等高难度编程基准测试,展现出强大的代码生成和理解能力。
谷歌CEO桑达尔·皮查伊在海外社交媒体上亲自宣布了这一消息,并表示:“我们最新的Gemini 2.5 Pro更新现已发布预览版……我们听取了用户的反馈,并对回答的风格和结构进行了改进。用户可以在AI Studio、Vertex AI平台和Gemini app中进行试用。正式版即将推出!”
在基准测试中,Gemini 2.5 Pro Preview 06-05 Thinking全面领先,无论是文本、视觉、网页开发、编程、数学、创意、多轮对话、指令跟随还是长查询类别,都取得了优异的成绩。特别是在LMArena的综合榜单中,该版本以显著的优势登顶,成为业界公认的顶尖智能模型之一。
尽管Gemini 2.5 Pro Preview 06-05 Thinking在某些特定测试上,如数学能力的AIME 2025、代码生成的LiveCodeBench以及视觉推理的MMMU榜单上,尚未超越所有竞争对手,但其整体表现已经足以令人瞩目。该版本的价格也相对实惠,为用户提供了更具性价比的选择。
自发布以来,Gemini 2.5 Pro Preview 06-05 Thinking已经吸引了众多开发者和用户的关注与体验。在图像生成方面,该版本能够轻松生成生动逼真的照片和卡通动画风格的图像。在编程方面,它更是展现出了惊人的能力,能够根据用户的要求快速生成高质量的代码。
谷歌此次推出的Gemini 2.5 Pro Preview 06-05 Thinking,不仅标志着大语言模型技术的新进展,也预示着AI行业的竞争将更加激烈。随着大模型迭代周期的缩短和基准测试榜单的频繁易主,AI较量已经进入了白热化阶段。而谷歌凭借Gemini 2.5 Pro的快速迭代和卓越性能,无疑将在这一竞争中占据有利地位。