滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

AI新纪元：Claude Opus 4连续工作7小时，SWE-Bench得分领跑行业

时间：2025-05-23 17:51:09 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

近日，人工智能领域迎来了重大突破，Anthropic公司隆重推出了其旗舰级AI模型Claude Opus 4及其轻量级版本Claude Sonnet 4，这一举动标志着AI能力的新里程碑，预示着行业或将迎来颠覆性的变革。

在与日本电商乐天（Rakuten）的联合测试中，Claude Opus 4展现出了前所未有的持久力。它能够在一个复杂的开源重构项目中，连续工作近七个小时而不中断，始终保持高度的逻辑清晰度和任务专注度。这一表现与以往AI模型仅能维持几分钟的“注意力”形成鲜明对比，意味着AI终于具备了全天候协作的能力。

在软件工程测试集SWE-Bench上，Claude Opus 4更是以72.5%的高分刷新了记录，这一成绩远超今年4月推出的OpenAI GPT-4.1的54.6%得分。这一卓越表现将Anthropic推上了与OpenAI、谷歌、xAI等巨头同台竞技的舞台。

2025年，AI行业正经历从快速应答型模型向深度推理型模型的转变，而Claude Opus 4无疑是这一趋势中的领航者。它摒弃了传统的“问答式”模式，采用“类人类”的推理过程，通过收集信息、分析矛盾、整理逻辑，真正实现了从“回答者”到“思考者”的跨越。

为了提升用户体验，Anthropic在Claude 4系列中引入了动态双模式架构，使AI既能对简单问题迅速响应，又能对复杂任务进行深入推理。Claude 4还具备上下文记忆功能，能够跨会话保持知识连贯性，为长期项目的实施提供了有力支持。

为了满足企业开发需求，Anthropic推出了Claude Code工具链，该工具链支持VS Code、JetBrains等主流IDE插件，并与GitHub Actions兼容。GitHub Copilot最新版本已内置Claude Sonnet 4作为其新一代代码代理的基础模型，这一举措表明微软正在积极调整其AI合作策略。

Claude Code工具链的新功能包括代码执行引擎、文件API和MCP连接器，以及最长可达一小时的Prompt缓存。这些功能使得Claude能够更顺畅地融入企业工作流，成为企业长期的AI合作伙伴。

然而，随着AI模型能力的不断增强，一个老问题再次浮出水面：AI越强大，其“黑箱”特性就越明显。Anthropic在4月的一项研究中指出，Claude Sonnet 3.7在推理时仅有25%的时间会主动解释其用到的关键线索。这引发了人们对未来高性能AI决策路径难以审计或复现的担忧。

Claude Opus 4所展现的连续专注能力，正在悄然改变“工作”这一概念。它不仅是工具，更是开始扮演真正的“数字同事”角色——无需监督，能够独立完成复杂任务，甚至逐步形成跨天的项目记忆与知识体系。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

Anthropic开源新工具：神经网络追踪，归因图助你透视AI大模型“思考”过程

06-02

渤海亿吨级油田垦利10-2，海上平台建造圆满收官！

06-02

Duolingo“AI-first”战略遇阻，用户不满引发删App潮，信任危机何解？

据报道，语言学习平台Duolingo因转向“AI-first”战略，宣布用人工智能取代部分人工，引发大量用户不满，出现删App、取消订阅潮。CEOLuis von Ahn试图通过清空社交媒体内容、发布神秘视…

06-02

软银英特尔联手打造AI内存芯片，电力消耗或降一半引领数据中心变革

6月2日，据报道，软银集团与英特尔公司合作，通过新成立的Saimemory公司共同开发AI专用内存芯片。该芯片采用新型堆叠式DRAM设计，有望将电力消耗减半，降低AI数据中心运营成本。项目基于英特尔技术和日本…

06-02

vivo如何破局：市场阵地、内卷挑战与新赛道突围的三重考验

06-02

微软ZeniMax QA团队工会合同达成，7月起加薪13.5%，游戏从业者胜利？

06-02

商汤集团高层调整：徐冰转岗AI芯片业务，杨帆、王征拟接任执行董事

日前，商汤集团发布公告称，联合创始人徐冰将于2025年6月26日股东周年大会结束后卸任执行董事及董事会秘书职务，转任AI芯片业务负责人，专注推动公司战略性新兴业务发展。同时，商汤提议联合创始人、大装置事业群总…

06-02

美律师法庭文件引用ChatGPT虚构案例，遭制裁并赔偿

06-02

敦煌文物数字重聚，“数字藏经洞”平台正式发布

06-02

商汤徐冰卸任执行董事及董秘，杨帆王征接任，AI芯片业务迎新布局

根据商汤公告，截至公告日期，杨帆拥有39,002,779股B股股份（占商汤科技公司已发行股份总数约0.11%），包括：(i)通过SenseTalentManagement Limited（「SenseTa…

06-02

苹果WWDC 2025 AI内容或平淡？古尔曼预测或令人失望

06-01

五一视界冲刺港股，年营收近3亿却运营亏损超7千万，商汤等众星云集

06-01

AI版宝可梦训练师O3来袭，能否在红版中征服终极四天王？

06-01

三部门联手净化高考网络环境，严打AI涉考虚假信息

06-01

谷歌不服在线搜索反垄断裁决，宣布将提起上诉

06-01

点击查看更多 +

全站最新

BJ40增程领衔，北京越野2025粤港澳车展展现硬派越野新魅力！

BJ40增程领跑市场，北京越野粤港澳车展展现越野新魅力

仰望U8L粤港澳车展“鼎”级亮相，中国高端豪华车新标杆？

BJ40增程领跑市场，北京越野2025粤港澳车展展现越野新魅力

上汽奥迪双品牌闪耀2025湾区车展，智能豪华新境界震撼登场！

蔚来5月新车交付量稳健增长，技术收获季全面开启

热门内容

本栏最新

Anthropic开源新工具：神经网络追踪，归因图助你透视AI大模型“思考”过程

渤海亿吨级油田垦利10-2，海上平台建造圆满收官！

微软ZeniMax QA团队工会合同达成，7月起加薪13.5%，游戏从业者胜利？

美律师法庭文件引用ChatGPT虚构案例，遭制裁并赔偿

敦煌文物数字重聚，“数字藏经洞”平台正式发布

商汤徐冰卸任执行董事及董秘，杨帆王征接任，AI芯片业务迎新布局

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.