ITBear旗下自媒体矩阵:

百行代码轻量级编程Agent,解决65%真实项目Bug,兼容所有主流大模型

   时间:2025-07-28 15:15:11 来源:量子位编辑:快讯团队 IP:北京 发表评论无障碍通道
 

在编程与人工智能的交叉领域,一个令人瞩目的新进展悄然诞生。一支由SWE-bench和SWE-agent核心团队组成的精英队伍,近日推出了他们的最新力作——mini-SWE-agent。

这款开源项目以极简主义为核心,仅凭约100行的核心代码,便展现出了惊人的效能。它无需任何额外插件,仅凭基础命令即可运行,且兼容所有主流语言模型,支持本地终端部署与使用。如此精简的架构下,mini-SWE-agent在SWE-bench上的表现却毫不逊色,轻松解决了65%的问题,与原版相比毫不逊色,甚至在某些方面更胜一筹。

SWE-agent,这一拥有16.8k GitHub Star的开源项目,旨在让agent自动修复GitHub上真实项目中的代码Bug。然而,原版的SWE-agent基于复杂的LangChain构建,涉及多工具、多轮对话管理,任务流程繁琐,且需要安装多个依赖,精调工具调用逻辑。随着语言模型性能的不断提升,构建一个有用的代理已经不再需要这些繁琐的工具和接口。

mini-SWE-agent正是在这样的背景下应运而生。它摒弃了复杂的依赖和工具调用接口,仅使用操作系统的Bash环境执行命令。每一步由语言模型输出一个完整的shell命令,无需通过独立的“tool call”协议,从而实现了对任何语言模型的兼容。mini-SWE-agent还采用了线性历史记录和独立单步执行的方式,使得在沙盒中执行操作变得简单且易于扩展。

相较于SWE-agent,mini-SWE-agent的极简代码和依赖无疑是其最大的亮点。它本身仅约100行Python代码,加上环境、模型、脚本才共约200行,没有复杂的依赖关系。同时,它还取消了SWE-agent依赖的复杂YAML配置,采用代码内置模板,并提供直观的命令行工具。用户可以通过简单的mini命令快速启动代理,或使用mini-v启动可视化界面。

除了极简的代码和依赖外,mini-SWE-agent还支持多样的运行环境。它内置支持多种容器与虚拟化环境(如Docker、Podman等),这意味着开发者可以在不同平台和容器中轻松部署,而无需额外修改代码。同时,它还保留了高性能和实用工具,如批量推理和轨迹浏览器等,帮助用户进行大规模评测和决策分析。代理提供的可视化界面更是让开发者能够交互式地观察执行过程,极大地提升了使用体验。

对于日常开发者而言,mini-SWE-agent既可以作为简单的命令行工具使用,在本地终端快速解决问题;也可以作为库被集成到其他Python应用中。相比于重型框架,它降低了上手成本,让开发者可以像使用脚本一样灵活地“驾驭”智能代理。这无疑为开发者们提供了一个更加便捷、高效的编程辅助工具。

SWE-bench和SWE-agent项目的发起源于一次20多分钟的讨论。项目团队意识到GitHub上的真实Issue与PullRequest是评估语言模型编程能力的绝佳素材,于是催生了SWE-bench这一经典benchmark。而mini-SWE-agent则是在此基础上的进一步创新与简化,旨在成为更加轻量、高效的编程agent。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version