滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

人类录一遍操作，AI秒变“浏览器达人”：填表刷网页轻松搞定

时间：2026-06-28 23:00:07 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在网页智能体（Web Agent）领域，一个名为BrowserBC的开源项目正引发广泛关注。该项目由Einsia AI旗下Navers Lab推出，旨在解决当前智能体在处理网页任务时面临的核心挑战——如何避免重复探索，实现操作经验的复用。

当前，Claude、Codex等智能体已具备基本的网页操作能力，能够识别按钮、输入信息、跳转页面。但每当遇到新任务或新网站时，这些智能体仍需依赖大型模型从零开始探索，不仅效率低下，且容易陷入死循环或偏离任务目标。BrowserBC通过将人类操作轨迹转化为可复用的技能，为这一问题提供了创新解决方案。

BrowserBC的核心流程分为三步：录制、转写和执行。首先，系统记录用户在浏览器中完成任务的完整过程，包括页面状态、操作步骤和反馈信息。随后，这些原始轨迹被清洗并转写为自然语言描述的技能卡，详细说明任务意图、关键步骤和完成标准。最后，这些技能卡可被任何模型读取，指导其在新场景中完成类似任务。

与传统按键精灵不同，BrowserBC不依赖固定坐标或选择器，而是提取可迁移的过程性知识。例如，在预订民宿的任务中，技能卡会指导智能体先输入基本信息，再应用筛选器，最后验证结果，而非记录具体的点击位置。这种设计使技能能够适应页面布局的变化，实现跨网站的通用性。

该项目在海外开源社区引发热烈讨论，发布仅6小时便产生超过2500条相关讨论，并登上Twitter今日新闻。AI领域知名分享者AK也对其表示关注。BrowserBC的开源代码、技术博客和研究论文均已公开，供研究者参考。

在技术实现上，BrowserBC面临两大挑战：如何从嘈杂的轨迹中提取有效技能，以及如何管理不断增长的技能库。为解决这一问题，系统采用语义分段和证据抽取技术，过滤无关信息并保留关键步骤。同时，通过构建技能图，将相关技能组织为可扩展的结构，支持增量更新和局部检索。

实验数据显示，BrowserBC显著提升了智能体的任务完成率。在WebArena-Hard基准测试中，注入技能的智能体成功率从60.5%提升至81.4%，挽救了54个原本失败的任务。在更复杂的ClawBench测试中，成功率提升幅度达到35.5个百分点，且在所有任务类别中均表现优异。

进一步分析表明，技能卡的作用在于提供策略性指导，而非强制执行。当智能体被允许根据当前页面调整技能应用时，任务完成率更高。这验证了BrowserBC的设计理念：技能应作为先验知识，而非精确指令，最终决策仍需结合实时页面信息。

BrowserBC的另一重要特性是模型无关性。实验显示，由大型模型蒸馏的技能可有效提升小型模型的性能，实现"一次蒸馏、多次复用"的目标。这种设计降低了对计算资源的需求，使技能应用更具普适性。

尽管BrowserBC在提升智能体效率方面表现突出，但其应用仍存在边界。研究指出，当前失败案例主要源于执行精度问题，如长表单填写遗漏或目标对象歧义。这表明，技能卡可补充流程知识，但无法完全替代底层模型的能力提升。

BrowserBC的研究团队还探索了该方法的扩展性。在Ubuntu桌面任务的诊断性研究中，17个任务在应用匹配技能后性能得到改善，证明过程性先验可跨越浏览器场景，应用于更广泛的交互环境。然而，当任务涉及底层GUI控制或检索到错误技能时，性能提升会受到限制。

BrowserBC的出现，为网页智能体的发展提供了新思路。通过将人类操作经验转化为结构化知识，该方法不仅提升了任务处理效率，还为智能体的持续学习奠定了基础。随着技能库的不断积累，网页智能体有望从"能够操作"向"高效操作"迈进。

更多>同类资讯

十年耕耘结硕果：C909国产商用飞机拓展支线航空新蓝海

06-28

三峡集团哈密百兆瓦级“线性菲涅尔”项目：转入商业试运行助力“双碳”目标

06-28

韩国油价近两月来首次跌破2000韩元关口

06-28

6月以来新发基金破千亿元

06-28

全球芯片LOF：6月29日开市起停牌 10:30起复牌

06-28

名医走进工位旁谷医堂员工专场义诊：中医智慧守护职场健康暖人心

06-28

海水“灭火”为何失灵？探秘海底火山与海水间的“较量”真相

就算不纠结“火”和“岩浆”的区别，单说降温这事儿，海水也碰不上岩浆。炽热的岩浆一接触海水，水瞬间汽化，在两样东西之间形成一层蒸汽薄膜。这层蒸汽导热性极差，物理上就把海水和岩浆隔开了。这层壳一形成，外面…

06-28

景区网络广播怎么选？深圳锐科达：技术强、方案全、服务优的优选之策

建议选择支持标准SIP协议及ONVIF视频协议的厂家，如锐科达产品兼容3CX、Asterisk等主流IP PBX平台，满足电信级与行业专网安全要求，便于后期系统扩展与互联。建议在招标或采购前，邀请至少2-3家…

06-28

画镜网络：Python鸭子类型如何让代码灵活如积木？优缺点全解析

这种动态特性带来了极强的代码松耦合性。此时，本地文件对象、内存字符串缓存、网络数据流，或是我们自定义的类，只要实现了read()方法，都可以直接传入使用。这也是数据从业者偏爱Python的关键原因：切换CS…

06-28

中国电信携手多方完成6G星地协同组网试验攻克关键技术难题

6月27日消息，近日，中国电信研究院与上海电信、中电信应急公司协同，携手清华大学、上海清申科技，依托云网融合中试平台的实星接入验证能力，完成面向6G的高轨、中轨与地面协同组网技术试验，实现“高轨全天时可靠通信…

06-28

日经225ETF华安(513880)二级市场出现较大幅度溢价 6月29日开市起至当日10:30停牌

06-28

财通福鑫定开混合(501046)二级市场出现极大幅度溢价 6月29日开盘起至当日10:30停牌

06-28

全球芯片LOF(501225)二级市场出现较大幅度溢价 6月29日开盘起至当日10:30停牌

06-28

汉产“电鹰飞车”亮相亚欧博览会独特设计引关注获5架意向订单

06-28

热木星CoRoT2b逆向自转引关注独特特征助力完善系外行星研究模型

06-28

点击查看更多 +

全站最新

大杨哥“月饼风波”后现身卖课，3天收费1980元，大小杨哥复出带货时间成谜

华为途灵平台技术再升级：从被动响应到主动预判成果已应用于多款车型

小米Buds 5：轻量化设计搭配出色降噪，舒适与音质兼备的蓝牙耳机新宠

小米智能音箱：开启便捷生活，语音交互与优质音质共筑智能新体验

广州某高校“拒小米汽车于门外”：可预约进校成摆设，禁令背后原因成谜

科大讯飞智能体耳机Pro星辰灰：商务运动两相宜，录音转写新利器

热门内容

本栏最新

双离合车主必看！改掉这三个习惯，让变速箱远离大修烦恼

62岁工程师匠心打造“自然之力”蒸汽摩托零百加速0.4秒创非火箭动力新纪录

高通官宣收购AI软件栈企业Modular 软硬件结合助力AI从端侧向云端迁移

黑湖科技周宇翔：年营收增速超70%，规模化创新筑牢盈利护城河

EcoFlow德国慕尼黑发布新品，全场景布局引领智能能源发展新阶段

贝壳集团高层到访星河湾共话行业趋势携手推动高端地产高质量发展

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.