ITBear旗下自媒体矩阵:

开源新星BU-30B-A3B-Preview:低成本高效率,引领浏览器自动化新潮流

   时间:2025-12-26 13:24:08 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

知名开源浏览器自动化项目BrowserUse近日宣布,正式推出其自主研发的首款大语言模型BU-30B-A3B-Preview。这款专为网页代理(Web Agent)场景设计的模型,凭借卓越的成本控制与实时处理能力,迅速成为行业焦点,被视为该领域技术突破的新标杆。

该模型采用混合专家(MoE)架构,总参数规模达300亿,但实际推理时仅需激活30亿参数。这种设计使其在保持高性能的同时,显著降低了计算资源需求——仅需单张消费级GPU即可流畅运行,彻底改变了传统大模型对硬件的高依赖性。其基础架构基于阿里云通义千问Qwen3-VL-30B-A3B-Instruct进行深度优化,针对浏览器自动化任务进行了专项训练,支持视觉与文本的多模态输入,上下文处理能力提升至32K tokens,可高效解析复杂网页内容。

在核心功能方面,BU-30B-A3B-Preview展现了强大的网页交互能力。通过深度理解文档对象模型(DOM)结构与视觉信息,模型能够精准定位页面元素,完成点击、滚动、表单填写等操作,其执行可靠性接近人类水平。官方测试表明,该模型在自动化测试、数据采集、RPA流程等典型场景中均达到行业领先标准,尤其适合需要处理动态网页或长流程任务的应用开发。

性能对比数据显示,BU-30B-A3B-Preview在效率与成本方面具有压倒性优势:平均每步操作耗时1.2秒,任务整体完成速度远超主流商用模型;在计算资源利用率上,每1美元预算可支持完成约200个浏览器任务,成本效益是部分竞品的数十倍。更关键的是,其轻量化设计允许开发者直接在本地环境部署测试,无需承担高额云端服务费用。

目前,BU-30B-A3B-Preview已实现完全开源,模型权重文件已上传至Hugging Face平台供全球开发者免费下载。这一举措不仅降低了技术门槛,更通过开放生态加速了Web Agent领域的创新进程。开发者可将其直接集成至BrowserUse开源库,快速构建各类自动化应用。

据技术文档披露,该模型通过两阶段训练流程实现性能突破:首先在通用多模态数据上预训练基础能力,随后在浏览器操作专项数据集上进行微调。这种训练方式使其既能理解网页视觉布局,又能精准执行交互指令。实际测试中,模型在处理包含嵌套框架、动态加载内容的网页时,仍能保持90%以上的操作成功率。

对于需要大规模网页自动化的企业而言,BU-30B-A3B-Preview提供了前所未有的性价比选择。其开源特性与低部署成本,使得中小团队也能快速搭建自动化系统。当前,Hugging Face平台已开放模型下载通道,开发者可通过指定链接获取完整权重文件及使用文档。

下载地址:https://huggingface.co/browser-use/bu-30b-a3b-preview

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version