阿里云旗下通义实验室近日传来喜讯,其倾力打造的网络智能体WebSailor正式宣布开源。这款智能体在OpenAI的高难度评测集BrowseComp中,以卓越的推理与检索能力,勇夺开源榜单榜首,彰显了其强大的技术实力。
WebSailor专为应对复杂多变的网络场景而生,它擅长处理模糊性问题,通过多步骤的推理过程和交叉验证技术,能够从浩如烟海的网络信息中精准抽取出答案。通义实验室采用了前沿的post-training方法,对模型进行了深度优化,使其在网页推理任务中的表现有了显著提升。在BrowseComp评测中,WebSailor的两个版本——WebSailor-32B和WebSailor-72B,不仅超越了DeepSeek R1、Grok-3等一众开源模型,还力压部分非开源系统,仅次于OpenAI的DeepResearch,展现了其非凡的竞争力。
不仅如此,WebSailor在普通任务数据集SimpleQA上的表现同样令人瞩目,这进一步验证了其强大的泛化能力。阿里云方面表示,WebSailor的通用工作流以及“高难度任务合成+高效RL优化”的策略,为开源社区解决复杂推理、学术发现等领域的难题提供了宝贵的参考和启示。
此次WebSailor的开源,无疑将为整个AI领域注入新的活力。其构建方案及部分数据集已在GitHub上公开,期待更多开发者能够基于这一平台,共同推动AI技术的创新与发展。