人工智能领域迎来重要进展,知名企业Anthropic通过收购动作加速完善其AI智能体技术布局。近日,该公司宣布完成对西雅图初创公司Vercept的收购,旨在通过整合视觉理解技术突破现有产品瓶颈,推动AI协作能力向人类水平迈进。
此次收购的核心聚焦于提升AI的视觉交互能力。Vercept自主研发的视觉模型Vy展现出显著技术优势:该模型不依赖传统API接口或后台代码,而是通过直接解析屏幕图像识别UI元素,在ScreenSpot v1基准测试中达到92%的准确率,较同类技术实现数倍提升。这种"所见即所得"的交互方式,使AI能够精准识别按钮、图标等界面组件,为复杂软件操作奠定基础。
技术整合将直接赋能Anthropic核心产品。其"Computer Use"功能此前受限于视觉解析精度,在跨应用协同、动态表格处理等场景表现欠佳。随着Vercept技术注入,Claude系列产品的软件操作能力预计实现质的飞跃,逐步接近人类用户的操作流畅度。这种进化标志着AI从单一任务执行向全场景协作伙伴转型。
创始团队背景为技术落地提供保障。Vercept核心成员包括计算机视觉领域权威专家Ross Girshick,其研发团队在三维空间推理、实时图像解析等方面拥有深厚积累。该团队此前获得科技界知名投资人施密特与杰夫·迪恩的资金支持,技术路线已获产业界认可。
商业布局呈现闭环特征。此次收购与去年12月对编码引擎Bun的并购形成技术互补:Bun的代码生成能力与Vercept的视觉交互能力结合,使Claude具备从代码编写到软件操作的全链条工作能力。这种"编程+操作"的双重技能,正在重塑AI作为数字同事的角色定位。
财务数据印证市场信心。截至2025年末,Anthropic年化营收突破90亿美元,其中编程辅助工具Claude Code贡献超四分之一收入。强劲的商业表现推动其完成300亿美元G轮融资,投后估值达3800亿美元,稳居全球AI企业第二位。本轮融资吸引卡塔尔投资局、摩根士丹利等顶级机构参与,显示资本市场对其技术路线的持续看好。
行业观察人士指出,视觉交互能力的突破将开启AI应用新维度。传统AI受限于文本或简单图形处理,而高精度视觉解析使AI能够理解动态界面变化、处理非结构化数据,这在金融分析、医疗诊断等复杂场景具有应用潜力。Anthropic的技术整合或引发AI行业竞争格局重塑。












