美国人工智能领域再掀波澜,AI头部企业Anthropic近日宣布完成对视觉驱动计算机自动化初创公司Vercept的收购。此举被视为Anthropic在AI Agent赛道的关键布局,旨在强化其核心产品Claude的计算机操控能力,使其更接近人类操作电脑的复杂场景。
Claude的Computer Use功能于2024年10月随3.5 Sonnet版本发布,这项技术允许模型通过"看屏幕、动鼠标、敲键盘"的方式完成跨软件的多步骤任务。然而,早期版本在视觉理解精度、动态界面处理等方面存在局限,导致操作成功率不及预期。Vercept在UI识别、空间推理和低延迟视觉处理领域的技术积累,恰好能弥补这些短板。据内部测试,整合Vercept技术后,Claude在复杂工作流管理中的错误率显著下降。
成立于2025年初的Vercept,凭借其"无API自动化"理念迅速获得资本青睐。这家由艾伦人工智能研究所校友创立的西雅图公司,在种子轮即获得1600万美元融资,估值达6700万美元。其投资人阵容包括前谷歌CEO埃里克·施密特、DeepMind首席科学家杰夫·迪恩等科技界重量级人物。尽管成立时间不长,Vercept已累计融资约5000万美元,其核心产品Vy桌面应用在开发者群体中积累了一定用户基础。
此次收购后,Vercept将逐步关闭现有服务,引导用户迁移至Claude平台。联合创始人卢卡·韦斯透露,团队看中的是Anthropic在基础模型研发上的优势,双方技术整合将重新定义人机交互方式。"当AI完成知识工作的能力达到当前编写代码的水平时,计算机交互体验将发生根本性变革。"韦斯在声明中强调,这种变革需要底层模型与交互系统的同步进化。
竞争态势方面,OpenAI通过人才引进方式加速布局个人AI Agent领域。2月中旬,OpenClaw创始人彼得·斯坦伯格宣布全职加入,负责开发下一代个人助手。与直接收购不同,OpenAI选择将该项目转入独立开源基金会,以MIT协议保持社区自治,同时提供资金和模型支持。这种"轻资产"模式被视为对抗Anthropic在企业级市场优势的战略举措。
Anthropic创始人达里奥·阿莫迪在近期访谈中指出,AI的终极形态应是具备计算机通用控制权的闭环系统。这种系统能通过观察屏幕、理解上下文和跨平台协作,完成视频编辑、软件工程等复杂生产任务。"当前行业瓶颈不在于模型智力,而在于交互可靠性。"阿莫迪认为,未来三年,长上下文管理与计算机视觉的结合将解决大部分需要"在职学习"的岗位需求,这可能引发劳动力市场的结构性变化。













