当全球科技企业还在争论机器人该在虚拟世界“健身”还是直接投身现实“摔打”时,一家中国科技公司用一台无人清扫车给出了独特答案。在芜湖某条辅路上,酷哇科技最新发布的CooWAIM 2.0系统正指挥清扫车贴边作业,面对突然逆行的电动车,车辆在300毫秒内完成减速与转向避让,整个过程没有进行复杂的三维场景重建,而是通过实时环境交互实现了动态决策。
这种“边做边想”的智能模式,与同期刷榜的三大机器人系统形成鲜明对比。智元GE 2.0通过构建全功能虚拟模拟器让机器人试错进化,星动纪元Ctrl-World采用VLA与世界模型融合技术打通感知动作链路,北京人形Pelican-Unify则推进物理智能回路的大一统架构。三家机构分别占据虚拟仿真、多模态融合、统一建模三条技术路线,而酷哇选择了一条更贴近现实需求的路径——聚焦即时环境交互的轻量化方案。
技术路线的分野源于对智能本质的不同理解。当前世界模型领域形成三大阵营:视频生成派以谷歌Genie 3、OpenAI Sora为代表,通过预测像素变化生成未来画面;自动驾驶派如Waymo、特斯拉,专注极端路况下的车辆响应预测;具身智能派则以智元等企业为核心,致力于解决机器人肢体动作与环境变化的动态协调。酷哇的特殊之处在于,其技术基因既包含自动驾驶的场景积累,又向具身智能领域延伸。
支撑这种跨越的核心是DAWN架构的交互式推演机制。该系统摒弃传统“先预测后规划”的线性模式,通过WAIM交互式世界动作模型将视觉特征压缩为16个语义单元,在隐空间进行2-3秒的短程推演。动作降噪器与世界预测器在推理过程中持续迭代,使轨迹预测误差控制在0.33米以内。这种设计既避免了全场景渲染的计算负担,又克服了完全不推演的盲目性,在NAVSIM基准测试中取得89.1分的成绩。
技术突破的背后是海量真实数据的支撑。酷哇通过与中联环境的合作,在17个城市部署智慧环卫系统,积累了超过50PB的非结构化场景数据。这些包含雨雪天气、突发障碍等复杂情况的数据,构成了其他实验室环境难以复制的训练素材。但数据优势的转化仍面临挑战,如何将城市场景经验迁移至工业制造、家庭服务等跨领域场景,成为决定技术普适性的关键。
商业化进程同样考验着技术落地的能力。相比英伟达Cosmos等千亿级参数的闭源模型,酷哇选择开源DAWN架构以构建生态。目前其技术闭环仍集中在环卫与城配领域,而Robotaxi、特种作业等高价值场景的应用验证尚未完全展开。行业观察人士指出,世界模型领域尚未形成统一标准,实验室性能与真实场景表现之间存在显著差距,多数企业仍处于高投入研发阶段。
在这场智能进化的竞赛中,酷哇的技术负责人提出了更具哲学意味的思考:“真正的智能不是预演所有可能性,而是在动作与环境的互动中持续修正认知。”这种将推演与行动融为一体的设计理念,或许正在重新定义人机协作的边界。当机器人开始具备“边做边学”的物理推理能力,城市生态中的人机共存模式可能迎来新的变革。















