ITBear旗下自媒体矩阵:

国产AI模型开源引全球热议 蚂蚁灵波与谷歌“开源接力”开启新篇章

   时间:2026-02-02 11:39:30 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

近期,全球人工智能领域迎来一场引人瞩目的“开源风暴”,主角正是中国科技企业蚂蚁集团旗下的蚂蚁灵波与科技巨头谷歌之间展开的激烈角逐。这场较量不仅点燃了全球AI社区的热情,更在行业格局中激起层层涟漪。

一切始于蚂蚁灵波的“闪电战”。1月27日起,该团队在短短四天内接连开源四大核心模型,其中最受瞩目的当属世界模型LingBot-World。这款被外界视为谷歌Genie 3有力竞争者的模型,一经发布便引发连锁反应——谷歌迅速调整策略,于1月30日面向特定用户开放其世界模型体验平台Project Genie。两大巨头的“前后脚”动作,直接将相关话题推上海外社交平台X的热门榜单首位,Reddit等社区的AI板块也将其列为头号热帖。

LingBot-World的震撼之处,在于其突破了传统世界模型的技术边界。从演示画面来看,该模型不仅在视觉效果上与Genie 3不相上下,更实现了近10分钟的连续无损生成。无论是物体特征的稳定性、场景逻辑的自洽性,还是交互响应的即时性,均达到行业领先水平。用户可通过键盘或鼠标操控角色与相机视角,画面随指令实时变化;甚至能以文本指令触发天气、风格等环境变化,且在镜头移动60秒后返回时,目标物体仍能保持结构与外观的一致性。更令人惊叹的是,其端到端交互延迟控制在1秒以内,生成帧率达16 FPS,彻底告别卡顿感。

该模型的另一大亮点是Zero-shot泛化能力。开发者仅需输入一张真实照片或游戏截图,即可生成可交互的视频流,无需针对单一场景进行额外训练或数据采集。这一特性直击行业痛点——此前,具身智能训练因成本高昂、泛化能力弱而进展缓慢,而LingBot-World的开源,相当于为全球开发者提供了一套“即插即用”的工业级工具包。

蚂蚁的野心远不止于此。除LingBot-World外,其同步开源的三大模型——高精度空间感知模型LingBot-Depth、具身大模型LingBot-VLA和具身世界模型LingBot-VA,共同构建起从“感知”到“行动”再到“认知”的完整技术链条。其中,LingBot-Depth专注于解决透明反光物抓取等行业难题,被喻为机器人的“眼睛”;LingBot-VLA则基于20000+小时真实机器人操作数据训练而成,能适配9种主流双臂机器人构型,堪称机器人的“通用大脑”;而LingBot-VA则将视频生成与机器人控制深度融合,让机器人具备“边推演、边行动”的能力,在真机评测中多项性能超越业界标杆Pi0.5。

这场开源风暴的背后,是行业格局的深刻变革。长期以来,高端AI模型领域被谷歌、OpenAI等巨头垄断,闭源策略筑起高高的技术壁垒。中小企业和初创公司因资金、算力不足,往往难以触及前沿技术。而蚂蚁的开源举措,相当于向全球开发者开放了工业级技术工具包,开发者仅凭消费级硬件即可部署和微调模型,大大降低了创新门槛。德国头部财经网站AdHocNews评价称,蚂蚁的行动是“全球机器人领域主导权争夺战中的战略性举措”,而行业专家则直言:“这对整个行业都是变革,此前这类训练环境通常是专有的,成本昂贵。”

谷歌的快速跟进,进一步印证了蚂蚁开源策略的影响力。从闭源垄断到开源协同,世界模型赛道正经历前所未有的转折。这场较量不仅关乎技术领先,更关乎谁能定义下一代AI的标准。蚂蚁的突围,让世界看到中国科技公司在具身智能领域的硬实力,也为全球AI发展注入新的可能性。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version