ITBear旗下自媒体矩阵:

Genesis AI“AI灵巧手”来袭,从烹饪到弹琴,探索物理世界新可能

   时间:2026-05-11 10:50:11 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

机器人技术的突破性进展正引发全球关注。一家名为Genesis AI的初创公司近期发布了首款机器人基础模型GENE-26.5,其展示的双手精细操作能力令行业震惊。该模型不仅能以正常速度完成烹饪、实验操作、解魔方等复杂任务,甚至能弹奏钢琴,其动作流畅度和环境适应能力远超现有机器人系统。

在公开演示中,GENE-26.5展现了惊人的多任务处理能力:从制作番茄炒蛋到精准移液,从插吸管到整理线束,每个动作都体现出对物理世界的深刻理解。特别值得注意的是,当蛋液沾到手上时,模型会主动寻找抹布擦拭,并反复确认清洁程度,这种类人行为在机器人领域尚属首次。技术团队表示,这种能力源于对人类操作数据的深度学习,而非预设程序指令。

这家成立仅一年的公司背后站着强大的科研团队。创始人周衔作为卡内基梅隆大学机器人学博士,曾主导开发过轰动GitHub的开源物理引擎项目。其联合创始人Théophile Gervet则来自Mistral AI和Skild AI,在多模态模型领域经验丰富。2025年7月,公司完成1.05亿美元种子轮融资,创下硅谷具身智能领域融资纪录,投资方包括谷歌前董事长Eric Schmidt等科技界重量级人物。

数据采集难题的突破是GENE-26.5成功的关键。传统机器人训练面临数据匮乏困境——80%的体力劳动缺乏数字化记录,且现有采集方式会干扰人类操作。Genesis AI独创了"三线并行"的数据采集体系:通过特制数据手套获取高精度操作数据,利用头戴摄像头记录第一视角视频,同时挖掘互联网海量操作视频。这种分层采集策略既保证了数据质量,又实现了规模效应,为模型训练提供了前所未有的数据基础。

硬件与软件的深度整合是另一大创新。公司自主研发的Genesis Hand 1.0机械手拥有20个自由度,尺寸与真人手完全一致,表面覆盖柔性材料模拟皮肤触感。这种设计消除了数据从人类到机器的传输损耗,实现了"近无损信息传递"。技术文档显示,该硬件平台能精准复现人类手部的微小动作,包括手指弯曲角度和触觉反馈强度,为模型训练提供了理想的物理载体。

在模型架构方面,Genesis AI摒弃了传统的模块化设计,转而构建统一的联合分布模型。该系统将语言、视觉、触觉、动作等多模态信息整合训练,通过流匹配技术建模轨迹联合分布,同时保留时间维度耦合关系。这种设计使模型能自主理解不同模态间的关联,例如当视觉检测到特定物体且触觉反馈特定压力时,自动生成对应的操作动作。模型还具备强大的泛化能力,预训练数据规模越大,在新场景中的表现越优异。

评估体系的革新同样引人注目。传统物理世界评估需要2700小时人机交互,Genesis AI开发的Genesis World仿真环境将这一过程压缩至可操作范围。该系统能模拟光照变化、物体属性偏移等复杂场景,每个数据点对应200种评估设置和超过150小时机器人执行时间。初步验证显示,模型在仿真环境中的表现与真实世界高度相关,为物理世界Scaling Law的探索提供了重要实验平台。

尽管GENE-26.5已展现出惊人潜力,但行业仍持谨慎乐观态度。专家指出,实验室环境与真实场景存在显著差异,模型的泛化能力需进一步验证。当前系统仍依赖特定硬件配置,如何实现跨平台部署是下一阶段挑战。Genesis AI透露,正在开发新一代模型,将重点提升现实场景适应能力,并探索商业应用路径。这场机器人技术的革命,或许才刚刚拉开序幕。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version