在科技领域的一次重要展示中,群核科技于近日成功举办首届技术开放日活动,向业界隆重推出了其在大模型技术上的最新研发成果。这次发布的亮点包括新一代空间语言模型SpatialLM 1.5和空间生成模型SpatialGen,同时,群核科技还分享了关于新模型未来开源计划的详细安排。
SpatialLM 1.5,作为群核科技在3D室内场景理解与生成领域的突破,实现了通过简单的文本指令即可生成结构化3D场景的功能。这一能力不仅超越了传统大语言模型对物理世界的理解局限,还能智能匹配家具模型并完成布局,进一步支持通过自然语言进行后续的交互与编辑。尤为该模型生成的场景富含物理正确的结构化信息,并能快速批量产出多样化的符合要求的场景,这对于机器人训练数据的获取难题提供了有效的解决方案。在现场的演示中,通过输入“去客厅餐桌拿药”的指令,SpatialLM 1.5不仅准确理解了相关物体对象,还自动规划出最优行动路径,展示了其在复杂家庭环境中指导机器人执行任务的巨大潜力。
与此同时,SpatialGen模型的发布则标志着群核科技在“生成与呈现”领域的又一重要进展。这款基于扩散模型架构的多视角图像生成模型,能够根据文字描述、参考图像以及3D空间布局,生成具有时空一致性的多视角图像,并进一步生成3D高斯场景,支持渲染出可自由漫游的视频。依托群核科技的海量室内3D场景数据与多视角扩散模型技术,SpatialGen确保了生成的多视角图像在不同镜头下保持准确的空间属性和物理关系,为用户带来沉浸式的体验。
在活动现场,群核科技AI产品总监龙天泽透露,公司正在研发一款深度融合3D能力的AI视频生成产品,计划年内正式发布。这款产品有望通过构建3D渲染与视频增强一体化的生成管线,解决当前AIGC视频生成中时空一致性的不足问题,进一步推动AI视频创作的商业化应用。据他介绍,现有的AI视频创作中常因视角切换导致物体位置偏移、空间逻辑混乱等问题,而这些问题背后的根源在于多数视频生成模型缺乏对3D空间结构和物理法则的理解和推演能力。SpatialGen的推出,正是为了解决这一难题。
群核科技联合创始人兼董事长黄晓煌在活动现场分享了公司对于空间智能布局的最新思考。他指出,基于酷家乐这一全球最大的空间设计平台,群核科技构建了“空间编辑工具-空间合成数据-空间大模型”的空间智能飞轮,通过工具沉淀数据、数据加速模型训练、模型提升工具体验的良性循环,不断推动技术进步。截至2025年6月30日,群核科技已拥有超过4.41亿个3D模型及超过5亿个结构化3D空间场景,这些数据为空间大模型的训练提供了坚实的基础。
黄晓煌还强调了开源在公司战略中的重要性。他表示,群核科技自2018年起就开始实施开源战略,逐步开放数据和算法能力,旨在推动全球空间智能技术的快速发展。他认为,当前空间大模型还处于初级阶段,希望通过开源的方式,与全球开发者共同推动技术的进步,加速空间大模型的成熟和应用。
据悉,本次技术开放日分享的两款模型将逐步在HuggingFace、GitHub等平台面向全球开发者开源。其中,空间生成模型SpatialGen已在活动当天开放下载使用,而空间语言模型SpatialLM 1.5也将以“SpatialLM-Chat”的形式在未来完成开源。这一系列举措,无疑将为全球空间智能技术的发展注入新的活力。