小米技术团队近日宣布,正式推出名为Xiaomi OneVL的一步式潜空间语言视觉推理框架,并同步开放模型权重及训练推理代码,供全球开发者与研究机构使用。这一成果被视为小米在人工智能领域的重要突破,延续了今年3月发布的XLA认知大模型架构的技术脉络。

据技术团队介绍,Xiaomi OneVL的创新性在于首次通过潜空间推理技术,将视觉语言动作(VLA)、世界模型构建与潜空间推理三大技术路线整合至统一框架。这种设计突破了传统模型在多模态数据处理中的局限性,使系统能够更高效地完成复杂场景下的推理与规划任务。实验数据显示,该框架在多个主流基准测试中均达到当前最优水平,尤其在潜在推理性能方面实现显著提升。
小米董事长雷军在社交平台发文强调,开源策略旨在推动自动驾驶领域的技术协同发展。他表示:"通过开放核心代码与模型参数,我们希望吸引全球开发者共同探索大模型在自动驾驶场景中的创新应用。"目前,相关代码已通过开源平台发布,配套技术文档详细说明了模型架构与训练方法。
行业分析师指出,Xiaomi OneVL的推出标志着小米在AI基础研究领域迈出关键一步。其多技术路线融合的设计思路,为解决自动驾驶中的长尾问题提供了新范式。随着代码开源,预计将引发新一轮技术竞赛,加速智能驾驶系统的迭代升级。













