蚂蚁集团近日正式推出全模态通用AI助手“灵光”,这款创新产品首次在移动端实现“自然语言30秒生成小应用”功能,用户可对生成内容进行编辑、交互与分享。作为行业首个具备全代码生成多模态内容能力的AI助手,“灵光”首批上线三大核心功能模块,覆盖对话交互、应用生成与视觉创作领域,现已同步登陆安卓与iOS应用商店。
在对话交互层面,“灵光对话”突破传统问答模式,通过结构化思维引擎将复杂信息转化为逻辑清晰的呈现方案。该功能支持动态生成3D模型、交互式地图、音视频等多元内容,使知识传递更具视觉冲击力。例如教育场景中,用户询问物理原理时,系统不仅会分解知识点层次,还会自动生成3D实验动图与可操作数据表格,将抽象概念转化为直观体验。这种设计理念源于产品团队“化繁为简”的核心理念,通过优化信息组织方式提升认知效率。
应用生成领域,“灵光闪应用”功能开创了全民AI编程的新范式。用户通过自然语言描述需求,系统可在30秒至1分钟内构建完整应用,涵盖健身计划、旅行规划、健康管理等生活场景。以烹饪场景为例,用户询问“溏心蛋烹饪时间”时,系统会生成参数可调的计算器,允许自定义鸡蛋大小与熟度等级;养车咨询场景中,则能创建成本计算模型,根据里程、油耗等变量生成个性化方案。这些应用并非静态页面,而是集成后端模型能力的动态工具,支持实时数据交互与场景延伸。
视觉创作方面,“灵光开眼”功能搭载AGI相机技术,实现物理世界的智能解析与内容再创作。该模块支持视频流实时分析,可识别建筑、景观等物体并提供专业讲解,同时具备文生图、图生视频等跨模态创作能力。旅游场景中,用户拍摄古建筑时,系统能即时生成结构解析图与历史背景说明;创作场景下,可将文字描述转化为动态视频素材,为内容创作者提供智能化辅助工具。
技术架构层面,“灵光”构建了多智能体协作的Agentic系统,通过动态调度图像、3D、动画等专用模块,实现多模态内容的协同生成。这种架构使系统能根据对话情境实时组合最佳呈现方案,确保输出结果的完整性与沉浸感。例如在生成旅行规划应用时,系统会同步调用地图Agent、日程Agent与预算Agent,确保方案兼具路线合理性与成本可控性。
作为蚂蚁集团AGI战略的重要实践,“灵光”的推出标志着通用人工智能从技术突破向场景落地的关键跨越。该产品精准捕捉2025年AI工具向生产力方向演进的趋势,通过将开发能力嵌入日常对话流程,重新定义了智能助手的应用边界。此前蚂蚁集团已陆续发布AI医疗管家AQ、布局具身智能领域,其百灵大模型更跻身万亿参数阵营,此次“灵光”的上线进一步完善了其在通用人工智能领域的技术矩阵与生态布局。








