当行业还在探讨大语言模型如何优化文字交互时,魔珐科技已率先实现技术突破。这家人工智能企业日前推出全球首个面向开发者的3D数字人开放平台“魔珐星云”,通过自研的3D多模态实时生成引擎,让AI具备同步输出语音、微表情和肢体动作的能力,推动人机交互从语言层面延伸至全维度表达。
核心技术突破体现在实时渲染与算力优化层面。该平台搭载的生成引擎可实现毫秒级响应,输入任意文本后,系统同步生成语音、面部微表情及肢体动作,并针对手机、车载终端、智能电视等设备进行深度适配。在保持30fps以上刷新率的同时,系统延迟控制在100毫秒以内,开发者仅需配备百元级入门芯片即可完成本地驱动,云端仅承担模型推理与更新任务。
架构设计上的创新是技术落地的关键。魔珐科技CTO李豫透露,平台采用“云-端拆分架构”,将几何建模等高算力需求与轻量级渲染指令分离,终端设备仅需接收压缩后的动作码流。这种设计使数据传输量降至传统视频的十分之一,在保证流畅交互的同时显著降低硬件门槛。
实际应用场景已突破技术验证阶段。上海某智慧酒店接入星云SDK后,数字前台可实时处理入住登记、发票开具、周边服务咨询等业务;某省级政务大厅的导办终端通过手语数字人,为听障群体提供无障碍政务服务;在人力资源领域,平台与头部HR SaaS企业合作推出的AI面试官,能根据候选人回答即时做出点头、记录等动作,精准还原真实面试场景。
商业模式设计兼顾开发灵活性与成本控制。平台实行分层计费体系:基础模型供开发者免费调用,高级情绪控制、行业知识库等增值服务按使用量收费,企业私有化部署支持一次性买断。上线首日即吸引超过2000名开发者注册,覆盖教育、医疗、零售、物联网四大领域。
技术普惠成为战略核心。魔珐科技CEO柴金祥宣布,将开源部分动作驱动接口,并与芯片厂商共建“星云Ready”认证体系。该计划旨在推动技术下沉,目标是一年内让10亿台中低端设备具备运行能力,使具身智能交互从高端展示场景走向日常应用。











