在人工智能与机器人领域,陈佳玉的学术轨迹呈现出独特的跨学科特征。这位兼具香港大学博士生导师与原力无限首席科学家双重身份的学者,其研究领域横跨自动驾驶、核聚变控制与通用家用机器人开发,始终围绕复杂系统的智能控制展开探索。2025年开启的全新职业阶段,标志着他正式将研究重心转向具身智能领域,试图打通学术理论与产业实践的壁垒。
从北京大学工学院本科毕业后,陈佳玉的早期研究聚焦自动驾驶技术,逐步深入强化学习理论。在卡内基梅隆大学博士后阶段,他创新性地将强化学习应用于核聚变反应堆的等离子体控制,解决了高维非线性系统的建模难题。这段经历让他深刻认识到,无论是核聚变装置的精密调控还是机器人执行日常任务,本质上都是通过马尔可夫决策过程构建的数学问题。"观测空间、动作空间与奖励函数的设计,决定了控制系统的最终效能。"他解释道。
在研究方法论上,陈佳玉形成了独特的双重思维模式。博士导师Vanita Gawva培养的数学抽象能力,使他能够从统计学与优化理论视角剖析算法本质;博后导师Joshua Rendell强调的工程迭代思维,则让他学会根据实际需求动态调整技术路线。这种理论严谨性与工程实用性的融合,在其主导的持续性强化学习研究中得到充分体现——该技术旨在解决人工智能系统学习新任务时遗忘旧知识的难题,目前正尝试在机器人平台上实现算法突破。
选择加入原力无限创业团队,源于陈佳玉对具身智能落地路径的深刻认知。他指出,香港高校在设备采购、实验室空间与算力支持方面存在显著局限,而产业界提供的联合实验室环境恰好能弥补这些短板。公司已商业化的FORCE系列机器人与MASTER COFFEE服务机器人,为其研究提供了真实场景验证平台。"真正的技术突破需要形成商业-技术正向循环,"他强调,"当1000台机器人部署到家庭场景持续产生数据时,数据飞轮效应将推动通用物理世界模型的构建。"
针对具身智能的发展路线,陈佳玉提出"任务泛化-场景泛化"的双阶段论。预计未来2-3年内,机器人将首先实现特定场景下的多任务稳定执行,随后通过海量跨场景数据训练突破场景限制。他特别指出,当前行业过度追求泛化性却缺乏理论保障,而持续学习能力的缺失更被严重低估。"Richard Sutton提出的持续学习难题,需要跨学科协作才能突破。"这位青年学者透露,其团队正在开发以智能体为中心的世界模型,通过构建因果推理机制提升机器人任务迁移能力。
在研究资源获取方面,陈佳玉形成了一套务实策略。他建议年轻研究者首先建立完整的研究体系框架:"先拆解领域内标杆学者的思维模式,再结合自身优势定义核心问题。"对于学术与产业的平衡,他采取"80-20法则":将主要精力投入具有长期影响力的核心研究,同时保留20%资源用于探索性工作。这种策略既保证了研究深度,又维持了学术产出效率。
面对"天才少年"的标签,陈佳玉表现出超越年龄的成熟。"标签本身没有意义,"他坦言,"真正重要的是能否在资源约束下找到最优解。"这种务实态度贯穿其研究生涯——从自动驾驶感知决策到核聚变控制,再到通用机器人开发,每次方向调整都基于对技术本质与产业需求的深刻理解。正如他所强调的:"具身智能是人工智能的终极试验场,这里需要的不只是算法创新,更是系统级解决方案。"











