全球AI领域知名学者、IEEE Fellow许主洪(Steven Hoi)近期被曝加入阿里巴巴集团,担任智能信息事业群首席科学家兼集团副总裁,直接向事业群总裁吴嘉汇报工作。这位在学术界与产业界均具有深厚积淀的科学家,将主导AI面向消费者(To C)业务的多模态基础模型及智能体(Agents)技术研发。
许主洪的学术履历堪称亮眼:作为新加坡管理大学终身教授及前南洋理工大学终身副教授,他在AI领域累计发表超过300篇顶级论文,引用量突破5万次,曾入选斯坦福大学评选的全球顶尖1%科学家榜单。产业经验方面,他曾任全球最大企业软件公司Salesforce副总裁,主导构建了亚洲AI研究生态系统,并于2023年创立多模态AI初创企业HyperAGI,展现出产学研融合的复合能力。
根据内部规划,许主洪的核心任务包括组建顶尖算法团队、整合通义大模型、夸克搜索及天猫精灵等内部资源,推动多模态交互产品迭代与商业化落地。例如在今年6月的上海世界移动通信大会上,他以夸克App的AI超级框、AI相机等功能为例,系统阐释了多模态大模型在消费级场景的应用潜力。
然而,入职仅7个多月后,许主洪的职责出现调整迹象。有消息称其将转入通义实验室团队,转向更底层的大模型技术研发。这一变动若属实,或标志着阿里巴巴在多模态大模型领域进一步加大投入——当前通义大模型正处于“迭代加速”与“多模态突破”的关键节点,亟需兼具理论深度与工程经验的领军人物。
在9月底举办的2025云栖大会上,阿里云智能集团首席技术官周靖人透露,通义家族连续发布数十款模型的背后,是应对全球AI竞争的战略选择:“模型迭代效率已成为核心比拼点,而多模态演进是不可逆的趋势。”许主洪的加入恰逢其时——他曾在5月蚂蚁技术开放日上指出,统一框架下的多模态理解与生成是重要方向,但当前技术仍处于初级阶段,需通过实践突破交互、平衡等关键挑战。
许主洪对多模态技术的挑战有深刻认知。他曾在公开演讲中列举三大难题:其一,全模态交互(音、视、图、文)的公开单模型极为稀缺;其二,图像与语义的理解生成统一模型鲜有突破,且效果难以平衡;其三,多模态Agent要实现通用人工智能(AGI),需解决基础能力、核心功能模块、数据与物理世界交互等复杂问题。这些观点与阿里巴巴当前的技术布局高度契合。
截至目前,阿里巴巴及许主洪本人均未对此次职务调整的传闻作出回应。但业内普遍认为,若消息属实,此次人才重配将显著提升阿里在多模态大模型领域的技术竞争力。