两位在人工智能领域具有深厚背景的华人科学家,正携手创立一家专注于视觉AI技术的新公司——Elorian。这家初创企业旨在开发能够同时解析文本、图像、视频和音频的多模态AI模型,为行业带来突破性创新。目前,该公司已启动种子轮融资,计划筹集约5000万美元资金。
联合创始人戴明博(Andrew Dai)拥有剑桥大学计算机科学学士学位和爱丁堡大学机器学习博士学位。他在谷歌深耕14年,从软件工程师逐步晋升为首席研究科学家,主导过Gemini大型多模态模型的数据团队研发工作。这位技术管理者不仅在工业级AI项目中发挥关键作用,还与全球顶尖学者合作发表多篇学术论文,积累了科研与工程转化的双重经验。
另一位联合创始人杨寅飞(Yinfei Yang)的职业生涯同样亮眼。他曾在苹果AI/ML部门担任多模态研究负责人,专注视觉与语言基础模型开发。此前在谷歌研究部门期间,他深耕自然语言处理、语义检索和多模态表示学习等领域,其主导的《Scaling up visual and vision-language representation learning with noisy text supervision》论文为多模态学习提供了重要理论支撑。他在亚马逊和Redfin担任工程师的经历,使其具备从算法研究到产品落地的完整能力。
据知情人士透露,由前CRV合伙人Max Gazor创立的风投机构Striker Venture Partners,正与Elorian洽谈领投事宜。这家成立于2023年10月的投资机构,由Brian Zhan联合管理,专注于早期科技企业孵化。目前双方已进入深度谈判阶段,但具体条款尚未披露。
在技术路线方面,Elorian将突破传统单模态AI的局限,构建能综合处理视觉、听觉和语言信息的智能系统。戴明博在采访中透露,公司不仅关注机器人应用场景,更在探索医疗影像分析、智能内容生成等多元化领域。尽管具体产品形态尚未公布,但其多模态融合的技术定位已引发行业关注。
值得注意的是,两位创始人在LinkedIn平台均将公司状态设置为"隐身模式",戴明博的资料显示其担任CEO职务。这种低调策略或与初创企业保护技术敏感性的需求有关,同时也为产品发布预留了悬念空间。随着融资进程推进,这家汇聚顶尖AI人才的新锐企业,有望在多模态智能领域掀起新的技术浪潮。







