ITBear旗下自媒体矩阵:

谷歌苹果顶尖华人科学家携手创业,聚焦视觉推理,开启AGI新征程

   时间:2026-01-12 01:49:32 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

在硅谷人工智能创业浪潮中,一家名为Elorian的初创公司正引发资本市场的强烈关注。这家由谷歌前资深研究员Andrew Dai与苹果前首席研究科学家Yinfei Yang联合创立的企业,计划通过首轮5000万美元融资切入"视觉推理"这一前沿领域,试图在多模态大模型竞争中开辟新赛道。

Andrew Dai的履历堪称AI领域的"活化石"。自2012年加入谷歌以来,他深度参与了从BERT到Gemini的预训练体系构建,特别是在数据工程领域积累了独特经验。其团队开发的预训练策略直接影响着模型对海量数据的处理效率,这种能力在当下大模型竞争中显得尤为珍贵。更早时期,他关于半监督序列学习的研究被业界认为启发了GPT系列模型的架构设计。

与Andrew Dai形成技术互补的是Yinfei Yang,这位苹果前首席科学家在多模态表示学习领域造诣深厚。他主导的图像-文本共嵌入技术突破,为解决AI模型的感知短板提供了关键方案。在苹果工作期间,他参与了多个将AI技术转化为消费级产品的项目,这种工程化思维与Andrew Dai的理论研究形成完美闭环。

Elorian的核心突破点在于"原生多模态"架构。不同于现有模型通过文本接口嫁接视觉能力的模式,该公司计划构建能够直接理解物理世界逻辑的认知系统。这种技术路线在机器人控制、复杂界面交互等场景具有革命性潜力——想象一个能直接"看懂"Excel表格并自动生成报表的AI助手,或是无需API接口就能操作专业软件的智能体。

领投方Striker Venture Partners的背景折射出资本市场的深层逻辑。该基金创始人Max Gazor作为前CRV合伙人,以精准押注技术趋势著称。此次选择Elorian,既是对"谷歌+苹果"技术组合的认可,也暗合AI发展从文本生成向物理世界交互转型的产业趋势。知情人士透露,这笔投资可能创下早期AI公司融资规模的新纪录。

当前大模型竞争已进入深水区。OpenAI凭借ChatGPT占据文本生成制高点后,谷歌Gemini、Anthropic Claude等纷纷加码多模态能力。Elorian的差异化策略在于放弃通用模型路线,转而聚焦需要强视觉推理的垂直场景。这种"小而精"的打法,或许能为初创公司突破巨头封锁提供新思路。

两位创始人的职业轨迹颇具象征意义:Andrew Dai离开效力14年的谷歌,Yinfei Yang告别刚发布AI产品的苹果,这种"反叛"精神恰是硅谷创新的源泉。他们试图证明,在算力与数据逐渐趋同的今天,对认知本质的理解才是决定AI高度的关键。正如计算机视觉领域那句名言:"摄像头只是眼睛,算法才是灵魂",这场关于"看懂"世界的竞赛,才刚刚拉开帷幕。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version