人工智能领域近日迎来一则震动业界的消息:Transformer架构核心研究者之一、知名AI科学家诺姆·沙泽尔(Noam Shazeer)通过社交平台宣布,将正式加入OpenAI团队。这位曾参与奠定现代大模型技术基石的科学家在声明中表示:"这是一个艰难的决定,我为谷歌团队共同创造的成果感到自豪,但更期待与OpenAI的顶尖人才合作攻克新挑战。"
尽管普通用户对沙泽尔这个名字并不熟悉,但他在人工智能发展史上占据着关键位置。2017年发表的《Attention Is All You Need》论文中,沙泽尔作为八位作者之一,首次提出了颠覆性技术架构Transformer。这项突破不仅让模型训练效率实现质的飞跃,更直接催生了GPT、BERT等里程碑式模型。值得注意的是,ChatGPT名称中的"T"正是源自这项技术,而沙泽尔本人深度参与了注意力机制、多头注意力等核心模块的设计。
回顾沙泽尔的职业生涯,这位技术先驱早在2000年就加入谷歌,是公司早期核心工程师之一。在谷歌的前十余年里,他主导了搜索纠错、广告排序、垃圾邮件检测等多个关键系统的开发,几乎触及公司所有核心业务线。2012年加入谷歌大脑团队后,他的研究重心转向深度学习领域,这段经历为他后来主导Transformer架构研究奠定了基础。
技术突破与商业落地的矛盾在沙泽尔身上体现得尤为明显。2018年,他与丹尼尔·德·弗雷塔斯(Daniel De Freitas)共同开发对话模型Meena,该模型在对话连贯性和内容多样性上取得突破性进展。但谷歌管理层因担忧生成式AI的潜在风险,最终未将该产品推向市场。这种技术理想与商业现实的冲突,直接导致两位核心成员于2021年离职创立Character.AI。
Character.AI的创业历程堪称大模型时代的典型样本。该平台通过提供历史人物、虚构角色等多样化AI对话伙伴,迅速积累超千万用户,上线首周下载量突破170万次。但高昂的推理成本和内容安全压力,让这家明星创业公司面临严峻挑战。2024年8月,谷歌以27亿美元价格与Character.AI达成技术授权协议,更关键的是成功召回沙泽尔等核心人才,任命其为Gemini项目联合技术负责人。
此次沙泽尔转投OpenAI,标志着顶尖AI人才争夺战进入新阶段。作为少数完整经历大模型技术演进全周期的专家,他既掌握Transformer底层架构设计,又具备从实验室研究到消费级产品落地的完整经验。这种复合型背景在当今AI领域尤为稀缺,特别是在模型可扩展性、多模态融合等前沿方向,其经验将直接影响技术路线选择。
行业观察人士指出,沙泽尔的流动轨迹折射出大模型竞争的核心逻辑。从谷歌到Character.AI再回归谷歌,最终选择OpenAI,这位技术先驱的每次选择都精准踩中行业转折点。随着模型参数规模突破万亿级门槛,具备底层架构理解能力的工程师价值持续攀升,他们的决策正在重新定义AI技术发展的边界。








