在人工智能领域,没有博士学位和论文发表经历,是否意味着与顶尖实验室无缘?Keller Jordan的故事给出了令人惊喜的答案。这位毕业于加州大学圣地亚哥分校的数学与计算机双学位毕业生,凭借开源项目和硬核技术实力,成功叩开OpenAI的大门。
2024年末,Keller推出的神经网络优化器Muon再次引发震动。这个通过Newton-Schulz迭代正交化更新矩阵的创新算法,在NanoGPT和CIFAR-10训练中刷新世界纪录。相比主流的AdamW优化器,Muon在处理千亿参数模型时展现出显著优势,其bf16精度下的稳定运行能力更解决了大规模训练的算力瓶颈。尽管拒绝为Muon撰写学术论文,这个开源项目仍在开发者社区持续发酵。
Keller的逆袭并非孤例。谷歌DeepMind的Sholto Douglas在X平台默默耕耘,通过在Jax项目中的深度贡献获得面试机会,最终成为Gemini模型的关键开发者;量化分析师Andy Jones凭借自研GPU加速环境和严谨消融实验,在没有耀眼论文的情况下加入Anthropic。这些案例揭示着AI行业的新趋势:当开放研究成为主流,可验证的技术贡献正在取代传统学术指标,成为衡量人才的新标尺。








