在人工智能领域,神经信息处理系统大会(NeurIPS)一直被视为最具影响力的顶级学术会议,其地位犹如奥斯卡之于电影界,是全球AI发展的年度风向标。近日,任少卿、何恺明、罗斯·吉尔希克(Ross Girshick)、孙剑凭借“Faster R-CNN”(快速区域卷积神经网络架构)荣获2025年NeurIPS时间检验奖,这一消息引发了广泛关注。
NeurIPS时间检验奖旨在表彰那些经过十年时间考验、对学科发展产生深远影响的奠基性工作。过去三年,该奖项的获得者不乏诺贝尔奖得主杰弗里·辛顿(Geoffrey Hinton)、图灵奖得主约书亚·本吉奥(Yoshua Bengio)以及OpenAI联合创始人兼首席科学家伊尔亚·苏茨克维(Ilya Sutskever)等国际顶尖学者。
“Faster R-CNN”诞生于2015年,由中国学者任少卿、何恺明、孙剑主导,联合美国人工智能科学家罗斯·吉尔希克共同发表。这一新型网络架构实现了物体检测效率的显著提升,超过10倍以上,首次开创了端到端实时精准目标检测模式。截至目前,相关文章已被学术引用超9.8万次,任少卿作为第一作者,其文章不仅是华人在该会议上发表的学术引用量最高之作,也是AI检测领域全球最高被引论文。
十多年来,“Faster R-CNN”的核心思想已深度融入人工智能基础技术基因,成为驱动自动驾驶、医疗影像、安防监控、工业检测、卫星遥感等关键领域发展的核心力量。任少卿与合作者何恺明(现MIT副教授)、孙剑(前旷视科技首席科学家)此前还共同发表过深度残差网络框架ResNet,该文章已成为21世纪全球最高被引论文。
任少卿在回忆与导师孙剑的合作时表示,孙剑坚持“simple but work”的理念,这一理念在日常交流和论文评审中逐渐深入人心。他回忆起自己写的第一篇论文,因不够简洁而最终放弃投稿,如今看来,那篇论文更多是在他人工作基础上的简单叠加,缺乏实质性创新。他强调,追求“simple but work”需要远见、品位和坚持,三者缺一不可。
谈及与何恺明的合作,任少卿表示,两人合作时间最长,工作节奏紧凑而高效。每天早上到公司后,他们会先查看实验结果,随后展开交流,从上午11点到12点吃饭时继续讨论,下午2点各自工作,5点再次讨论并共进晚餐。何恺明对研究问题的专注和创新精神给他留下了深刻印象,他认为何恺明善于寻找研究方向和突破点,并投入巨量时间建立思维架构。
在深度学习方向的选择上,任少卿表示,团队先是进行了尝试,在看到可能性后才坚持下来。选择这一方向的原因包括方法创新、已有结果进展以及结果的泛化能力。他们认为,一个新方向的上限要高,且已达到的结果需真实可靠,而非仅在特定范围内有效。
“Faster R-CNN”解决了物体检测任务的端到端问题。传统物体检测分为两步:先在图像上寻找可能的目标候选区域,再对这些区域进行分类。这一过程计算量巨大,效率低下。而“Faster R-CNN”通过一个网络直接输出结果,实现了实时检测,频率可达10Hz、20Hz甚至30Hz,显著提升了效率并降低了延迟,为产业应用带来了突破。
2020年8月,任少卿加入蔚来,负责搭建团队并推进自研芯片项目。当时,蔚来面临L2和L4差异的争论以及是否全栈自研的选择。最终,蔚来决定全栈自研L2产品,支持L3和L4发展。在组建团队的同时,蔚来还与英伟达合作,提前量产了Orin芯片,成为全球首个量产Orin芯片的车企,并推出了全球最复杂的ADC(自动驾驶域控制器)架构。
Orin芯片作为新一代产品,面临散热、功耗、热稳定性等诸多挑战。蔚来团队在短时间内解决了这些问题,并重新构建了AI、CPU、调度相关的工具链。任少卿表示,团队在定义芯片需求时,预见了Transformer技术的兴起,并在芯片设计中预留了高带宽和热备能力,以支持更高级别的自动驾驶功能。
在自研芯片量产进程中,蔚来还建设了一系列工具链和体系,其中数据闭环系统是核心之一。任少卿认为,数据的重要性在于其针对特定模型的精准挑选,而这一过程消耗大量算力。因此,蔚来建立了灵活调用云端和车端算力的系统,并在此基础上构建了大数据体系。蔚来还借鉴互联网行业的“AB test”方法,建立了灵活调度算力的系统,实现了模型的高效迭代。
针对主动安全领域的挑战,蔚来利用“AB test”系统实现了三天迭代一次的频率,显著降低了误报率。同时,蔚来还建立了针对量产车智驾问题的自动化分析系统,通过大模型过滤无效信息,提高研发效率。
在自动驾驶技术演进过程中,端到端成为热门话题。任少卿认为,端到端是技术发展的一个阶段,但并未解决所有问题。他指出,语言模型以语言为核心,难以解决时空认知问题,而自动驾驶作为真实世界中的Agent,需要同时具备概念认知和时空认知能力。因此,蔚来从2023年开始投入研发世界模型,旨在建立时空认知能力,解决长时序问题。
世界模型通过学习空间和时间信息,支持长时序推演,使自动驾驶系统能够更一体化地处理复杂场景。任少卿表示,蔚来在小路处理能力上的提升就是世界模型应用的典型案例。在小路会车时,世界模型能够综合考虑空间和时间因素,做出更合理的决策判断。











