在人工智能领域的一次深度对话中,来自商汤科技、阶跃星辰、上海人工智能实验室、北京智谱华章科技股份有限公司、范式集团及英伟达的多位专家,围绕大模型技术的当前挑战与未来方向展开了热烈讨论。这场于2025WAIC大模型论坛上的圆桌对话,不仅吸引了业界的广泛关注,也揭示了AI领域正处于一个关键转折点。
商汤科技联合创始人林达华开场便引用了OpenAI前首席科学家的观点,指出“预训练+监督微调”的模式即将成为过去,强化学习正引领行业走向新的范式。阶跃星辰首席科学家张祥雨进一步阐释,强化学习赋予了模型“反思能力”,解决了因果推理的难题,并预测未来模型将能够像人类一样在真实环境中自主探索。然而,上海AI实验室的青年领军科学家陈恺也指出,强化学习的成功离不开高质量的预训练模型作为基础,同时面临着确定性奖励局限和基础设施挑战。
在讨论模型架构时,张祥雨提出了一个引人深思的观点:传统Transformer架构已接近其性能极限。他认为,在即将到来的智能体时代,模型需要具备处理“无限上下文”的能力,而Transformer的串行生成机制难以满足这一需求。他预测,RNN类结构将在未来两年内重回主流,但需要引入新的机制以支持持续学习。
数据短缺被视为AI通用智能(AGI)发展的一大障碍。智谱华章科技股份有限公司总裁王绍兰强调,互联网数据的量和质都存在问题,行业落地需要企业利用独有行业数据进行预训练和强化学习对齐。英伟达全球开发者生态副总裁Neil Trevett则分享了英伟达的解决方案:利用物理仿真生成模拟场景来训练大语言模型。他同时指出,合成数据虽有其优势,但必须与真实世界的反馈闭环相结合,以避免模型崩溃。
在讨论开源与闭源问题时,陈恺表示,开源虽然不会直接产生最顶尖的模型,但它能促使所有参与者将资源投入到真正差异化的研发中。Neil Trevett则提出,未来将是开放权重、部分闭源和混合架构的长期共存。他设想了一种混合架构,其中部分组件开源以推动生态发展,而核心模块则闭源以保护商业利益。
范式集团联合创始人、首席科学家陈雨强从金融反欺诈案例出发,指出高敏感场景可能需要独立训练基座模型,并呼吁建立统一的模型调度平台,以快速吸收前沿技术同时保护私有数据。王绍兰也呼吁各行业成立数据联盟,共享非敏感行业语料,形成正向循环。
这场对话不仅展现了AI领域的前沿思考,也预示着通用人工智能正从理论走向实践,将在实验室、机房以及各行各业中加速落地。随着技术的不断进步和生态的不断完善,AI正逐步从“下一代”技术转变为“这一代”的重要力量。