ITBear旗下自媒体矩阵:

大模型圆桌激辩:AI行业顶尖大佬探讨技术演进与未来路径

   时间:2025-07-28 21:05:30 来源:机器之心编辑:快讯团队 IP:北京 发表评论无障碍通道
 

在2025年世界人工智能大会(WAIC)的第二天,一场关于大模型技术发展的激烈讨论在商汤科技承办的“模型之问”圆桌论坛上上演。这场论坛汇聚了来自基础模型研发、行业应用落地及算力平台等领域的顶尖专家,共同探讨了当前大模型技术面临的诸多挑战与未来路径。

论坛由商汤科技联合创始人、执行董事、首席科学家林达华主持。嘉宾阵容豪华,包括阶跃星辰首席科学家张祥雨、上海人工智能实验室青年领军科学家及书生大模型负责人陈恺、北京智谱华章科技股份有限公司总裁王绍兰、范式集团联合创始人及首席科学官陈雨强,以及英伟达全球开发者生态副总裁Neil Trevett。

林达华开场便指出,大模型技术正处于一个关键转折点。过去半年,技术格局经历了从以预训练为主、监督学习为辅到强化学习范式的转变,标志着AI技术的进一步演进。

讨论迅速聚焦于预训练与强化学习的平衡问题。张祥雨肯定了从预训练到监督微调再到强化学习的范式合理性,但也指出预训练存在的局限,如难以建立目标导向的推理能力。他强调,未来强化学习应能接受自然语言反馈,而不仅仅是确定性反馈。陈恺则强调了预训练的重要性,认为强化学习依赖于强大的冷启动模型,并指出强化学习未来面临的挑战,包括奖励机制及基础设施的新要求。

随后,话题转向模型架构的选择。自2017年以来,Transformer架构统治了AI领域,但随着模型参数激增,其局限性日益显现。业界开始探索优化现有架构及开发全新架构。张祥雨认为,架构选择应服务于系统和算法,智能体时代可能需要重新考虑RNN等传统架构。而关于Transformer与非Transformer架构的争论,也引发了现场对模型创新方向的深入思考。

数据问题同样成为讨论的热点。随着高质量语料枯竭,合成数据被寄予厚望,但也引发了诸多担忧。Neil Trevett分享了英伟达利用物理仿真生成模拟场景训练大模型的解决方案,并强调需结合真实世界验证机制。王绍兰则提出,数据耗尽问题更多体现在质量上,应提升预训练数据质量,并呼吁行业内部建立数据共享机制。

基础模型与Agent应用的平衡也成为讨论的焦点。随着大模型进入应用深水区,Agent产品成为爆点,厂商需在基础模型研发与应用落地间找到平衡点。王绍兰和陈雨强均表示,基础模型探索将持续进行,同时需积极推动大模型商业化落地。陈雨强还指出,在落地过程中,需关注数据质量及模型能力等技术突破。

最后,开源与闭源的争论为论坛画上圆满句号。陈恺和Neil Trevett从不同角度探讨了开源如何推动AI行业发展,并指出未来可能走向开源与闭源结合的混合模式。同时,他们也强调了开源带来的新挑战,如模型分叉和碎片化问题,需行业共同探索治理方式。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version