ITBear旗下自媒体矩阵:

DeepSeek论文登《自然》封面,纯强化学习提升推理力,科技板块迎资金热潮

   时间:2025-09-22 09:21:09 来源:小AI编辑:快讯 IP:北京 发表评论无障碍通道
 

国际权威学术期刊《自然》最新一期(第645期)封面文章,聚焦中国团队在大语言模型领域的突破性进展。由梁文锋担任通讯作者的DeepSeek团队,通过纯强化学习路径显著提升模型推理能力的研究成果,引发全球科技界关注。该研究证实,无需依赖大规模人工标注数据,模型即可在数学解题、编程竞赛等复杂任务中达到研究生水平表现。

研究团队创新性采用"无监督冷启动"策略,摒弃传统监督微调(SFT)方法,转而通过大规模强化学习(RL)实现模型进化。实验数据显示,DeepSeek-R1在解决数学难题时,能自动生成结构化推理链,并通过问题解决质量获得动态奖励反馈。这种机制使模型学会优化思考路径,例如在DeepSeek-R1-Zero版本中,观察到模型主动调整思考时间分配策略,展现出类似人类的认知灵活性。

针对早期外界关于"模型蒸馏"技术的质疑,研究团队在论文中详细披露技术路径。通过对比实验证明,纯强化学习训练的模型在STEM领域表现超越传统方法,且人类标注工作量减少达70%。这种技术突破为降低大模型训练成本提供了新思路,特别在专业领域知识获取方面具有显著优势。

在模型迭代方面,DeepSeek团队保持快速推进节奏。继年初开源模型引发行业震动后,8月推出的V3.1版本实现三大技术升级:混合推理架构支持即时响应与深度思考双模式、思考效率较前代提升40%、智能体工具调用能力增强25%。值得关注的是,该版本专门针对国产芯片架构优化参数精度,采用UE8M0 FP8 Scale技术,直接带动相关芯片产业链股价单日上涨超5%。

资本市场对AI技术突破反应热烈。Choice数据显示,科创人工智能ETF华夏单日涨幅达3.8%,东财人工智能指数收涨2.43%。资金流向监测显示,9月以来超过400亿元科创债ETF完成发行,其中13只产品规模突破29亿元。私募机构参与定增数据显示,电子板块获配金额达10.98亿元,占全年定增总额的27.7%,显示机构对AI硬件基础设施的持续看好。

主流投资机构普遍认为,AI产业链已进入规模化落地阶段。望正资产指出,商业模式成熟、具备盈利增长潜力的AI算力与应用企业将成为重点布局方向。淡水泉投资则强调,在AI科技、创新药等新兴领域,具有持续业绩表现的行业龙头将持续获得资金青睐。这种技术突破与资本投入的良性互动,正在重塑中国科技产业的竞争格局。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version