ITBear旗下自媒体矩阵:

北大团队突破时序预测瓶颈:基于Wasserstein分布对齐的无偏训练新范式

   时间:2026-02-26 15:44:36 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

在时间序列预测领域,传统方法常采用基于极大似然估计的均方误差(MSE)作为损失函数,但这类方法在处理具有自相关性的标签序列时存在明显偏差。近期,一项由多所高校与企业联合完成的研究提出全新解决方案,通过引入最优传输理论中的Wasserstein距离,将预测问题转化为条件分布对齐任务,有效解决了传统方法的局限性。

研究团队指出,现有主流的直接预测范式(Direct Forecast)虽具备并行计算优势,但其依赖的时序均方误差损失函数未能充分考虑标签序列的内在几何结构。这种结构特征表现为时间维度上的自相关性,即当前时刻的值与前后时刻的值存在统计依赖关系。传统损失函数在计算时默认各时间点独立,导致模型训练过程中产生系统性偏差。

针对这一核心问题,研究人员提出名为DistDF的创新框架。该框架突破传统极大似然估计范式,转而通过最小化预测分布与真实条件分布之间的Wasserstein距离实现模型训练。理论推导证明,联合分布的Wasserstein距离可作为条件分布距离期望的上界,这为通过优化联合分布间接实现条件分布对齐提供了数学依据。相较于直接计算条件分布距离,联合分布对齐策略可利用全体数据集样本,显著提升距离估算的可靠性。

在具体实现层面,研究团队在高斯分布假设下,将复杂的Wasserstein距离计算简化为均值与协方差距离的加权和。这种基于Bures-Wasserstein距离的损失函数设计,既保证了数学严谨性,又大幅降低了计算复杂度。实验数据显示,在ECL数据集上,该框架使iTransformer模型的MSE指标降低2.7%,验证了其对标签自相关性的有效处理能力。

对比实验表明,DistDF框架相较于FreDF和Time-o1等现有改进方法具有显著优势。后两者虽通过不同方式减少了似然估计偏差,但仍存在残差偏差问题。DistDF通过直接优化条件分布距离,实现了真正的无偏对齐。消融实验进一步证实,均值对齐与协方差对齐的协同作用是性能提升的关键,单独使用任一组件均可带来改进,但联合使用效果最佳。

可视化分析显示,采用DistDF训练的模型生成的预测序列与真实标签具有更高拟合度,能有效抑制噪声和异常波动。在困难样本的外推任务中,该框架展现出更强的预测能力。值得注意的是,这种性能提升具有模型普适性——在TimeBridge、FredFormer、iTransformer和FreTS等多种主流架构上均验证了其有效性。

这项研究为时间序列预测领域提供了新的理论视角和技术路径。通过将最优传输理论引入损失函数设计,不仅解决了传统方法在处理自相关数据时的固有缺陷,更开创了分布对齐技术在时序任务中的应用范式。其核心思想——通过联合分布优化间接实现条件分布对齐——为相关领域的研究提供了可借鉴的方法论框架。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version