英国爱丁堡大学博士生栾殿鑫及其团队在神经网络泛化性研究领域取得突破性进展。该团队通过优化训练数据设计策略,使神经网络模型在未经训练的无线信道上仍能保持稳定性能。实验表明,在信道A训练的模型应用于信道B、C、D时,其预测精度与传统方法相比具有显著优势,且在跨信道场景下表现出一致性。
研究团队指出,无线通信环境存在无限数量的信道特征组合,传统训练方式难以覆盖所有场景。即使采用大规模现实采样数据集,模型仍可能面临灾难性遗忘问题,无法保证对所有信道的预测准确性。实验数据显示,在信道B训练的模型应用于信道A时,其预测结果接近随机水平,这凸显了跨信道泛化的技术难度。
该成果为物理层通信信道估计提供了新方案。相较于最小二乘法(LS)估计需依赖信道先验信息的局限,新模型通过实现稳定的跨信道泛化能力,可在不同功率延迟分布、延迟扩展及系统参数条件下保持性能稳定。研究团队已在海思麒麟芯片的巴龙基带模块、联发科天玑系列等硬件平台上验证了技术可行性。
项目起源于栾殿鑫参与的校企合作课题。在研究初期,团队聚焦于结合注意力机制的编解码架构与在线训练方法,以满足物理层通信对低延迟和硬件适配的要求。尽管合作伙伴建议优先深化在线训练研究,但跨信道泛化问题始终是团队关注的核心。此前发表于IEEE Transactions on Wireless Communications的论文已涉及注意力机制应用,此次新研究则是对物理层神经网络应用的系统性拓展。
当前模型已实现参数精简与计算优化,神经网络参数规模控制在百量级,内存占用低于常规方案,在低性能设备上的运算延迟可控制在毫秒级。研究团队正开展三项拓展研究:其一是在具体硬件平台进行实测调试;其二是探索N×N MIMO-OFDM系统的空间相关性泛化;其三是研究液体天线与智能反射面场景下的模型适配。团队表示欢迎学术界与产业界共同参与技术迭代。