ITBear旗下自媒体矩阵:

中国电信突破图像编码技术,以扩散模型引领通信体验革新

   时间:2025-07-16 21:49:21 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道

在多媒体与人工智能的交汇点,中国电信正书写着技术创新的新篇章。近日,中国电信云计算研究院的常建慧博士凭借论文《基于扩散先验的生成式图像编码》,在IEEE国际多媒体与博览会议(ICME 2025)上荣获“最佳论文奖”,这一成就标志着中国电信在生成式图像编码领域取得了国际瞩目的技术突破。

常建慧博士的论文创新性地将扩散模型引入生成式图像编码,成功打破了传统方法在压缩效率与图像重建质量之间的权衡难题。这一技术突破,不仅提升了图像的压缩率,更重要的是,它能够在极低的传输负载下,还原出高质量的视觉内容,为通信系统带来了从“传输数据”到“重建体验”的变革。

想象一下,未来的通信场景:你佩戴着轻便的AR眼镜,与远在他乡的亲人进行仿佛面对面的交流,他们的表情、动作乃至背后的环境都栩栩如生。这一切高清画面的背后,正是生成式编码技术在发挥作用。它收集关键信息,通过本地生成模型快速还原画面,为用户带来沉浸式的通信体验。

生成式编码技术的这一突破,源于对图像“压缩”与“生成”关系的全新理解。随着生成技术的进步,视觉内容已经从自然图像为主,演变为自然图像与AI生成图像的复杂混合。传统的基于GAN和VAE的生成式编码技术,在控制力、稳定性及重建质量方面存在局限。而扩散模型以其强大的可控生成高质量图像的能力,为图像压缩任务提供了新的解决方案。

然而,将扩散模型应用于生成式编码并非易事。如何在极低比特率下提取出对生成过程有引导力的关键信息,如何让扩散模型“听懂”来自编码器的控制信号,都是亟待解决的技术难题。经过反复实验与模型优化,常建慧博士及其团队终于取得了突破。他们提出的基于扩散模型先验的生成式编码框架,成功将“生成能力”转化为“可控的压缩系统”,在低码率下显著提升了感知保真度。

这一技术突破的背后,是无数次的失败与尝试。常建慧博士在求学期间就开始探索生成模型在图像压缩中的应用,但一直面临着细节保真和泛化能力的瓶颈。直到扩散模型的发展为这一难题提供了新的解法,她才看到了希望。在加入中国电信云计算研究院后,研究院提供的强大算力与实验条件支持,让她的研究得以加速推进。

如今,这一技术已经展现出广阔的应用前景。在带宽敏感或存储成本高的场景中,如医疗影像的长期备份,生成式编码可以在极低码率下保留结构与感知细节,有望大幅降低存储开销。它还可以应用于AI原生通信、AIGC存储优化、边端协同等新兴领域,为通信系统的智能化、高效化提供有力支撑。

中国电信云计算研究院计划将这一技术进一步拓展到视频编码中,并探索多模态任务和多模态模型的应用。同时,他们正与天翼云、天翼视联等公司进行沟通合作,探讨可能的落地应用场景。未来,这一技术有望在更多领域发挥重要作用,推动通信系统的持续演进和产业升级。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version