滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

中国电信创新突破：扩散模型引领通信迈向“体验重建”新时代

时间：2025-07-16 12:13:45 来源：ITBEAR编辑：快讯团队 IP：北京 发表评论无障碍通道

中国电信在多媒体与人工智能的交叉领域取得了突破性进展，这一成就获得了国际认可。中国电信云计算研究院的常建慧博士所撰写的论文《基于扩散先验的生成式图像编码》在IEEE国际多媒体与博览会议（ICME 2025）上荣获“最佳论文奖”。该论文提出了一种创新的思路，将扩散模型应用于生成式图像编码领域，有效打破了传统方法在压缩效率与图像重建质量之间的权衡难题。

生成式图像和视频编码技术的突破，正引领通信系统从“传输数据”的传统模式向“重建体验”的全新阶段转变。这不仅仅意味着压缩率的提升，更重要的是，它能够在极小的传输负载下，还原出高质量的视觉内容。常建慧博士在接受采访时，详细阐述了此次技术突破的应用价值和广阔前景。

传统图像编码技术在面对自然图像与AI生成图像的复杂混合时，面临着诸多挑战。早期基于GAN和VAE的生成式编码技术，在控制力、稳定性和重建质量上存在一定的局限性。而近年来，扩散模型在图像生成领域展现出了强大的能力，为图像压缩带来了新的可能性。然而，现有的基于扩散模型的图像生成方法多由文本引导，虽然能够生成高质量的图像，但在保真度方面仍有不足，容易出现偏色、变形等问题，难以满足通信系统对编码的“可控、稳定、可还原”要求。

常建慧博士的研究团队提出的基于扩散模型先验的生成式编码框架，其核心在于将“生成能力”转化为“可控的压缩系统”。这一框架使模型在低码率下仍能传达明确有效的控制信号，确保重建结果符合压缩器的“指令”，从而在低码率区间显著提升了感知保真度。该框架采用通用编码器与插件式适配器相结合的架构，并引入变码率机制，支持多码率压缩与灵活对接多种预训练扩散模型，从AIGC到自然图像，再到特定领域的内容，都表现出强大的适配性。

科研之路往往充满挑战，这项技术的萌芽始于常建慧博士求学期间的思考与探索。她一直在寻求让生成模型参与图像压缩的方法，虽然早期成果在细节保真和泛化能力上仍有瓶颈，但扩散模型的发展为这一难题提供了新的解决方案。然而，从想法到可用方案的过程中，团队面临着压缩器表达能力与生成器可控性的双重挑战。经过多轮尝试与调整，团队最终引入了“变码率编码器+适配器+融合引导”的结构，成功建立了压缩与生成之间的协同机制。

加入中国电信云计算研究院后，常建慧博士得到了强大的算力与实验条件支持。经过反复实验与模型优化，该方案逐渐趋于稳定。研究院独特的科研氛围也为她提供了广阔的发展空间，她与团队成员共同努力，不断突破技术难关，最终使这项技术得以成型并获得了国际认可。

这项技术的应用前景广阔，特别是在带宽敏感或存储成本高的场景中。例如，在医疗影像等冷数据图像的长期备份中，生成式编码可以在极低码率下保留结构与感知细节，有望大幅降低存储开销。然而，要实现规模化落地，还需在推理效率、系统集成能力和生态标准建设等方面取得突破。

中国电信云计算研究院计划将该技术进一步拓展到视频编码中，并探索多模态任务和多模态模型的应用。常建慧博士表示，生成式编码是一项面向未来的“通用视觉通信能力”，它将支撑泛在云向更智能、更高效、更感知驱动的方向演进。未来，该技术有望在边缘端降低图像/视频的回传成本，提升算网协同效率；在中心云支持大规模感知优先型视觉内容的托管、分发与归档；在泛在场景中构建出“生成驱动”的新型通信机制。

中国电信云计算研究院已与天翼云、天翼视联公司进行了初步沟通，探讨可能的落地应用场景。未来，这一创新技术将不仅局限于“云”领域，还将延伸至视联网等更广泛的领域，为“AI+通信”的融合浪潮注入新的活力。在团队的共同努力下，那些曾经制约实践的“不可能”正被一一击破，中国电信的创新者正以扎实的根技术，实践着从“0”到“1”的突破。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

共筑人工智能未来：全球聚焦包容、可信与创新治理之路

峰会期间，中方代表积极阐释中国对加强全球人工智能监管与治理的立场，介绍中国在该领域的最新成果，受到广泛关注。本次峰会举办青少年机器人挑战赛，开设了30场工作坊，吸引了各国尤其是全球南方国家的年轻人前来参赛，以…

07-16

西北工大成立人工智能学院，打造国防智能科技创新高地

据悉，西北工业大学人工智能学院深度融合人工智能与系统集成技术，通过凸显“人工智能+无人系统”特色，致力于打造智能无人系统领域的研究与应用高地，为我国国防科技工业发展提供有力支撑。要创新育人模式，构建“精英班…

07-16

石头科技再获新专利：机械手创新设计引领智能清洁设备安全与便捷新高度

这一数据不仅展示了石头科技在研发领域的持续投入，还反映了其在智能设备行业中的强大创新能力和竞争优势。这些成就不仅提升了石头科技在行业内的知名度，也为其在智能家居和清洁设备领域的市场拓展奠定了基础。这项新专利…

07-16

西北工大成立人工智能学院，打造国防智能科技创新高地

07-16

月之暗面Kimi K2模型API提速中：优化推理效率，增强用户体验

07-16

Perplexity与SheerID合作：全球2.64亿学生将获两年免费AI搜索高级服务

07-16

Mistral发布Voxtral：开源音频模型，挑战巨头，开启语音智能新篇章

07-16

苹果MLX新增CUDA支持，AI开发者成本降效率升

07-16

Willow Voice获420万美金天使轮，AI语音输入技术引领高效工作新潮流

07-16

月之暗面Kimi K2 API速度优化中：访问量大模型重，正加机提效

07-16

微软AI裁员风暴席卷印度，员工担忧未来职场地位

07-16

朱啸虎预测：AI大模型将主导未来，90%Agent面临转型挑战

需要区分的是：新浪(Sina)、搜狐(Sohu): 这些门户网站的创始团队(王志东、张朝阳等)虽然也是互联网先驱，但他们通常有更强的海归或资本背景，起步时目标就是打造门户平台，与"个人站长"草根、小规模起步的…

07-16

科大讯飞股价上扬近两成，讯飞云创入股数字文创企业，医疗板块将亮相卫信大会

科大讯飞主要从事智能语音及人工智能技术研发，业务涵盖教育、医疗、智慧城市等领域。公司持续加大研发投入，2024年研发支出达45.9亿元，占营业收入近20%。该公司成立于2023年8月，注册资本2000万元，…

07-16

科大讯飞成功中标“移动爱车”AI语音服务，赋能智能出行新体验

证券之星消息，根据天眼查APP信息整理，7月15日公布的《“移动爱车”AI语音服务能力项目_中选结果公示》中显示科大讯飞股份有限公司中标。公告内容如下：科大讯飞股份有限公司。采购人/招标代理机构：中移（上海）…

07-16

和林格尔新区：绿色算力调度融入国家网，开启高质量发展新篇章

这一历史性对接，标志着和林格尔新区作为国家算力枢纽的核心能力得到关键性提升，为其建设绿色算力高地的征程注入了强劲新动能。此次接入的全国一体化算力网资源监测平台，是国家为推动算力资源实现集约化、智能化管理而打…

07-16

点击查看更多 +

全站最新

共筑人工智能未来：全球聚焦包容、可信与创新治理之路

西北工大成立人工智能学院，打造国防智能科技创新高地

iPhone 17系列无线充电大升级，或将全面支持25W快充

苹果折叠屏iPhone新进展：转投三星显示，2026年或见无折痕设计

苹果iPhone Fold定价曝光，或售2000美元，面临国产机型激烈竞争

苹果即将商用七大自研芯片：A19、M5系列及通信核心组件全面升级

热门内容

本栏最新

西北工大成立人工智能学院，打造国防智能科技创新高地

朱啸虎预测：AI大模型将主导未来，90%Agent面临转型挑战

科大讯飞成功中标“移动爱车”AI语音服务，赋能智能出行新体验

和林格尔新区：绿色算力调度融入国家网，开启高质量发展新篇章

荣耀X70评测：耐用新标杆，IP69K防水抗摔，8300mAh电池续航无忧

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.