ITBear旗下自媒体矩阵:

智象未来团队ICML 2025新突破:Hi-MAR让图像生成“全局+细节”兼备

   时间:2025-05-23 11:55:47 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

在图像生成技术的最新进展中,智象未来团队提出了一种名为Hi-MAR(Hierarchical Masked Autoregressive models)的创新层级自回归生成范式,这一成果成功吸引了国际机器学习会议ICML 2025的青睐,并被正式收录。Hi-MAR不仅在多个图像生成任务中展现出了卓越的性能,还有效解决了长久以来困扰自回归图像生成模型的结构失真问题。

传统的自回归图像生成模型面临着诸多挑战,包括全局结构建模能力的缺失、训练与推理阶段分布的不一致性,以及缺乏有效的尺度引导机制。为了解决这些问题,Hi-MAR从人类的绘画过程汲取灵感,采用了一种自顶向下的层次化生成策略。这种策略不仅让模型能够逐步构建图像的整体结构,还确保了生成过程的逻辑性和连贯性。

Hi-MAR还引入了一项关键的创新——多尺度联合训练策略。这一策略使得模型能够在不同分辨率下同时学习图像的细节和全局特征,从而显著提升了模型的全局感知能力和生成质量。实验结果表明,Hi-MAR在图像质量和语义一致性方面均优于当前的主流方法,为图像生成领域带来了新的突破。

智象未来团队在最新发表的论文《Hierarchical Masked Autoregressive Models with Low-Resolution Token Pivots》中,详细阐述了Hi-MAR的设计原理和实验成果。这篇论文不仅展示了团队在多模态生成式基础架构设计领域的深厚实力,还为构建具备“全局感知+局部细化”能力的生成基础架构提供了新的思路。Hi-MAR作为HiDream系列开源模型家族的重要成员,其出现无疑为下一代多模态生成式基础架构的技术演进注入了新的活力。

值得注意的是,Hi-MAR的成功不仅在于其卓越的技术性能,更在于其背后所蕴含的创新理念。通过借鉴人类的绘画过程,Hi-MAR实现了从全局到局部的逐步生成,这种生成方式不仅符合人类的视觉感知习惯,也为图像生成技术的发展提供了新的方向。

随着Hi-MAR的推出,智象未来团队在图像生成领域的影响力将进一步扩大。未来,我们期待Hi-MAR能够在更多应用场景中发挥其优势,为图像生成技术的发展贡献更多的力量。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version