近日,腾讯正式推出了其最新的图像生成技术——混元图像2.0模型(Hunyuan Image 2.0),这一技术革新在行业内引起了广泛关注。混元图像2.0不仅实现了实时图像生成,还以其超写实的画面质感脱颖而出,为用户带来了前所未有的体验。
现在,用户可以通过访问腾讯混元官方网站(https://hunyuan.tencent.com/)注册并体验这一前沿技术。相较于前代模型,混元图像2.0的参数量实现了显著提升,这得益于其采用的超高压缩倍率的图像编解码器以及全新的扩散架构,使得图像生成速度远超行业平均水平。
具体而言,在同类商业产品中,每张图像的推理速度通常需要5到10秒,而腾讯混元图像2.0则能在毫秒级时间内完成响应。这意味着用户可以在打字或说话的同时,即时看到生成的图像,彻底颠覆了传统图像生成中“等待-生成”的单一模式。
除了速度上的优势,混元图像2.0在图像生成质量上也取得了显著进步。通过强化学习等先进算法,并结合大量人类美学知识,生成的图像不仅真实感强、细节丰富,而且有效避免了AIGC图像中常见的“AI味”,使得图像更具可用性和艺术价值。
在图像生成领域的专业评估基准Geneval上,腾讯混元图像2.0模型的准确率超过了95%,远超其他同类模型,进一步证明了其卓越的性能。在发布直播中,腾讯混元展示了多个不同风格的图片生成效果,包括人像摄影、动物特写、复古摄影等,每一幅图像都展现出电影级别的质感。
▲人像摄影风格

▲动物特写

▲复古摄影
腾讯混元图像2.0还推出了实时绘画板功能,这一功能基于模型的实时图像生成能力,使得用户在绘制线稿或调整参数时,预览区能够同步生成上色效果。这一创新打破了传统绘画中的“绘制-等待-修改”线性流程,为专业设计师的创作提供了强有力的支持。实时绘画板还支持多图融合功能,用户可以将多个草图叠加在同一画布上自由创作,通过AI自动协调透视与光影,生成融合图像,进一步丰富了AI图像生成的交互体验。
腾讯混元图像2.0模型的发布,标志着腾讯在图像生成领域取得了又一重要里程碑。自2014年率先推出并开源业内首个中文原生的DiT架构文生图开源模型以来,腾讯混元一直在图像、视频等模态上持续投入,不断推动技术的创新与进步。未来,腾讯混元将继续深耕多模态领域,为用户带来更多惊喜和突破。