滚动资讯

当前位置：首页 > 资讯 > 手机快报 > 正文内容

苹果全能视觉AI模型UniGen 1.5亮相

时间：2025-12-19 16:59:14 来源：IT之家编辑：快讯 IP：北京 发表评论无障碍通道

12 月 19 日消息，科技媒体 9to5Mac 昨日（12 月 18 日）发布博文，报道称苹果研究团队近日发布多模态 AI 模型 UniGen 1.5，成功在单一系统中集成了图像理解、生成与编辑三大核心功能。

与主要依赖不同模型分别处理任务的传统方案不同，UniGen 1.5 最大的突破在于构建了一个统一的框架，仅凭一个模型即可同时完成图像理解、图像生成以及图像编辑任务。研究人员认为，这种统一架构能让模型利用强大的图像理解能力反哺生成效果，从而实现更精准的视觉输出。

在图像编辑领域，模型往往难以精准捕捉用户微妙或复杂的修改指令。苹果团队为解决这一难题，首创引入了名为“编辑指令对齐”的后训练阶段。

该技术并不直接让模型修改图片，而是要求模型先根据原图和指令，预测出目标图像的详细文本描述。这种“先想后画”的中间步骤，迫使模型在生成最终图像前，必须深度内化用户的编辑意图，从而大幅提升了修改的准确度。

这一中间步骤有助于模型在生成最终图像之前更好地理解预期的编辑内容。

除了指令对齐，UniGen 1.5 的另一大贡献在于强化学习层面的创新。研究团队成功设计了一套统一的奖励系统，能够同时应用于图像生成和图像编辑的训练过程。

此前，由于编辑任务涉及从微调到重构的巨大跨度，统一奖励机制极难实现，而这一突破让模型在处理不同类型的视觉任务时，能够遵循一致的质量标准，显著增强了系统的“抗干扰”性。

UniGen-1.5 的文本转图像生成和图像编辑功能的一些示例

在多项行业标准基准测试中，UniGen 1.5 展现了强劲的竞争力。数据显示，该模型在 Geneval 和 DPG-Bench 测试中分别获得 0.89 和 86.83 的高分，显著优于 BAGEL 和 BLIP3o 等近期热门方法。

尽管整体表现优异，UniGen 1.5 目前仍存在一定局限性。研究人员在论文中坦承，由于离散去标记器（discrete detokenizer）在控制细粒度结构方面存在不足，模型在生成图片内的文字时容易出错。

图 A 展示了 UniGen-1.5 在文本转图像生成和图像编辑任务中的失败案例。以上图源：苹果论文

在部分编辑场景下，模型偶尔会出现主体特征漂移的问题，例如猫的毛发纹理改变或鸟的羽毛颜色偏差，这些问题将是团队未来的优化重点。

更多>同类资讯

第五代五菱宏光MINIEV甜趣登场，萌趣设计多样配置开启出行新体验

03-28

一加Nord CE6 Lite配置曝光：7000mAh大电池+5000万主摄预计5月发布

03-28

萌趣外观遇上实用配置！第五代五菱宏光MINIEV上市 4.48万起售

03-28

比亚迪2025年营收超8000亿海外扩张迅猛拟投600亿理财再添新动力

03-28

比亚迪2025年营收稳步增长，销量创新高，纯电登顶全球销冠

03-28

2026款揽胜运动上市，配置“加减法”优化，百万级豪华SUV再添实力之选

03-28

第五代五菱宏光MINIEV萌趣登场！4.48万起售，续航配置全面升级

03-28

全固态电池量产在即，性能跃升！现有新能源车不必慌，技术迭代需时间

03-28

Vision Pro携手BBC：沉浸式体验钢琴家指尖飞舞感受顶级音乐厅魅力

03-28

一加Nord CE6 Lite配置曝光：7000mAh大电池+5000万主摄或成新亮点

03-28

华为畅享90 Pro Max 4月2日开售：大电池长续航，中端市场新选择

首要亮点是华为巨鲸大电池，其次是方舟引擎、鸿蒙智慧通信、玄甲机身、臻彩护眼屏等方面，对比同系列其它版本，优势更突出，尤其是续航能力。新机拥有一块6.84英寸的臻彩直屏，分辨率为2756*1272像素+444…

03-28

苹果提醒运行旧版iOS系统用户：存在网页攻击风险，建议尽快升级系统

03-28

华为跨界出击！把“版权狂魔”迪士尼告上欧洲法庭，谁更胜一筹？

03-28

2026年Apple静安店璀璨启幕 50周年庆与王逢陈大秀共谱新篇

03-28

华为新机策略生变？Pura 90系列或取消Ultra款聚焦影像直屏体验

PChome3月27日消息，据博主“数码闲聊站”爆料，某品牌将取消4月Ultra超大杯机型的推出，硬件配置与大杯高度重合，结合行业信息，该机型预计为华为Pura90系列。爆料显示，华为Pura 90系列…

03-28

点击查看更多 +

全站最新

萌趣外观遇上实用配置！第五代五菱宏光MINIEV上市 4.48万起售

南京三月电车热销：油价波动之外，充电提速成本低成新引力

中建材与吉利南非携手共筑新能源全链条合作新蓝图

比亚迪居治国：AI赋能4S售后转型，深耕本地化构建服务新生态

韧性之下的价值重估：飞鹤加速向全龄营养引领者迈进

跃进“天元架构”首发，3款轻卡新车型江宁下线开启绿色物流新篇

热门内容

本栏最新

2026款揽胜运动上市，配置“加减法”优化，百万级豪华SUV再添实力之选

第五代五菱宏光MINIEV萌趣登场！4.48万起售，续航配置全面升级

全固态电池量产在即，性能跃升！现有新能源车不必慌，技术迭代需时间

宇通科技节绘就智电融合新画卷睿控E+平台亮相赋能智慧商用新未来

电车开五年后醒悟：电池“扛造”得很，这三个部件才是隐藏的“消耗王”

纯电新势力登场！埃安UT Sport原厂“官改”，5万级开启改装新时代

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.