首页 > 科技>苹果全能视觉 AI 模型 UniGen 1.5 亮相，看图、修图、绘图三合一

苹果全能视觉 AI 模型 UniGen 1.5 亮相，看图、修图、绘图三合一

IT之家科技2025-12-19 07:45:08

科技媒体 9to5Mac 昨日（12 月 18 日）发布博文，报道称苹果研究团队近日发布多模态 AI 模型 UniGen 1.5，成功在单一系统中集成了图像理解、生成与编辑三大核心功能。...

最新 12 月 19 日消息，科技媒体 9to5Mac 昨日（12 月 18 日）发布博文，报道称苹果研究团队近日发布多模态 AI 模型 UniGen 1.5，成功在单一系统中集成了图像理解、生成与编辑三大核心功能。

与主要依赖不同模型分别处理任务的传统方案不同，UniGen 1.5 最大的突破在于构建了一个统一的框架，仅凭一个模型即可同时完成图像理解、图像生成以及图像编辑任务。研究人员认为，这种统一架构能让模型利用强大的图像理解能力反哺生成效果，从而实现更精准的视觉输出。

在图像编辑领域，模型往往难以精准捕捉用户微妙或复杂的修改指令。苹果团队为解决这一难题，首创引入了名为“编辑指令对齐”的后训练阶段。

该技术并不直接让模型修改图片，而是要求模型先根据原图和指令，预测出目标图像的详细文本描述。这种“先想后画”的中间步骤，迫使模型在生成最终图像前，必须深度内化用户的编辑意图，从而大幅提升了修改的准确度。

苹果全能视觉 AI 模型 UniGen 1.5 亮相，看图、修图、绘图三合一

Image: Apple

这一中间步骤有助于模型在生成最终图像之前更好地理解预期的编辑内容。

除了指令对齐，UniGen 1.5 的另一大贡献在于强化学习层面的创新。研究团队成功设计了一套统一的奖励系统，能够同时应用于图像生成和图像编辑的训练过程。

此前，由于编辑任务涉及从微调到重构的巨大跨度，统一奖励机制极难实现，而这一突破让模型在处理不同类型的视觉任务时，能够遵循一致的质量标准，显著增强了系统的“抗干扰”性。

Image: Apple

UniGen-1.5 的文本转图像生成和图像编辑功能的一些示例

Image: Apple

UniGen-1.5 的文本转图像生成和图像编辑功能的一些示例

在多项行业标准基准测试中，UniGen 1.5 展现了强劲的竞争力。数据显示，该模型在 GenEval 和 DPG-Bench 测试中分别获得 0.89 和 86.83 的高分，显著优于 BAGEL 和 BLIP3o 等近期热门方法。

在图像编辑专项测试 ImgEdit 中，其 4.31 的综合得分不仅超越了 OminiGen2 等开源模型，更与 GPT-Image-1 等专有闭源模型表现持平。

尽管整体表现优异，UniGen 1.5 目前仍存在一定局限性。研究人员在论文中坦承，由于离散去标记器（discrete detokenizer）在控制细粒度结构方面存在不足，模型在生成图片内的文字时容易出错。

Image: Apple

图 A 展示了 UniGen-1.5 在文本转图像生成和图像编辑任务中的失败案例。以上图源：苹果论文

此外，在部分编辑场景下，模型偶尔会出现主体特征漂移的问题，例如猫的毛发纹理改变或鸟的羽毛颜色偏差，这些问题将是团队未来的优化重点。

最新附上参考地址

UniGen-1.5: Enhancing Image Generation and Editing through Reward Unification in Reinforcement Learning

《苹果全能视觉 AI 模型 UniGen 1.5 亮相，看图、修图、绘图三合一》转载自互联网，如有侵权，联系我们删除，QQ：369-8522。

本文网址：https://m.jsj.wang/2025/12/17661015165351.html

相关图文

马斯克亲密盟友美亿万富翁贾里德·艾萨克曼出任NASA局长

快科技12月18日消息，据央视新闻报道，当地时间本月17日，美国参议院以67票赞成、30票反对的投票结果，确认亿万富翁私人宇航员贾里德·艾萨克曼担任美国国家航空航天局（NASA）第15任局长...

科技 2025-12-19 0
为给孩子减负！教育部：普通高中严格控制考试次数、小学一二年级不进行纸笔考试

快科技12月18日消息，近日，教育部印发《关于进一步加强中小学日常考试管理的通知》，要求减少日常考试测试频次，提升日常考试质量，强化考试安全风险防范，减轻学生过重学业负担，促进学生全面...

科技 2025-12-19 0
30岁中国健美冠军为何突然猝死流感后坚持训练：医生紧急提醒

快科技12月18日消息，近日30岁的健美冠军王昆突然离世被挤上热搜，这也引来网友的热议。一名自称为王昆生前多年好友的回应：“王昆是在14日下午走的，死亡原因为心源性猝死。”据...

科技 2025-12-19 0
吃不饱穿不暖能活更久！真不骗你

此前，中国工程院院士张运在接受采访时提到，吃八成饱、有饥饿感会启动长寿基因；穿不暖、稍微有些寒冷感，也会启动长寿基因。表面上看，这两句话似乎有些反常识——我们常用&ldquo...

科技 2025-12-19 0
我国首个！川藏高原腹地特高压工程建成投运输电距离近1900公里

快科技12月18日消息，央视新闻报道，我国首条深入川藏高原腹地的特高压工程——国家电网金上—湖北±800千伏特高压直流输电工程，近日正式投运。该工程总投资334亿元，起...

科技 2025-12-19 0
储量惊人！我国发现亚洲最大的海底巨型金矿：累计探明金资源储量3900余吨

快科技12月18日消息，据山东省烟台市海洋发展和渔业局官方发布消息，莱州市发现了亚洲最大的海底金矿。官方信息中提到，莱州市三山岛北部海域新发现国内唯一、亚洲最大的海底巨型金矿，莱州市...

科技 2025-12-19 0