IT之家 12 月 22 日消息,今天下午,阿里宣布开源全新图像生成模型 Qwen-Image-Layered,首次在模型内实现 PS 级的图层理解与图像生成。新模型采用自研创新架构,可将图片“拆解”成多个图层,可类比为使用 Photoshop 分层作图修图,号称能够实现几乎“零漂移”的 AI 图像精准编辑,彻底解决 AI 生图的一致性难题,加速大模型在专业设计领域的现实落地。

给定⼀张图像,Qwen-Image-Layered 可将其分解为若⼲个 RGBA 图层:

图片

分解完成后,编辑操作仅作⽤于⽬标图层,将其与其他内容物理隔离,从根本上确保了编辑的⼀致性。

可完成如下操作:

对第⼀个图层重新着⾊,⽽保持其余内容不变。

图片

将第⼆个图层中的⼥孩替换为男孩。

图片

将⽂字内容修改为“Qwen-Image”。

图片

⼲净地删除不需要的物体。

图片

对物体进⾏缩放⽽不引⼊形变和失真。

图片

在画布内⾃由移动物体。

图片

可以根据需要将同⼀张图像分解为 3 层或 8 层。

图片

IT之家附上有关链接如下:

技术报告:https://file.tonglife.net/images/6f/16eecbc8ed971b3c2c046ef8db78d2.jpg

Github:

ModelScope:https://file.tonglife.net/images/f5/a3fe91c6925735ba6248f9fee87e4d.jpg

Hugging Face:

Demo:https://file.tonglife.net/images/1f/e881220b03eaddfe5b4c9ac46a02a6.jpg

本文转自:凤凰网科技

原文地址: https://tech.ifeng.com/c/8pGq8VstTnk