三花快讯 · 2025, 3月5日

微软 ART 模型:多层透明图像生成技术

ART 支持 RGBA 格式的独立透明图层

ART 是微软推出的一款专注于生成多层透明图片的模型。与传统的生图模型只能生成一整张图片不同,ART 的独特之处在于它能够根据全局文本提示(global text prompt)和匿名区域布局(anonymous region layout),直接生成多个独立的透明图层(支持 RGBA 格式,即包含红、绿、蓝和透明度通道)。这些图层可以单独编辑、组合或叠加。

相比之前的多层图像生成技术(如 Text2Layer 或 LayerDiffuse),ART 在支持图层数量、生成效率和透明度处理能力上都要更强。

官方有个在在线演示,感兴趣的佬友们可以亲自体验一下。

商业转载请联系三花微信公众号获得授权,非商业转载请注明本文出处及文章链接,您可以自由地在任何媒体以任何形式复制和分发作品,也可以修改和创作,但是分发衍生作品时必须采用相同的许可协议。

本文采用 CC BY-NC-SA 4.0 - 非商业性使用 - 相同方式共享 4.0 国际 进行许可。