您现在的位置是:小程序 >>正文
ContorlNet作者的研究!LayerDiffusion可生成商业素材级别透明PNG图片
小程序499人已围观
简介划重点:⭐️ 一个非常有意思的项目可以用 SD 直接生成透明的 PNG 图片,也可以直接生成带有透明度分层的图片。⭐️ LayerDiffusion使得大型已经过预训练的潜在扩散模型能够创造透明图像。 ...
划重点:
⭐️ 一个非常有意思的究L级别项目可以用 SD 直接生成透明的 PNG 图片,也可以直接生成带有透明度分层的生成商业素材图片。
⭐️ LayerDiffusion使得大型已经过预训练的透明G图潜在扩散模型能够创造透明图像。
⭐️ 这项技术不仅可以生成单独的究L级别透明图像,还能生成多层透明图层,生成商业素材拥有多种应用场景。透明G图
CSS站长资源(ChinaZ.com)2月28日 消息:用于生成图像的究L级别大规模模型已经成为计算机视觉的基础而图形,令人惊讶的生成商业素材是,很少有研究关注分层内容生成或透明图像生成。透明G图这种情况与巨大的究L级别市场需求形成鲜明对比。
ContorlNet的生成商业素材作者研究了一款名为LayerDiffusion项目,使得大型已经过预训练的透明G图潜在扩散模型(latent diffusion model)能够创造透明图像。LayerDiffusion可以用 SD 直接生成透明的究L级别 PNG 图片,也可以直接生成带有透明度分层的生成商业素材图片。
它通过一种被称为“潜在透明度”的透明G图方法,将透明度(即 alpha 通道)整合到预训练的潜在扩散模型的潜在结构中。这样做的好处是,它通过以潜在偏移的形式加入透明度,几乎不改变模型原有的潜在分布,从而保持了模型的高质量输出能力。基于这种方法,任何一个潜在扩散模型都可以通过对潜在空间的微调,转化为透明图像生成器。
研究人员在训练模型时采用了涉及人机互动的方法,收集了大量透明图像层数据。研究结果显示,潜在透明技术不仅可以应用于各种开源图像生成器,还可以适配多种条件控制系统,实现不同应用场景下的层生成和结构控制。
研究显示,这种潜在透明技术不仅可以应用于不同的开源图像生成器,还可以适配多种条件控制系统,实现例如基于前景/背景条件的层生成、层的联合生成、对层内容进行结构控制等多种应用。
一项用户研究发现,大多数情况下(97%),相比于之前的临时解决方案(如先生成图像再进行抠图处理),用户更喜欢我们直接生成的透明内容。用户还表示,生成的透明图像在质量上可媲美真实的商业级透明素材,例如 Adobe Stock 提供的素材,展现出技术的强大和实用性。
论文入口:https://arxiv.org/pdf/2402.17113.pdf
Tags:
相关文章
谷歌推出 ImageFX:具有表达芯片的文本到图像工具
小程序CSS站长资源ChinaZ.com)2月2日 消息:谷歌正在推出一系列关于生成人工智能的更新,包括一个新的文本到图像工具。ImageFX的不同之处在于它有一个具有“表达芯片”功能的界面。谷歌表示,除了 ...
【小程序】
阅读更多小米:目标今年6月份 小米SU7月交付破万辆
小程序快科技5月23日消息,今日下午,小米集团发布了一季度财报。对于小米汽车的月度交付情况,小米集团表示,我们的目标是,2024年6月,Xiaomi SU7系列单月新车交付量超过10,000辆。同时,小米财 ...
【小程序】
阅读更多蔡崇信吴泳铭发布上任首封致股东信:AI将带来巨大机遇
小程序CSS站长资源ChinaZ.com)5月24日 消息:昨日,蔡崇信、吴泳铭发布了第一封联合署名的致股东信。在信中,蔡崇信、吴泳铭表示,未来十年,没有哪个行业能免于AI带来的颠覆。AI不会为旧的做事方式 ...
【小程序】
阅读更多