2月28日消息:
用于生成图像的大规模模型是计算机视觉和图形学的基础,但令人惊讶的是,很少有研究关注生成分层内容或生成透明图像。这种情况与市场的巨大需求形成鲜明对比。
ContorlNet 的作者研究了一个名为LayerDiffusion 的项目。这使得大规模预训练的潜在扩散模型能够创建透明图像。 LayerDiffusion 允许您使用SD 直接生成透明PNG 图像,或具有透明图层的图像。
它通过一种称为“潜在透明度”的方法将透明度(即alpha 通道)合并到预先训练的潜在扩散模型的潜在结构中。这样做的优点是,通过以潜在偏移的形式增加透明度,我们几乎不会改变模型的原始底层分布,从而保留了模型的高质量输出特征。基于这种方法,通过微调潜在空间,任何潜在扩散模型都可以转化为透明图像生成器。
研究人员在训练模型时使用了一种涉及人机交互的技术,并收集了大量透明图像层数据。研究结果表明,潜在透明技术不仅可以应用于各种开源图像生成器,还可以应用于各种条件控制系统,实现各种应用场景下的图层生成和结构控制。
研究表明,这种潜在的透明技术不仅可以应用于各种开源图像生成器,还可以应用于各种条件控制系统,以执行基于前景/背景条件的图层生成、图层联合生成等。可以实现。结构化层控件和其他应用程序。
我们的用户研究表明,在大多数情况下(97),与以前的临时解决方案(例如教师转换为图像然后裁剪它们)相比,用户更喜欢我们直接生成的透明内容。用户还表示,生成的透明图像的质量可与真正的商业级透明材料(如Adobe Stock 上提供的透明材料)相媲美,展示了该技术的强大功能和实用性。
论文入口:https://arxiv.org/pdf/2402.17113.pdf
本文和图片来自网络,不代表火豚游戏立场,如若侵权请联系我们删除:https://www.huotun.com/game/646234.html