您现在的位置是:深度 >>正文

腾讯推加强版InstantID项目OMG:让ID身份保持从一人变多人

深度5281人已围观

简介CSS站长资源ChinaZ.com)3月19日 消息:腾讯近日推出了一项名为OMG的新研究,这项研究支持在一张图片中生成多角色多概念。这是一个突破性的进展,因为以前的ID或概念保持项目只能将一个人还原 ...

腾讯推加强版InstantID项目OMG:让ID身份保持从一人变多人

CSS站长资源(ChinaZ.com)3月19日 消息:腾讯近日推出了一项名为OMG的腾讯推加新研究,这项研究支持在一张图片中生成多角色多概念。强版这是让I人变一个突破性的进展,因为以前的份保ID或概念保持项目只能将一个人还原在图片里面,而有了这个项目以后,多人就可以实现多人合照了。腾讯推加

项目地址:https://top.aibase.com/tool/omg

该项目还支持与原有的强版ID保持项目一起使用,比如Lora以及InstantID。让I人变这意味着,份保用户可以在一个项目中同时使用多个模型,多人无需进行额外的腾讯推加调整。这对于需要处理大量图像的强版研究人员和开发者来说,无疑是让I人变一个巨大的便利。

OMG的份保代码已经开源,这意味着所有的多人开发者都可以查看其插件实现。这无疑将进一步推动该领域的研究和发展。

OMG是一个为个性化生成设计的框架,它能友好地处理遮挡问题,能在一幅图像中无缝集成多种概念。这个框架包含两个阶段:第一阶段专注于图像布局的生成和为处理遮挡而收集视觉理解信息;第二阶段则利用这些视觉理解信息,并结合精心设计的噪声混合技术,将多个概念融合在一起,同时考虑遮挡因素。

在噪声混合过程中,选择合适的开始去噪时间点对于保持人物身份和图像布局至关重要。这一点的发现,无疑将为未来的研究提供重要的参考。

此外,OMG还能与多种单概念生成模型兼容,如LoRA和InstantID。尤其值得一提的是,LoRA模型可以直接从这个网址获取并使用。这无疑将进一步推动该领域的研究和发展。

总的来说,腾讯的这项新研究,不仅为我们提供了一个全新的视角来处理图像生成问题,也为未来的研究提供了重要的参考。我们期待看到更多的研究成果在这个领域出现。

Tags:

相关文章