您现在的位置是:深度 >>正文
腾讯推加强版InstantID项目OMG:让ID身份保持从一人变多人
深度5281人已围观
简介CSS站长资源ChinaZ.com)3月19日 消息:腾讯近日推出了一项名为OMG的新研究,这项研究支持在一张图片中生成多角色多概念。这是一个突破性的进展,因为以前的ID或概念保持项目只能将一个人还原 ...
CSS站长资源(ChinaZ.com)3月19日 消息:腾讯近日推出了一项名为OMG的腾讯推加新研究,这项研究支持在一张图片中生成多角色多概念。强版这是让I人变一个突破性的进展,因为以前的份保ID或概念保持项目只能将一个人还原在图片里面,而有了这个项目以后,多人就可以实现多人合照了。腾讯推加
项目地址:https://top.aibase.com/tool/omg
该项目还支持与原有的强版ID保持项目一起使用,比如Lora以及InstantID。让I人变这意味着,份保用户可以在一个项目中同时使用多个模型,多人无需进行额外的腾讯推加调整。这对于需要处理大量图像的强版研究人员和开发者来说,无疑是让I人变一个巨大的便利。
OMG的份保代码已经开源,这意味着所有的多人开发者都可以查看其插件实现。这无疑将进一步推动该领域的研究和发展。
OMG是一个为个性化生成设计的框架,它能友好地处理遮挡问题,能在一幅图像中无缝集成多种概念。这个框架包含两个阶段:第一阶段专注于图像布局的生成和为处理遮挡而收集视觉理解信息;第二阶段则利用这些视觉理解信息,并结合精心设计的噪声混合技术,将多个概念融合在一起,同时考虑遮挡因素。
在噪声混合过程中,选择合适的开始去噪时间点对于保持人物身份和图像布局至关重要。这一点的发现,无疑将为未来的研究提供重要的参考。
此外,OMG还能与多种单概念生成模型兼容,如LoRA和InstantID。尤其值得一提的是,LoRA模型可以直接从这个网址获取并使用。这无疑将进一步推动该领域的研究和发展。
总的来说,腾讯的这项新研究,不仅为我们提供了一个全新的视角来处理图像生成问题,也为未来的研究提供了重要的参考。我们期待看到更多的研究成果在这个领域出现。
Tags:
相关文章
Wetab体验入口 个性化浏览器新标签页小组件免费使用地址
深度Wetab是一款可以亲手打造属于自己的高颜值主页的小组件新标签页插件。WeTab新标签页整合了wetabGPT,自由使用GPT。支持自定义小组件、壁纸、搜索引擎等,内置天气、倒计时等实用小组件。可自定 ...
【深度】
阅读更多雷军谈苹果终止10年造车计划:如果是我 不会这么做
深度快科技3月25日消息,今年2月,苹果被曝终止长达10年的造车计划,消息一出轰动整个造车圈,小米CEO雷军等行业大佬也都发表了自己的看法。今日,《雷军答网友问》第三集发布,在问答中,雷军谈到了苹果都已放 ...
【深度】
阅读更多小米SU7静态品鉴今日正式开启 雷军:预约人数远超想象
深度快科技3月25日消息,雷军在微博宣布,今天上午,小米SU7静态品鉴正式开启,试驾将于发布会后的29日开启。这一批次覆盖了全国29城,共76个门店,包括59个门店和17个限时展厅。雷军表示,截止目前,预 ...
【深度】
阅读更多