您现在的位置是:深度 >>正文
华为发布图像生成模型PixArt-\Sigma 可直出4K图像
深度481人已围观
简介CSS站长资源ChinaZ.com)3月8日 消息:华为近日发布了一项名为 PixArt-\Sigma 的图像生成模型,该模型采用了 DiT 架构,可以直接生成4K 分辨率的图像。相比于其前身 Pix ...
CSS站长资源(ChinaZ.com)3月8日 消息:华为近日发布了一项名为 PixArt-\Sigma 的发布图像生成模型,该模型采用了 DiT 架构,图像K图可以直接生成4K 分辨率的生成图像。相比于其前身 PixArt-\alpha,模型PixArt-\Sigma 在图像保真度上有了明显的直出提升,并改善了与文本提示的发布一致性。
项目地址:https://top.aibase.com/tool/pixart
PixArt-\Sigma 的图像K图一个关键特点是其训练效率。借助 PixArt-\alpha 的生成基础预训练,它通过整合更高质量的模型数据,从"较弱"的直出基线逐步演变为"较强"的模型,这个过程被称为"弱到强训练"。发布
PixArt-\Sigma 的图像K图进步主要体现在两个方面:高质量的训练数据和高效的 Token 压缩。PixArt-\Sigma 结合了更高质量的生成图像数据,配对更精确和详细的模型图像标题,同时在 DiT 框架内提出了一个新的直出注意力模块,可以压缩键(Key)和值(Value),显著提高效率,促进超高分辨率图像的生成。
由于这些改进,PixArt-\Sigma 以较小的模型规模(6亿参数)实现了优于现有文本到图像扩散模型(如 SDXL(26亿参数)和 SD Cascade(51亿参数))的图像质量和用户提示遵从能力。此外,PixArt-\Sigma 能够生成4K 图像,为创建高分辨率海报和壁纸提供了支持,有效地增强了电影和游戏等行业中高质量视觉内容的制作。
Tags:
相关文章
广州鼓励网约车去机场火车站接单 确保旅客出行顺畅
深度2024 年春运即将拉开帷幕,据国内媒体报道, 40 天内预计将有 90 亿人次流动,创历史新高。面对这一巨大的客流量,广州市交通运输局正全力以赴,确保旅客出行顺畅。广州市交通运输局表示,春运期间广州 ...
【深度】
阅读更多合法合规!广西男子开直升机回村过年:一小时油耗800元
深度快科技2月7日消息,临近年关,当不少人还堵在路上的时候,广东百色的谢先生已经开着直升机顺利到家。此事曝光后,引起了网友的强烈关注,问题有很多,有人问开飞机花销如何,还有人质疑这样是否安全,又是否符合法 ...
【深度】
阅读更多苹果标准版!iPhone 16摄像头布局敲定
深度快科技2月8日消息,爆料人在社交平台上曝光了iPhone 16设计图,该机采用类似iPhone X的竖排双摄设计语言。爆料人指出,iPhone 16标准版之所以采用这样的设计,是为了能实现空间视频录制 ...
【深度】
阅读更多