以辞害意网以辞害意网

Open-Sora开源项目更新:可生成长达16秒、720P高清视频

Open-Sora开源项目更新:可生成长达16秒、720P高清视频

划重点:

⭐ Open-Sora 可生成16秒,开源可生720P 高清视频

⭐ 新版本架构升级,项目稳定性提升

⭐ 多时间 / 分辨率 / 长宽比 / 帧率训练,更新P高支持多模态功能

CSS站长资源(ChinaZ.com)4月29日 消息:潞晨科技旗下文生视频模型开源项目 Open-Sora 近日进行了重大更新,成长新版本可以生成16秒时长、达秒720P 高清视频。清视

在本次更新中,开源可生团队对1.0版本的项目 STDiT 架构进行了关键性改进,提高了模型的更新P高训练稳定性和整体性能。新版本采用了多阶段训练方法,成长有效地提升了视频生成质量,达秒训练流程中引入了 QK 归一化技术和旋转位置编码。清视此外,开源可生Open-Sora 还支持多时间、项目分辨率、更新P高长宽比和帧率的训练,具备多模态功能,可以处理文本到图像、文本到视频、图像到视频等任务。

Open-Sora 的架构升级和训练流程优化使得视频生成更加稳定和高效。团队引入了掩码策略来支持图像和视频的条件化处理,提供了详细的掩码策略配置指南,增强了模型在处理图像条件化任务时的学习效果。另外,在数据收集和预处理方面,团队建立了自动化的流程,包括场景分割、字幕处理、数据评分与筛选等步骤,优化了数据集的质量和数量。

Open-Sora 的更新版本在模型稳定性、训练效率和功能扩展等方面都取得了显著进展,为用户提供了更加强大和多样化的视频生成能力。

项目入口:https://top.aibase.com/tool/open-sora

赞(2942)
未经允许不得转载:>以辞害意网 » Open-Sora开源项目更新:可生成长达16秒、720P高清视频