发布时间:2024-07-04 05:29:04 来源:以辞害意网 作者:资讯
快科技4月28日消息,国际在2024中关村论坛年会未来人工智能先锋论坛上,水平生数科技联合清华大学发布中国首个长时长、产自高一致性、研视高动态性视频大模型Vidu。模型
这也是发布自Sora发布之后全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平,国际还在加速迭代提升中。水平
据了解,产自该模型采用团队原创的研视Diffusion与Transformer融合的架构U-ViT,支持一键生成长达16秒、模型分辨率高达1080P的发布高清视频内容。
除了在时长方面突破,国际Vidu在视频效果方面也实现了显著提升,水平主要包括:
能够生成细节复杂的产自场景,且符合真实的物理规律;
能够生成真实世界不存在的虚构画面,创造出具有深度和复杂性的超现实主义内容;
能够生成复杂的动态镜头,不再局限于简单的推、拉、移等固定镜头,而是能够围绕统一主体在一段画面里就实现远景、近景、中景、特写等不同镜头的切换;
在16秒的时长上保持连贯流畅,随着镜头的移动,人物和场景在时间、空间中能够保持一致;
能够生成特有的中国元素,例如熊猫、龙等。
相关文章