-
大幅度的合理运动:可灵采用3D时空联合注意力机制,能够生成较大幅度运动的视频内容,同时符合运动规律。
-
长达2分钟的视频生成:得益于高效的训练基础设施和优化,可灵大模型能够生成长达2分钟的视频,帧率达到30fps。
-
模拟物理世界特性:基于自研模型架构,可灵能够模拟真实世界的物理特性,生成符合物理规律的视频。
-
强大的概念组合能力:可灵能够将用户丰富的想象力转化为具体的画面,虚构真实世界中不会出现的场景。
-
电影级的画面生成:基于自研3D VAE,可灵能够生成1080p分辨率的电影级视频。
-
支持自由的输出视频宽高比:可灵采用了可变分辨率的训练策略,可以输出多种视频宽高比,满足不同场景的视频素材使用需求。