详细介绍Stability AI的视频生成模型SVD(Stable Video Diffusion)模型,这家公司在图像生成领域富有盛名,开发并维护了知名开源项目SD系列图像生成模型。SVD是他们在视频生成领域的尝试,主要贡献是:系统的视频数据整理工作流程,支持文本到视频、图像到视频生成和3D合成(物体从单一视角到多视角的转化)。
3条回答 默认 最新
- 好评笔记 2025-01-21 20:03关注
论文
摘要
引言
现状
本文研究
研究结果
总结
研究背景
潜在视频扩散模型
数据整理
为高质量视频合成整理数据
数据处理与标注
数据集及其处理
字幕合成
其他处理
阶段I:图像预训练
阶段II:整理视频预训练数据集
视频数据整理的系统方法
整理后的训练数据提升性能
数据整理在大规模数据集上的作用
阶段III:高质量微调
大规模训练视频模型
预训练基础模型
高分辨率文本到视频模型
高分辨率图像到视频模型
相机运动LoRA
帧插值
多视图生成
结论
————————————————版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
原文链接:https://blog.csdn.net/haopinglianlian/article/details/145272026
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 1无用