慕尼黑大学携手 NVIDIA 等共同推出视频生成模型 Video LDMs。NVIDIA 在 AI 领域的卓越成就家喻户晓,而慕尼黑大学同样不容小觑,他们深度参与了最初 SD 系列图像生成模型的研发,在扩散模型领域,展现出了强劲实力 。
4条回答 默认 最新
- 好评笔记 2025-01-22 21:55关注
论文
摘要引言
贡献背景
扩散模型(DMs)
潜在扩散模型(LDMs)潜在视频扩散模型
1 将潜在图像转变为视频生成器
1.1 时间自动编码器微调
2 长视频生成的预测模型
3 高帧率的时间插值
4 超分辨率模型的时间微调
总结实验
数据集
评估指标
模型架构和采样1 高分辨率驾驶视频合成
1.1 消融研究
1.2 驾驶场景模拟
2 使用稳定扩散的文本到视频
2.1 使用DreamBooth的个性化文本到视频
结论
论文
论文地址:https://arxiv.org/pdf/2304.08818
项目地址:https://research.nvidia.com/labs/toronto-ai/VideoLDM/
————————————————版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
原文链接:https://blog.csdn.net/haopinglianlian/article/details/145298396
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 1无用