慕尼黑大学、NVIDIA等的Video LDMs模型是什么？

慕尼黑大学携手 NVIDIA 等共同推出视频生成模型 Video LDMs。NVIDIA 在 AI 领域的卓越成就家喻户晓，而慕尼黑大学同样不容小觑，他们深度参与了最初 SD 系列图像生成模型的研发，在扩散模型领域，展现出了强劲实力。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
好评笔记 2025-01-22 21:55
关注
论文
摘要

引言
贡献

背景
扩散模型（DMs）
潜在扩散模型（LDMs）

潜在视频扩散模型

1 将潜在图像转变为视频生成器

1.1 时间自动编码器微调

2 长视频生成的预测模型

3 高帧率的时间插值

4 超分辨率模型的时间微调
总结

实验
数据集
评估指标
模型架构和采样

1 高分辨率驾驶视频合成

1.1 消融研究

1.2 驾驶场景模拟

2 使用稳定扩散的文本到视频

2.1 使用DreamBooth的个性化文本到视频

结论
论文
论文地址：https://arxiv.org/pdf/2304.08818
项目地址：https://research.nvidia.com/labs/toronto-ai/VideoLDM/
————————————————

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

原文链接：https://blog.csdn.net/haopinglianlian/article/details/145298396
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

AIGC视频生成模型：慕尼黑大学、NVIDIA等的Video LDMs模型
2025-01-22 10:28

好评笔记的博客本文详细介绍慕尼黑大学携手 NVIDIA 等共同推出视频生成模型 Video LDMs。NVIDIA 在 AI 领域的卓越成就家喻户晓，而慕尼黑大学同样不容小觑，他们深度参与了最初 SD 系列图像生成模型的研发，在扩散模型领域，展现出...
Latent Diffusion Models (LDMs) 模型学习笔记
2024-07-04 14:13

爱吃兔子的胡萝卜RR的博客通过逐渐对正态分布变量进行去噪来学习数据分布p(x)，即学习长度为T的固定马尔可夫链的逆过程：其中t是从(1,2,…,T)中均匀采样得到的，模型可以解释为去噪自动编码器的权重相等的序列(通常以U-Net形式实现），经过...
AIGC视频生成模型：Stability AI的SVD(Stable Video Diffusion)模型
2025-05-12 11:14

好评笔记的博客本文详细介绍Stability AI的视频生成模型SVD(Stable Video Diffusion)模型，这家公司在图像生成领域富有盛名，开发并维护了知名开源项目SD系列图像生成模型。SVD是他们在视频生成领域的尝试，主要贡献是：系统的视频...
扩散模型经典问题：在Image-to-Image或Image-to-Video任务中，如何尽可能地保持住原始输入Image的特征？
2024-12-23 20:45

沉迷单车的追风少年的博客在Image-to-Image或Image-to-Video任务中，如何尽可能地保持住原始输入Image的特征？你知道有哪些经典方法？这些方法各有什么优缺点？
【大模型论文】大模型如何做音乐？最新89页《音乐基础模型》综述
2024-08-28 14:01

大语言模型的博客本文为音乐领域的人机协作未来的挑战和趋势提供了见解，旨在塑造该领域的发展方向。关键词——自监督学习、基础模型、音乐信息检索、音乐指令跟随、音乐生成。
(CVPR-2022)利用潜在扩散模型进行高分辨率图像合成
2024-07-11 09:45

顾道长生'的博客通过将图像形成过程分解为去噪自编码器的顺序应用，扩散模型（DMs）在图像数据及其它领域实现了最先进的合成结果。此外，它们的公式化允许引入一个引导机制来控制图像生成过程，而无需重新训练。然而，由于这些模型...
AI绘画——从扩散模型到创意无限
2024-09-09 23:15

FLY AGAIN的博客如果在两年前我说这些图片是AI生成的，你或许会说我痴人说梦话，但经过了2023年AI绘画热潮后，大量精致而逼真的AI绘画在互联网上铺天盖地。AI绘画技术的快速发展，使得生成的图像质量大幅提升，很多作品已经达到了...
各种文字生成图片的AIGC模型（openAI、谷歌、stable、Midjourney等）
2023-04-14 23:25

AI强仔的博客 ERNIE-ViLG , DALL-E ,Cogview , Make-A-Scene , and Parti 、LDM , DALL-E 2 , Imagen等
ChatGPT is not all you need，一文看尽SOTA生成式AI模型：6大公司9大类别21个模型全回顾（一）
2023-02-15 19:59

快乐小码农的博客 A State of the Art Review of large Generative AI models》，将生成式模型按照任务模态、领域分成9大类，并总结了2022年发布的21个生成式模型的能力和局限性。这些局限性包括缺少特定任务下的大型数据集，以及...
(Arxiv-2024)将扩散模型蒸馏为条件 GANs
2024-07-29 10:07

顾道长生'的博客我们提出了一种方法，将复杂的多步扩散模型蒸馏为单步条件 GAN 学生模型，从而显著加快推理速度，同时保持图像质量。我们的方法将扩散蒸馏解释为成对的图像到图像转换任务，使用扩散模型 ODE 轨迹的噪声到图像对。...
每日AIGC最新进展(63)：华为提出扩散模型中ODE方程加速方法、Meta提出提升LDM生成质量方法、清华大学提出Flow-Based模型加速方法
2024-10-30 08:00

沉迷单车的追风少年的博客在这项研究中，我们提出了一种新颖且有效的方法，通过利用自适应条件来降低扩散模型中常微分方程（ODE）轨迹的曲率，从而提高生成高质量图像的能力。传统的扩散模型由于其复杂的ODE轨迹，往往面临在少量函数评估...
每日AIGC最新进展(33)：小米提出单步扩散模型SDXS、阿米蒂大学提出加速SD的统一模块LCM-LORA、国立台湾大学提出生成QR二维码的扩散模型
2024-06-20 08:30

沉迷单车的追风少年的博客本文介绍了一种名为SDXS的新型实时一步潜在扩散模型，旨在解决现有扩散模型在图像生成方面的高延迟问题。扩散模型虽然在图像生成性能上表现出色，但其复杂的架构和大量的计算需求导致了显著的延迟。为了降低模型的...
(ICCV-2023)使用 Transformer 的可扩展扩散模型
2024-08-08 16:51

顾道长生'的博客我们探索了一种基于transformer架构的新类扩散模型。我们训练图像的潜在扩散模型，将常用的UUU-Net主干替换为在潜在patch上操作的transformer。我们通过Gflops衡量的前向传递复杂性分析了我们的扩散transformer...
一文搞懂扩散原理，AI图片是如何生成的
2025-03-27 20:23

AI科技论谈的博客 AI 图像生成的核心 —— 扩散模型全解读。
爆火的Sora背后是什么？有哪些应用？首篇Sora综述来了！
2024-03-09 00:02

3Ｄ视觉工坊的博客 Sora是一种文本到视频生成的人工智能模型，由OpenAI于2024年2月发布。该模型经过训练，能够从文本指令中生成逼真或想象的场景视频，并显示出在模拟物理世界方面的潜力。基于公开的技术报告和逆向工程，本文对该模型...
深入浅出理解 AI 生图模型
2024-03-17 07:06

CX330的烟花的博客这个中间产物会经过Image Decoder（图片解码器）的处理...随着人工智能技术的不断进步，像Stable Diffusion这样的AI绘画将会更加智能化，能够更好地模仿人类艺术家的风格和技巧，使非艺术家也能创作出优秀的绘画作品。
AI之MLM：《MM-LLMs: Recent Advances in MultiModal Large Language Models多模态大语言模型的最新进展》翻译与解读
2024-01-27 00:18

一个处女座的程序猿的博客 AI之MLM：《MM-LLMs: Recent Advances in MultiModal Large Language Models多模态大语言模型的最新进展》翻译与解读目录《MM-LLMs: Recent Advances in MultiModal Large Language Models》翻译与解读 ...
解析不同种类的StableDiffusion模型Models，再也不用担心该用什么了
2023-03-30 00:03

暂时先用这个名字的博客 Stable Diffusion是一个基于Latent Diffusion Models（潜在扩散模型，LDMs）的文图生成（text-to-image）模型。具体来说，Stable Diffusion在 LAION-5B 的一个子集上训练了一个Latent Diffusion Models，该模型专门...
主流 AI 系列模型大梳理（一）：技术、性能、特色与应用对比
2025-02-09 02:26

进一步有进一步的欢喜的博客在人工智能飞速发展的时代，各种模型不断涌现，推动着技术的进步和应用的拓展。从语言模型到图像生成模型，不同类型的模型在各自领域发挥着关键作用。接下来，让我们一同深入了解当下备受瞩目的几大模型系列。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 2月2日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月22日

慕尼黑大学、NVIDIA等的Video LDMs模型是什么？

4条回答 默认 最新

问题事件

4条回答默认最新