使用了级联框架进行分阶段生成,摒弃了之前系列中使用的 VQ-VAE 和 Transformer 结合的架构。
2条回答 默认 最新
- 好评笔记 2025-01-10 11:58关注
论文
介绍(Introduction)
背景与挑战
CogView3 的核心创新
主要贡献
背景(Background)
文本到图像扩散模型(Text-to-Image Diffusion Models)
中继扩散模型(Relay Diffusion Models)
扩散蒸馏(Diffusion Distillation)
方法(Method)
文本预处理(Text Preprocessing)
图像重新描述
提示扩展
模型介绍(Model Formulation)
模型框架
训练流程
中继超分辨率
潜在中继扩散
采样器公式
中继扩散的蒸馏
————————————————版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
原文链接:https://blog.csdn.net/haopinglianlian/article/details/145041340
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 1无用