PredCNN: Predictive Learning with Cascade Convolutions

PredCNN是清华大学团队在IJCAI2018上提出的预测学习模型,针对视频预测问题,它结合CMU单元和类似WaveNet的网络结构,解决了传统RNN的梯度消失和CNN时间依赖性不足的问题。通过MU和RMU设计, PredCNN能够仅使用当前帧的前4帧预测下一帧,达到高效且准确的效果。论文中还介绍了两种网络结构,一种是Overlapping PredCNN,另一种是非重叠结构,但后者的具体设计原理未详述。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

PredCNN: Predictive Learning with Cascade Convolutions

1. 背景

这是一篇发表在IJCAI2018上的文章,同我们先前介绍的PredRNN一样都出自清华大学的同一团队。其所要解决的问题依旧是视频预测问题(或者说只要数据格式满足frames-like都行)。作者认为,传统的RNN模型在训练速度上慢,且由于传统RNN的连接方式(过长的时序依赖)导致多层RNN容易出现梯度消失问题;而CNN架构的模型也不能有效的捕捉到连续帧之间的时间依赖关系。基于这样的原因,作者提出了结合CMU单元的PredCNN网络结构。值得一提的是,作者在解决这类问题时并没有像其它解决方案一样通过对数据不同间隔的采样,来拟合数据的周期规律性;而仅仅是利用当前帧的前4帧作为输入,通过PredCNN网络来预测下一帧(也可以预测多帧),同时还达到了不错的效果,真可谓是意想不到。

在该论文中,作者通过对已有CNN单元的组合设计了新的CMU单元;同时还采用了类似WaveNet的网络连接方式。下面,首先来介绍一下构成整个网络所需要的基本单元。

1.1 MU 和 RMU

Multiplicative Unit (MU)和 Residual Multiplicative Block (

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值