近日DeepMind发布VQ-VAE-2算法,也就是之前VQ-VAE算法2代,这个算法从感观效果上来看比生成对抗神经网络(GAN)的来得更加真实,堪称AI换脸界的大杀器,如果我不说可能相信读者也很难想象到下面这几幅人脸图像都是AI自动生成出来的。
不过如此重要的论文,笔者还没看到专业性很强的解读,那么笔者就将VQ-VAE-2算法分为VQ,VAE,VQVAE2三部分来介绍原理,权当抛砖引玉。
什么是VQ
VQ是vector quantisationk(一般译作矢量量化)的缩写,他的主要思想是通过k-means算法进行聚类,将相近的点全部近似点簇的重心,从而在不损失太多信息的情况下对输入进行压缩。
k-means聚类算法:我在之前博客《终于把软微BING搜索-SPTAG算法的原理搞清了》https://blog.csdn.net/BEYONDMA/article/details/90578111也曾经介绍过