CNN的感受野计算过程,以AlexNet为例
感受野概念
在卷积神经网络中,感受野(Receptive Field)的定义是卷积神经网络每一层输出的特征图(feature map)上每个像素点在原始图像上映射的区域大小,这里的原始图像是指网络的输入图像,是经过预处理(如resize,warp,crop)后的图像。
为什么要计算感受野?
因为感受野代表了深度学习网络每一层中的像素映射到输入图像的区域,感受野的大小直接影响网络层对于输入图像的特征感受级别,即每一层获得的特征(feature map)是全局的、语义层次比较高的,还是局部的、细节的特征。一般来说感受野小的时候,也就是CNN网络的头部层,其经过卷积和池化的次数较小,输出的feature map大小较大,反映的特征也更为精细和注重细节;而在CNN网络的尾部层,输入图像经过了大量的卷积和池化次数,feature map的尺寸大小降低的很小,感受野也变的很大,一个像素可以看到前部层的很大一个区域,因此这种feature map反映出来的特征更加注重整体和全