RPN层是Faster-RCNN网络的特有层,全称为:区域生成网络(Region Proposal Networks),用来提取供后边检测的区域。它替代了Fast-RCNN的selective search,大大提高提取区域框的速度和精度。
Faster-RCNN网络结构图如下(图片仍然来源于 https://www.cnblogs.com/zyly/p/9247863.html)
图1
RPN
1、RPN之前的特征提取
采用预训练模型来做特征提取,常用到VGG16(512-d)或ZF(256-d)模型,这部分不作为重点。经过特征提取,得到带特征点的feature map
2、RPN
假设输入图片大小为MxN,特征提取用ZF模型,那么得到的feature map为MxNx256,可以看作一共有MxN个点的位置,每个位置都是256维
(1)anchor
每个位置都生成大小不同的k个框,原文中k=9(三种尺寸128,256,512,和三种比例1:1,1:2,2:1,组合起来一共9种),如图2所示。