高层的feature map有更大的感受野,底层的feature map有更小的感受野,这不再赘述。
在高层的feature map每个像素当成一个anchors base,再根据原图压缩至feature map缩小的倍率进行反向倍化,就比如(0,0)倍化还是0,0,(2,2)倍化就是(2倍率,2倍率)坐标了。每个anchors base衍生出9(原论文是9,如果想预测小目标,可以设置更小的长宽)个长宽不等的anchorboxs。
其实每一批次的anchors base坐标点都一样(同一个featuremap),因为featuremap尺寸一样,原图又调整一样。
以下是筛选proposal给fast_rcnn
1)对众多的anchorboxs,进行筛选,筛选出符合要求的proposal。先根据score打分情况排序(就是1*1卷积后的tensor),再根据设定阈值pre_nms=2000,有的特征层生成的anchorsbox可能都不够阈值pre_nms,所以这一层就没筛掉。
2)nms非极大抑制(iou=0.5)proposal彼此之间排斥,再根据设定阈值pos_nms=2000
以下是筛选proposal训练RPN网络
rpn网络
最新推荐文章于 2022-07-26 15:38:49 发布