一、定义
目标检测是指给定一张图片,让计算机程序用矩形框框选出所有感兴趣的物体(定位),同时预测物体的类别(分类)。
1. 边界框
边界框是指紧密包裹感兴趣物体的矩形框。
交叉比定义为两个矩形框交集面积占并集面积指标之比,是矩形框重合程度的衡量指标。
置信度是指模型认可自身预测结果的程度。
非极大值抑制
边界框回归
边界框编码
混淆矩阵
召回率和准确率
PR曲线
二、发展
1. 滑动窗口
滑动窗口属于一种暴力搜索方法,优点是非常直观简单;缺点是当图片尺寸增大和类别增多时,搜索空间呈几何倍增长,对于目标检测算法来说具有不可接受的计算成本。
2. 特征图滑窗
用卷积一次性计算所有特征,再取出对应位置的特征进行分类,这样无论窗口个数多少,重叠区域都只需要计算一次卷积特征即可。
密集预测
目标检测分类
目标检测分为单阶段方法和两阶段方法。其中,单阶段方法检测速度相对较快,精度相对较低;两阶段方法检测精度相对较高,检测速度相对较慢。
单阶段目标检测算法
两阶段目标检测算法
目标检测算技术的更新迭代
a.YOLO
b.SSD
c.RetinaNet
d.FCOS
e. DETR
f. Deformable DETR
三、应用
1. 智慧城市
在智慧城市中目标检测的应用领域主要有:垃圾检测、道路检测、行人检测以及烟雾和火灾检测等。
2.自动驾驶
在自动驾驶中,目标检测主要应用于对车辆周围道路、车辆、行人以及环境等物体的检测,通过环境感知得到的数据用于指导车辆进行路径规划和运动控制。
3. 文字处理&姿态估计
目标检测在下游视觉任务中主要有文字识别和姿态估计。
目标检测和图像分类的区别: