【OpenMMLab 实战营打卡-第4课】计算机视觉之目标检测算法基础

一、定义

目标检测是指给定一张图片,让计算机程序用矩形框框选出所有感兴趣的物体(定位),同时预测物体的类别(分类)。
在这里插入图片描述

1. 边界框

边界框是指紧密包裹感兴趣物体的矩形框。
在这里插入图片描述
在这里插入图片描述
交叉比定义为两个矩形框交集面积占并集面积指标之比,是矩形框重合程度的衡量指标。
在这里插入图片描述
置信度是指模型认可自身预测结果的程度。
在这里插入图片描述
非极大值抑制
在这里插入图片描述
边界框回归
在这里插入图片描述
边界框编码
在这里插入图片描述
混淆矩阵
在这里插入图片描述
召回率和准确率
在这里插入图片描述
PR曲线
在这里插入图片描述

二、发展
1. 滑动窗口

滑动窗口属于一种暴力搜索方法,优点是非常直观简单;缺点是当图片尺寸增大和类别增多时,搜索空间呈几何倍增长,对于目标检测算法来说具有不可接受的计算成本。
在这里插入图片描述
在这里插入图片描述

2. 特征图滑窗

用卷积一次性计算所有特征,再取出对应位置的特征进行分类,这样无论窗口个数多少,重叠区域都只需要计算一次卷积特征即可。
在这里插入图片描述
密集预测
在这里插入图片描述
目标检测分类
目标检测分为单阶段方法两阶段方法。其中,单阶段方法检测速度相对较快,精度相对较低;两阶段方法检测精度相对较高,检测速度相对较慢
在这里插入图片描述
单阶段目标检测算法
在这里插入图片描述
两阶段目标检测算法
在这里插入图片描述

目标检测算技术的更新迭代
在这里插入图片描述
在这里插入图片描述

a.YOLO

在这里插入图片描述

b.SSD

在这里插入图片描述

c.RetinaNet

在这里插入图片描述

d.FCOS

在这里插入图片描述

e. DETR

在这里插入图片描述
f. Deformable DETR
在这里插入图片描述

三、应用
1. 智慧城市

在智慧城市中目标检测的应用领域主要有:垃圾检测、道路检测、行人检测以及烟雾和火灾检测等。
在这里插入图片描述

2.自动驾驶

在自动驾驶中,目标检测主要应用于对车辆周围道路、车辆、行人以及环境等物体的检测,通过环境感知得到的数据用于指导车辆进行路径规划和运动控制。
在这里插入图片描述

3. 文字处理&姿态估计

目标检测在下游视觉任务中主要有文字识别姿态估计
在这里插入图片描述
目标检测和图像分类的区别:
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值