2020.10.15读 Deep hough voting for 3D object detection in point clouds

介绍了一种名为Deep Hough Voting的3D目标检测方法,该方法直接处理点云数据,通过霍夫投票机制抑制噪声干扰。利用PointNet++网络生成种子点并进行投票,再通过投票聚类生成目标建议,最后进行分类。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Deep hough voting for 3D object detection in point clouds

1.背景信息

1.输入数据:点云
2.解决问题:3D目标检测(bounding box)
3.亮点
(1) 直接处理裸点云(深度点集网络)
(2) 采用霍夫投票,抑制噪声
通过将裸点云输入到PointNet++中,可以采样一个seed points的集合并且从他们的features中生成votes。这些votes are targeted to 到达对象中心, 最终,所有的投票都将聚集在3D目标的中心点附近

2.方法

在这里插入图片描述
在这里插入图片描述

2.1 霍夫投票

1.传统的霍夫投票用于2D图像上目标检测方法:
(1)建立image patches(or their features) 与 他们所在中心点之间的offsets对应关系,生成codebook
(2)在推理阶段,选择感兴趣的点,从codebook中找到对应的offsets,然后计算投票(投票指的是offset from seed point)
(3)目标boundary通过将votes聚类在一起生成的centorid返回到原来的位置来描绘。
2. 深度霍夫投票
提出几点有用的改进:
(1)兴趣点的描述和选择通过一个深度神经网络来生成。
(2)通过网络学习生成votes,而不再使用codebook。
(3)通过点云处理层进行投票集成。
(4)目标proposals包括:定位,维度,方向甚至语义分类标签,可以直接通过集成特征来生成。

2.2 VoteNet结构

整个网络分两个部分:(1)处理已经存在的点,生成votes(2)处理虚拟的点(votes)去propose和classify目标。
1. 在点云中学习vote
主要两步:
(1)通过backbone(PointNet++)网络学习点云特征和进行点云采样
输入N个点(XYZ 3维),输出M个seed点,维度是3+C(XYZ+C维特征向量)。每个seed点将会生成一个vote。
(2)从seed点中学习霍夫投票。
在这里插入图片描述
voting module: f i f_{i} fi–> d e l t a x i deltax_{i} deltaxi and d e l t a f i delta f_{i} deltafi
然后生成 y i = x i + d e l t a x i y_{i}=x_{i}+delta x_{i} yi=xi+deltaxi, g i = f i + d e l t a f i g_{i}=f_{i}+delta f_{i} gi=fi+deltafi,这就是生成的vote

2.从votes中生成目标proposal and classification
(1)通过采样和分组进行vote聚类
在这里插入图片描述
思路是朴素的,在votes集合中,通过FPS在 y i y_{i} yi这个3D欧几里得空间上选择K个vote聚类中心点
( y i y_{i} yi上FPS会把那些不是聚类中心的点也选进来吧,这样生成的proposal直觉上是有问题的,为什么不用meanshift之类的聚类方法确定K个点呢???)。 然后通过遍历所有的votes,每个点与第k个vote聚类中心点的距离小于一定阈值r,则被归为这个vote聚类中心点所在的group中。这样一共生成了K个vote聚类

(2)从votes聚类中proposal和classification
在这里插入图片描述
利用一个通用的点集学习网络 (shared PointNet) 集成投票然后生成目标proposals,相比于传统的直接溯源来确定目标boundary,这种学习的方法,作者说可以更好的处理点云中只有部分目标点(因为相机只能扫描一个物体的表面)的场景。
通过公式2, proposal p p p 是一个多维向量(objectness分数、bounding box参数、语义分类分数)
(3) Loss function
loss = objectness loss + bounding box estimation loss + semantic classification loss
监督 objectness scores for votes 要么是接近ground truth 目标中心点,要么是远离任何中心。 作者将这些从votes中生成的proposals看作是positive 和negative的proposals。
对于positive proposals,会根据最近的ground truth bounding box进一步监督bounding box estimation 和 class prediction

具体实验和实现细节略。

3.读后感

1. 这篇文章最重要的一个思想是Hough vote, 这种投票的方法越来越多的被应用到3D 图像处理中,因为它对噪声不敏感。
2. PointNet++ 是本文VoteNet的backbone, 本篇文章实际上可以看作是PointNet、PointNet++在3D目标检测方面的应用型文章。
3. 我理解的Offsets 与 votes 本质上思想是相似的, 利用相对信息而不是绝对信息是3D图像处理的主流。
4. FPS采样K个点作为聚簇中心,这个方法我觉得不是那么合理,可以采用Meanshift之类的聚类方法来确定聚簇中心。

### 回答1: Deep Hough投票是一种用于点云中3D物体检测的技术。它通过将点云中的点转换为球形坐标系,并使用Hough变换来检测物体的位置和方向。然后,使用深度学习模型对检测到的物体进行分类和定位。Deep Hough投票可以在点云中实现高效的3D物体检测,具有较高的准确性和鲁棒性。 ### 回答2: 深度霍夫投票算法是一种用于三维物体检测的深度学习算法,通过对点云数据进行处理,可以对三维场景中的物体进行检测和定位。该算法采用分层投票框架,可以通过处理多层信息来提高检测的准确性和鲁棒性。同时,深度霍夫投票算法还支持基于多个检测器进行联合训练,从而进一步提高检测效果。 在基于点云的三维物体检测领域中,传统的基于滑动窗口的方法往往需要大量的计算资源,并且受限于点云的分辨率和噪声的影响,易受到误差的影响。相比之下,深度霍夫投票算法利用深度神经网络的学习能力和点云数据自身的空间信息,能够更好地处理点云数据,提高检测精度和鲁棒性。 具体来说,深度霍夫投票算法主要采用以下步骤进行三维物体检测: 1. 首先,将点云数据分割成不同的体素(voxels),并对每个体素进行特征提取,得到每个体素的特征向量。 2. 接着,根据特征向量来训练深度神经网络,学习不同类别的物体模型。通过对网络进行多次迭代训练,可以提高模型的准确度。 3. 在测试阶段,利用学习到的模型对新的点云数据进行检测。首先,通过滑动窗口的方式生成候选框,并对每个候选框进行特征提取和分类。然后,通过分层投票的方式来评估每个候选框的得分,从而确定最终的物体检测结果。 总的来说,深度霍夫投票算法是一种高效、准确的三维物体检测算法,可以广泛应用于自动驾驶、机器人控制、航空航天等领域。未来,随着深度学习技术的进一步发展,该算法在三维物体检测领域将有更广泛的应用前景。 ### 回答3Deep Hough Voting(DHV)是一种基于3D点云的对象检测方法,它的主要思想是在点云中识别出物体的各种姿态和形状,并在一张基础投票图上对这些信息进行统计和融合,最终通过投票图得出物体的位置、姿态和边界框等信息。 DHV算法的核心是基于深度学习的特征提取和感知分组技术。在实际应用中,DHV需要对点云数据进行强化,以保证数据质量和精度,这些强化措施包括点云分割、采样增强和反向随机化等。DHV还利用了传统计算机视觉的Hough Voting思想,将点云中多个物体的姿态信息进行统计,并结合深度学习网络的输出进行融合,以得出最终的物体检测结果。 DHV方法具有很强的适应性和泛化性,可以广泛应用于各种不同场景和对象的检测和定位。在实际应用中,DHV可以有效提高3D点云数据的处理效率和准确性,尤其适用于无人驾驶车辆、机器人和虚拟现实等领域。DHV不仅可提高对象识别的速度和精度,而且可以减少传输和存储数据的量,这对于应用于大规模数据处理具有重要意义。 总之,DHV对于3D点云数据的物体检测和识别具有很强的技术实力和潜在应用前景,将会在计算机视觉和智能控制领域逐渐得到更广泛的应用和推广。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值