彭祥.-CSDN博客

原创 ultralytics框架进行RT-DETR目标检测训练

自DETR提出以来，其采用匈牙利匹配方式真正的实现了端到端检测效果，避免了NMS等后处理过程，同时，相较CNN的局部特征提取，其凭借着强大的全局特征提取能力，在目标检测领域可谓大杀四方，基于的目标检测方法因此层出不穷。然后，尽管DETR类目标检测方法具有较好的数据拟合能力，但本身的计算复杂度较高，这使其很难完成实时检测任务，而今天我们则要介绍的便是百度提出的实时DETR目标检测方法，这个方法我已经在先前的博客中有过介绍，当时是基于RT-DETR的源码进行介绍的，今天我们则要介绍的是中的RT-DETR模型。

2025-05-06 17:38:59 370

原创基于 PyQt 的YOLO目标检测可视化界面+ nuitka 打包

在人工智能和计算机视觉领域，是一种广泛使用的实时目标检测算法。为了直观地展示YOLO算法的检测效果，我们使用Pyqt框架进行检测结果的可视化，同时为了使其能够脱离Python环境，我们将模型文件转换为ONNX格式，并使用nuitka进行打包。

2025-05-04 20:59:10 419

原创 YOLO旋转目标检测之ONNX模型推理

YOLO旋转检测相较于目标检测而言，其只是最后的输出层网络发生了改变，一个最明显的区别便是：目标检测的检测框是xywh，而旋转检测则为xywha，其中，这个a代表angle，即旋转角度，其余的基本相同。

2025-05-02 22:30:42 429

原创 YOLO旋转检测模型简化

尽管从精度角度来看，其检测效果下降了许多（大概30%），但其模型大小也由原本的32MB下降到了700KB，这等程度的模型体积下降幅度还是深得我心的，毕竟我的这个项目场景对精度的要求并没有很高。YOLO模型作为单阶段目标检测方法的代表，其已经应用在多个领域。

2025-04-27 16:48:30 244

原创 YOLO目标检测之模型剪枝

剪枝（Pruning）是一种模型压缩技术，旨在通过移除神经网络中不重要的权重或神经元来减少模型的大小和计算复杂度，同时尽量保持模型的性能。

2025-04-27 11:28:44 564

原创 YOLO检测目标后实现距离测量

相较而言，单目测距依赖与经验值，而深度估计测距则依赖模型性能，综上双目测距的方式无论是在速度方面还是精度方面都能有较好的表现。

2025-04-12 16:45:11 535 1

原创 YOLO系列模型格式转换为 tf-lite 与模型量化

在YOLO中，使用的是YOLO自己的数据格式，因此我们需要将其进行转换，并将其进行训练，这里我就不再赘述了。综上，由于我们需要将这个模型部署在安卓端等算力不足的边缘设备上，所以tf-lite变成了我们的首选。然而，不幸的是，量化后的int8模型精度很差，无法满足我们的需求，我们也就只能选择。格式，这里就来到了我们进入的重点，我们要实现将 .pt 格式的模型文件转换为。框架中，已经帮我们封装好了相关方法，我们只需要配置好环境，就可以了。这里我们需要注意的是，转换代码中，需要我们手动下载安装。

2025-04-10 16:57:41 742

原创《基于 Cloth Simulation 的机载 LiDAR 滤波方法》集成到点云标注工具做地面标注

而基于 Cloth Simulation 的机载 LiDAR 滤波方法便可以较好的识别地面信息，从而帮助我们节省很多成本。在我们标注点云时，因为地面和植被紧贴在一起，因此我们地面很难进行较为精细的标注（当然很多情况下地面我们都会忽略）至此，完成地面提取。接下来便是进行地面滤波处理完成的后续操作，根据地面类别的颜色进行赋值，完成点云地面标注。原理我们在此不去深究，我们主要看起如何应用到我们的点云标注工具中。实现代码如下，这里我们选用。可以看到，其提取效果不错。

2024-10-24 18:07:05 346

原创点云标注工具开发记录（五）之点云文件加载、视角转换

在Open3D中，通过read方法，我们可以读取不同格式的点云数据，那么，在不使用Open3D。

2024-10-24 17:00:04 656

原创点云标注工具开发记录（四）之点云根据类别展示与加速渲染

先前我们使用的是Open3D进行点云加载与展示，但由于Open3D更侧重于点云处理，其缺少一些相关的GUI控件，因此采用PyQt进行开发，同时使用OpenGL进行3D渲染，那么具体要如何实现呢？

2024-10-23 17:59:03 660

原创点云标注工具开发记录（三）之框选点云与渲染颜色

参照open3d中的交互式点云可视化，我们可以理解其是如何进行框选点云的。可以看到，要想进行点云框选，首先要锁定视角，随后便可以在上面进行选择了。

2024-10-23 14:47:21 508

原创 Open3d开发点云标注工具问题总结（二）

似乎，这样的逻辑并没有什么问题，但将3D点云向2D屏幕投影，他的坐标是固定的，也就是说，每个点云的点在加载后，其往屏幕的投影就是确定的，那么，在我们框选过程中，当点云经过旋转、平移、缩放等操作后，他的投影依旧不会变化，这就导致其根本不能实现框选操作。

2024-10-18 16:25:04 413

原创使用 Open3D 实现 las 格式点云文件读取

事实上，las文件中不但包含了点云的坐标、颜色等特征，还具有需要其他特征，如类别。格式是一种为激光雷达点云数据的交换和存档而设计的文件格式，是一种被。来实现读取，随后将读取的点云文件进行转换，即提取出。格式被广泛使用并被视为激光雷达数据的行业标准。坐标以及颜色等属性特征，最后进行可视化即可。格式文件读取的接口，但我们可以借用。而在Open3D中，并没有专门用于。首先是取las点坐标时是小写的。指定的开放二进制格式。，如果写成大写，会发现。可以直接读取点云坐标。中并未提供小写选项。

2024-10-15 10:23:47 802

原创利用Open3D GUI开发一款点云标注工具问题总结（一）

工作需求：利用Open3D开发一款用于点云标注的工具，即按照点云类别赋予不同颜色实现效果如下：通过点击颜色面板的不同颜色可以进行颜色切换，在我们选择两个点后，点击Create Box可以创建一个轴对称框体，从而将该框体内的点云设置为对应颜色，点击Save后则可以保存结果。需求并不复杂，但对于我这个半路出家的门外汉而言，还是有些难度的，这篇博文主要记录一下实现思路与在设计过程中遇到的问题。

2024-10-14 18:01:47 1020

原创 PointNet++训练自定义数据集

我们已经学习了PointNet++的网络结构，以及在S3Dis数据集上的训练、测试以及可视化等操作，那么如何使用该模型来训练我们自己的数据集呢，其实，操作十分简单，只需要修改几个参数即可。

2024-10-09 14:19:49 2049 8

原创 PointNet++网络详解

其中，对于points，16是batch-size，4096是点云数量（我们在前一篇博客中说过，为了使输出的值统一，我们的输入值的数量也要统一，这里设置一个batch中输入的点云数量为4096，9则是其点云维度。组合点云和类别，在先前为方便运算，将场景中的点云进行了切分，每个batch含有4096个，在完成对4096个点的分类后，将其组合起来，即恢复为原来的场景。下面的代码是训练的核心部分，即完成加载数据集，将数据送入模型，计算损失，反向传播等功能，其中我们着重看一下数据在模型中是如何变化的。

2024-10-08 17:22:11 2508

原创基于深度学习的点云处理模型PointNet++学习记录

根据其论文中给出的介绍，Point++是用于点云分割与分类的深度学习模型，由下图可知，该模型主要分为三部分，分别是点空间特征提取、分割模型以及分类模块。其中，由一系列点集抽象层（）组成，而每一个。：Sampling layer的作用是从点云中选择很多个质点和围绕在这些质点的局部区域。作为输入，通过使用FPS算法（，最远点采样法）选出一系列点作为质点，与随机选取相比，这样可以更好的覆盖整个点集空间。

2024-09-30 15:52:11 2811 1

原创点云与Open3D入门

点云与三维图像的关系深度图（以灰度表达物体与相机的距离），几何模型（由CAD软件建立），点云模型（所有逆向工程设备都将物体采样成点云）。和二维图像相比，三维图像借助第三个维度的信息，可以实现天然的物体——背景解耦。点云数据是最为常见也是最基础的三维模型。点云模型往往由测量直接得到，每个点对应一个测量点，未经过其他处理手段，故包含了最大的信息量。这些信息隐藏在点云中需要以其他提取手段将其萃取出来，提取点云中信息的过程则为三维图像处理。点云是某个坐标系下的点的数据集。

2024-09-24 18:47:39 1296 1

原创大模型学习记录之Agent部署

首先，需要明确大模型的概念，通过百度的文心一言的结果，我们得到如下概念：大模型（Large Models）在人工智能和机器学习领域，特别是深度学习领域，指的是那些具有大量参数、复杂结构和高度计算需求的模型。这些模型通常需要在大规模数据集上进行长时间的训练，以捕捉数据中的复杂模式和关系。大模型的出现和发展，主要得益于计算能力的提升、算法的优化以及大规模数据集的可用性。大模型的特点可以概括为以下几个方面：大模型的发展也带来了一些挑战和争议。一方面，大模型需要消耗大量的计算资源和时间成本，这限制了其在实际应用中

2024-09-19 09:11:29 1556

原创 ChatGLM-6B部署到本地电脑

ChatGLM-6B是由清华大学开源的双语对话大模型，该模型有62亿参数，但在经过量化后模型体积大幅下降，因此不同于其他需要部署到服务器上的大模型，该模型可以部署到本地电脑，那么接下来我们来看看如何部署该模型。此时可以先将模型下载到本地，然后从本地加载，当然此时我们需要修改一下对应的地址。随便提一个问题，说起来确实一套一套的，好像谁不知道似的，说点干活嘛。之后，我们将人类语言转化为了机器语言，接下来就可以输入模型了。然后从这里手动下载模型参数文件，并将下载的文件替换到本地的。

2024-09-17 21:58:27 1640

原创 ultralytics实现DeepSort之级联匹配

DeepSort算法引入的特征提取模块，并在匹配时首先使用特征作为匹配指标，因此，这使得DeepSort算法能够在目标遮挡后再次出现时能够重新匹配成功（ReID），当然这也意味着其速度上较不使用特征提取方法的跟踪算法，（如ByteTrack)速度慢了一些。

2024-09-12 18:09:20 4711

原创 ultralytics实现DeepSort目标追踪算法之特征提取网络

我们看下这个网络具体是如何实现的，其实这里我们并不需要了解其具体结构，只需要知道其输入输出即可，根据 x = torch.randn(4,3,128,64)可知，其传入的数据即为图像，即（batch-size，通道数，宽，高）的格式，而根据最后连接的分类头nn.Linear(256, num_classes)，可知，其最终输出的结果必与类别数有关。事实上最终的结果为（batch-size，751）即该图像中目标的类别。

2024-09-07 00:07:24 6374 1

原创 ultralytics框架实现ByteTrack目标追踪算法

在框架中，提供了两种用于目标追踪的算法，分别是ByteTrack算法与Botsort算法，这两种算法都是在Sort算法的基础上改进的，今天，我们学习一下ByteTrack算法。

2024-09-04 23:22:10 8103 1

原创 RT-DETR+Sort 实现目标跟踪

等后处理过程，但它依旧需要对结果进行筛选，这里直接通过对置信度进行筛选即可。算法是用来做跟踪的，在这个算法中的追踪器是卡尔曼滤波追踪器。类目标检测算法作为一种端到端的目标检测方法，并不需要。算法实现目标跟踪，在今天这篇博客中，博主将利用。获得的检测结果如下，分别是预测类别，检测框的。算法相结合，从而实现目标跟踪。在前一篇博客中，博主介绍了利用。算法，我们缕清一个思路即可，即。

2024-09-01 13:23:24 6983

原创 YOLO+Sort实现目标追踪

在前面的目标检测、实例分割的学习中，我们多是对单张图像进行处理，而事实上在我们的实际应用中多数需要对视频进行操作，当然这个操作也是讲视频转换为一帧帧的图像，但博主发现在这个算法平台中，针对视频的处理多调用track方法，即跟踪算法，比如在车辆测速、车辆测距等应用中，那么跟踪算法到底是如何实现的呢，这便是我们今天要学习的内容。

2024-08-25 00:19:17 8430 1

原创 ultralytics实例分割mask读取

在前面学习YOLOv8时，博主对如何将坐标点转换为mask特征图较为疑惑，因此自己尝试一下。

2024-08-20 19:51:25 6160

原创 CV党福音：YOLOv8实现实例分割（三）之损失函数

本章梳理了预测结果与真值的损失计算过程，可以加深我们对模型训练的理解。

2024-08-17 13:25:15 7308

原创利用YOLOv8实例分割实现图像抠图

实例分割可以提取出图像出目标的轮廓，因此我们可以用于图像抠图。

2024-08-16 13:28:49 5709

原创 CV党福音：YOLOv8实现实例分割（二）之训练过程

在上一篇博客中，我们已经了解了实例分割的基本流程，本章则是对数据集、以及训练过程等进行进一步的学习。在本次训练中，博主使用的是这个小数据集进行实验，该数据集内只有张图像：我们以第一张图像为例，其标签标注如下：按行划分目标，第一个数字为目标类别，后面每两个数值为一个坐标（即标注的关键点的坐标）第一张图像的检测与分割结果如下：与语义分割不同，实例分割一般是首先使用目标检测算法找到图像中的不同实例对象，然后对每个实例对象进行语义分割。在YOLOv8中则是在原本检测头的基础上增加了分割头，两者共同作用。总的来

2024-08-16 13:25:15 1712

原创 CV党福音：YOLOv8实现实例分割（一）之模型结构与预测

前面我们得知YOLOv8不但可以实现目标检测任务，还包揽了分类、分割、姿态估计等计算机视觉任务。在上一篇博文中，博主已经介绍了YOLOv8如何实现分类，在这篇博文里，博主将介绍其如何将语义分割给收入囊中。

2024-08-10 15:25:54 7290 2

原创 CV党福音：YOLOv8实现分类

YOLO作为目标检测领域的常青树，如今以及更新到了YOLOv10，并且还有YOLOXYOLOS等变体，可以说该系列已经在目标检测领域占据了半壁江山，如今，YOLOv8的发行者竟有一统江山之意，其在提出的框架中不但集成了v3到v10的YOLO目标检测模型，还包揽了分类，语义分割、目标追踪和姿态估计等计算机视觉任务。那么，今天我们就来看看YOLOv8是如何将这些计算机视觉任务融合在一起吧其实从思路上很简单，YOLOv8继续沿用了YOLO的基本架构，即将整个模型分为特征提取骨干网络（Backbone。

2024-08-07 21:02:23 2776

原创 YOLOv8由pt文件中读取模型信息

Pytorch的pt模型文件中保存了许多模型信息，如模型结构、模型参数、任务类型、批次、数据集等在先前的YOLOv8实验中，博主发现YOLOv8在预测时并不需要指定任务类型，因为这些信息便保存在pt模型中，那么，今天我们便来看看，其到底是如何加载这些参数的。我们首先对pt。

2024-08-05 12:35:52 2964

原创 YOLOv8目标检测算法改进之融合SCconv的特征提取方法

经过上述过程，我们便将SCconv模块插入到了YOLOv8模型中，当然这个改进是十分简单的，我们可以对SCconv模块再进行改进，让其更加的适配YOLOv8检测模型，同时我们需要记住的是，写一篇论文不但要求你的创新点要新颖，如何去描述你的创新更是重中之重，正所谓做的好不如说的好（博主还是希望能够既做的好，又说得好）。

2024-08-02 15:52:40 3467 3

原创可视化目标检测算法推理部署（三）YOLOv8模型视频推理

至此，模型的视频推理过程便完成了，但我们在UI界面上却发现，上传的视频是没有画面的，同时，返回的视频虽然成果保存，但其在界面上却显示为NaN其实，对于学习YOLO模型推理的过程而言，这已无伤大雅，但博主还有那么一点完美主义精神的，看看能否解决呢？经过查询相关资料，发现这是由于OpenCV合成视频操作造成的，解决方式是使用moviepy，具体如何做呢？

2024-07-31 10:56:09 1203

原创可视化目标检测算法推理部署（二）YOLOv8模型图像推理

在先前的RT-DETR中，博主使用ONNX模型文件进行了视频、图像的推理，在本章节，博主打算使用YOLOv8模型进行推理，因此，我们除了需要获取YOLOv8的ONNX模型文件外，还需要进行一些额外的操作，如NMS。

2024-07-30 16:08:42 1323 2

原创可视化目标检测算法推理部署（一）Gradio的UI设计

自定制组件：Blocks构建应用相比Interface，Blocks提供了一个低级别的API，用于设计具有更灵活布局和数据流的网络应用。Blocks允许控制组件在页面上出现的位置，处理复杂的数据流（例如，输出可以作为其他函数的输入），并根据用户交互更新组件的属性可见性。#设置输入组件# 设置输出组件#设置按钮#设置按钮点击事件首先，注意子句。Blocks应用程序代码将包含在这个子句中。接下来是组件。这些是用于Interface的相同组件。然而，组件不是传递给某个构造函数，而是在with。

2024-07-29 17:28:18 1557

原创图片去除水彩笔标注

可以看到，其效果不太号，依旧有阴影出现（当然也是因为我PS技术太烂了，一点一点P我属实没有耐心）效果如下，我们可以看到，效果还是不错的，我们只需要调整合适阈值即可。但这个方法实现起来比较慢。

2024-07-25 16:31:40 653

原创 RT-DETR 目标检测视频推理

事实上，进行视频推理的过程与单张图片的过程及其类似，就是将原本的视频切分为多帧图像后再进行推理即可。这里面涉及到Image等相关操作，今天便借此机会梳理一遍。先前介绍了RT-DETR推理单张图像的案例，今天则介绍以下如何利用RT-DETR来进行视频推理。根据结果获取目标类别，标注框与得分，并将其绘制在每张图像上。可以看到，其在视频推理过程中，对CPU的利用率明显增高。视频合成，指定合成视频的名称，帧率等信息，将。利用cv2生成视频读取器，读取视频。是否可用，同时进行前向推理，并计算。

2024-07-17 10:55:25 1036 2

原创 RT-DETR+Flask实现目标检测推理案例

今天，带大家利用RT-DETR（我们可以换成任意一个模型）+Flask来实现一个目标检测平台小案例，其实现效果如下：目标检测案例这个案例很简单，就是让我们上传一张图像，随后选择一下置信度，即可检测出图像中的目标，那么具体该如何实现呢？

2024-07-15 17:25:43 905

原创 RT-DETR详解之 Decoder 层

在上一篇博客中，博主已经讲解了如何利用选择出好的特征，接下来便要将这些特征输入到Decoder中进行解码，需要注意的是，在RT-DETR的Encoder中，使用的是标准的自注意力计算方法，而在其Decoder中，则使用的是可变形自注意力（deformable attention)，可变形自注意力能够大幅的降低计算量，同时该部分还使用到了CUDA算子，能够加快运行速度，当然，这个可变形自注意力计算并非是RT-DETR的创新点，但其作用却是极大，在DINO，DN-Deformable-DETR中都有使用。

2024-06-11 23:37:42 3500 3

LSTM及其衍生网络代码

主要是通过keras实现了LSTM实验，以及在此基础上分别加入注意力机制，CNN网络，以及使用seq2seq网络模型等完成的时间序列预测实验

2023-02-13

PHP简单个人博客源码

PHP简单个人博客源码，只有博客列表与添加博客功能

2021-09-05

ehart地图数据显示

ehart中国地图数据显示

2021-09-02

手机版旅游网站前端页面

手机版旅游网站前端HTML页面，仅前端

2021-08-19

SSM音乐视频网站.zip

基础框架：SSM SpringMVC+Spring+Mybatis 前端框架：Bootstrap 数据库：MySQL 5.7 开发软件及环境：eclipse JDK 1.8 Tomcat 8.0 项目介绍：https://blog.csdn.net/pengxiang1998/article/details/119530119 下载前可加我qq：2186527424咨询

2021-08-10