- 博客(13)
- 收藏
- 关注
原创 高压电绝缘子破损目标检测数据集简介与应用
本数据集主要面向高压电力线路中的绝缘子组件,特别关注破损绝缘子的自动识别问题。数据集中包含了各种场景下(如晴天、阴天、远距离、近距离、不同角度)的绝缘子图像,具备较强的泛化能力。数据主要来源于无人机巡检的图片,图片数量一共2400张,标签格式分别有:YOLO格式、VOC格式和JSON格式。
2025-06-02 21:54:15
838
原创 水果目标检测数据集介绍(7类,1316张)
在计算机视觉领域,水果识别与检测任务广泛应用于农业自动化、智能采摘、分拣系统以及食品工业中的质量检测。为支持目标检测算法在水果识别领域的研究与应用,我们构建并发布了一个高质量的,涵盖多种常见水果品类,并提供多种主流标注格式,便于快速上手训练主流模型如 YOLO系列、Faster R-CNN、SSD 等。
2025-06-02 18:14:30
363
原创 花卉目标检测数据集介绍(共 12 类,10490 张图像)
在计算机视觉与智能农业快速发展的背景下,基于深度学习的技术正被广泛应用于植物分类、智能园艺、自动监测与生态研究等多个领域。为了推动花卉类目标检测任务的发展,本文介绍一个包含的目标检测数据集,总计,每张图像均已进行精准的目标框标注。
2025-06-02 17:10:54
613
原创 西红柿番茄成熟度目标检测数据集介绍
本数据集主要采集自自然光条件下的温室或露天种植环境,图像具有良好的代表性,涵盖了不同角度、不同遮挡程度、不同光照强度下的西红柿样本。📸 数量:图片共计643张、总框数7781个。其中green 框数为5134个,half_ripened 框数为 1317个,fully_ripened 框数为1330个。green:果实呈绿色,尚未进入成熟阶段;:果实部分转红,处于成熟过渡期;:果实整体呈红色,达到采摘标准。所有图像均已按目标检测任务进行了手工标注,每个目标框标注了类别与位置坐标。
2025-06-02 15:57:03
708
原创 LUNA16肺结节数据集
LUNA16 是一个从 LIDC-IDRI 数据集中提取的子集,主要用于肺结节自动检测任务。数据集中包含了 888 个低剂量胸部 CT 扫描样本,共有1186个结节,直径从3.170毫米到27.442毫米不等,涵盖了不同大小的肺部结节。LUNA16数据集中的图像采用.mhd和.zraw格式,这些格式在医学影像处理领域较为常见,但由于其特殊性,直接处理和可视化存在一定困难。
2025-05-18 12:13:56
1078
原创 农业病虫害11类目标分类数据集
病虫害数据集一共有5007张包含了11类常见病虫害图像蚂蚁、蜜蜂、甲虫、毛毛虫、蠼螋、蚱蜢、蛾类、鼻涕虫、蜗牛、黄蜂、象甲,各类别数量分布均匀,每类在400张左右。适配主流深度学习模型如 ResNet、VGG、EfficientNet、ViT 等在分类任务中的训练与评估。数据结构采用按类划分的文件夹结构,每一类虫害图像单独存放于一个以英文名称命名的文件夹中,便于直接用于 PyTorch、TensorFlow 等框架的加载接口。数据集包含以下11 个典型农业害虫类别。
2025-05-17 12:20:33
825
原创 农业病虫害11类目标检测数据集
病虫害数据集一共有5007张包含了11类常见病虫害图像蚂蚁、蜜蜂、甲虫、毛毛虫、蠼螋、蚱蜢、蛾类、鼻涕虫、蜗牛、黄蜂、象甲,各类别数量分布均匀。标签包含了 json、xml、yolo三种格式。每张图像都经过人工手动标注,保证了标签的准确性,旨在支持如YOLO、Faster R-CNN、SSD等主流目标检测算法的训练与评估。数据集中共包含以下11类典型农业害虫,涵盖了不同形态与危害方式的代表性虫害类型。在json和xml标签中,标签名称为英文。在yolo标签中,标签名字为从0开始的阿拉伯数字。类别编号。
2025-05-15 11:46:59
985
原创 保姆级双目重建原理及代码
双目摄像机系统主要的任务就是测距,而视差求距离公式是在双目系统处于理想情况下推导的,但是在现实的双目立体视觉系统中,是不存在完全的共面行对准的两个摄像机图像平面的。所以我们要进行。
2025-05-11 11:48:41
1451
原创 保姆级双目测距原理及代码
双目立体视觉测距,包括畸变矫正、立体校正、视差计算和三维重建。首先,代码从读取相机标定参数,包括内外参、畸变系数等,并使用进行立体校正,确保左右相机的图像对齐。接着,利用计算视差图,并通过WLS(加权最小二乘滤波)进行优化,使视差图更加平滑,减少噪声。然后,使用将视差图转换为 3D 坐标,获取每个像素点的真实三维位置。图片模式image_mode)用于处理静态图像,相机模式)用于实时获取双目相机的视频流,并进行测距。用户可以点击深度图像查看对应点的 3D 坐标。
2025-03-16 12:14:01
3582
13
原创 相机标定原理
摄像机标定过程,简单的可以描述为:通过标定板可以得到n个对应的世界坐标三维点Xi(归一化后的平面)和对应的图像坐标二维点xi(畸变后的),这些三维点到二维点的转换都可以通过上面提到的相机内参K ,相机外参 R 和t,以及畸变参数 D ,经过一系列的矩阵变换得到。
2025-03-16 10:34:45
1159
原创 Batch Normalization 和 Layer Normalization
上图展示了一个batch size为2的Batch Normalization的计算过程,假设feature1、feature2分别是由image1、image2经过一系列卷积池化后得到的特征矩阵,feature的channel为2,那么x(1)代表该batch的所有feature的channel1的数据,同理x(2)代表该batch的所有feature的channel2的数据。然后分别计算每个通道的均值与方差。注意是一个向量不是一个值,向量的每一个元素代表着一个维度(channel)的方差。
2025-02-25 22:18:10
1586
原创 常见激活函数介绍
在接触到深度学习(Deep Learning)后,特别是神经网络中,我们会发现在每一层的神经网络输出后都会使用一个函数(比如Relu,Relu和sigmoid等等)对结果进行运算,这个函数就是激活函数(Activation Function)。那么为什么需要添加激活函数呢?如果不添加又会产生什么问题呢?首先,我们知道神经网络模拟了人类神经元的工作机理,激活函数(Activation Function)是一种添加到人工神经网络中的函数,旨在帮助网络学习数据中的复杂模式。
2025-02-23 22:58:54
879
原创 卷积基础知识
卷积公式如上所示,以下图为例,对这个卷积公式进行理解其中,f(t)表示随着时间的进食量,g(t)表示随着时间剩余食物的比例。问题:下午两点肚子里剩余食物?1. 8点吃,到下午两点剩余的食物:f(8)* g(14-8)2. 10点吃,到下午两点剩余的食物:f(10)* g(14-10)3.12点吃,到下午两点剩余的食物:f(12)* g(14-12)
2025-02-23 17:32:23
1799
皮肤癌图像分类数据集,9类
2025-05-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人