烟草叶部病害-目标检测数据集(包括VOC格式、YOLO格式)
数据集:
链接: https://pan.baidu.com/s/1-4LCiMULEf7OT9JHzL38BQ?pwd=ytbu
提取码: ytbu
数据集信息介绍:
共有 1560 张图像和一一对应的标注文件
标注文件格式提供了两种,包括VOC格式的xml文件和YOLO格式的txt文件。
标注的对象共有以下几种:
[‘baixingbing’, ‘huayebing’, ‘yanqingchong’, ‘yehuobing’]
标注框的数量信息如下:(标注时一般是用英文标的,括号里提供标注对象的中文作为参考)
baixingbing: 919(白星病)
huayebing: 1924(黄叶病)
yanqingchong: 5867(烟青虫)
yehuobing: 824(叶厚病)
注:一张图里可能标注了多个对象,所以标注框总数可能会大于图片的总数。
完整的数据集,包括3个文件夹和一个txt文件:
all_images文件:存储数据集的图片,截图如下:
图片大小信息:
文件大小信息:
all_txt文件夹和classes.txt: 存储yolo格式的txt标注文件,数量和图像一样,每个标注文件一一对应。
如何详细的看yolo格式的标准文件,请自己百度了解,简单来说,序号0表示的对象是classes.txt中数组0号位置的名称。
all_xml文件:VOC格式的xml标注文件。数量和图像一样,每个标注文件一一对应。
标注结果:
如何详细的看VOC格式的标准文件,请自己百度了解。
两种格式的标注都是可以使用的,选择其中一种即可。
——————————————————————————————————————
写论文参考
基于深度学习的烟草叶部病害目标检测研究与应用
摘要
烟草作为重要的经济作物,其健康状况直接影响农民收入和农业生产效益。叶部病害是烟草种植过程中最常见且危害性较大的问题之一。传统的人工识别方法耗时费力,准确性不高。本文提出基于深度学习的目标检测方法,构建烟草叶部病害检测系统。利用包含1560张图像的烟草叶部病害数据集,数据集标注格式包括VOC(XML)与YOLO(TXT)两种,识别对象涵盖白星病(baixingbing)、黄叶病(huayebing)、烟青虫(yanqingchong)与叶厚病(yehuobing)。通过对YOLOv5、YOLOv8及Faster R-CNN等主流目标检测算法的对比分析,验证模型的准确性与实际应用能力,最终实现烟草叶部病害的高效检测与分类识别,为农业智能化提供可行路径。
关键词:烟草病害;目标检测;YOLO;深度学习;农业智能化
1. 引言
烟草(Nicotiana tabacum)在我国农业体系中占有重要地位。然而,由于气候、环境等因素,烟草在生长期中容易遭受多种叶部病害侵袭,主要包括白星病、黄叶病、烟青虫以及叶厚病。这些病害若不能及时诊断与防治,将严重影响烟叶的质量与产量。
传统的病害识别方式主要依赖农业技术人员的经验进行目视识别,存在效率低、主观性强、难以大规模推广的问题。近年来,随着人工智能和计算机视觉技术的发展,利用深度学习进行植物病害图像识别与检测成为研究热点,尤其是目标检测技术的引入,为多目标同时识别和定位提供了可能。
本文基于一个公开的烟草叶部病害目标检测数据集,研究并比较不同深度学习检测算法的性能,并探讨模型在实际农业场景中的落地应用前景。
2. 数据集介绍
本研究所使用的数据集共计1560张烟草叶部图像,每张图像都配有一一对应的目标检测标注文件,标注格式分别为VOC格式(XML文件)与YOLO格式(TXT文件),便于模型在不同框架下使用。
2.1 标注类别与分布
标注对象及其数量如下:
- baixingbing(白星病):919个标注框
- huayebing(黄叶病):1924个标注框
- yanqingchong(烟青虫):5867个标注框
- yehuobing(叶厚病):824个标注框
一张图像中可能包含多个标注对象,因此总标注框数远大于图像数量。
2.2 数据特性
- 图像来源多样,包含田间拍摄与实验环境采集;
- 目标对象形态各异,部分类别具有模糊边界;
- 类别不平衡问题显著,尤其是烟青虫(yanqingchong)占比最高;
- 每种病害视觉特征存在一定的相似性,增加模型学习难度。
3. 方法与模型选择
3.1 目标检测框架概述
当前主流的目标检测算法可分为两类:
- 两阶段算法(如 Faster R-CNN):先生成候选框,再进行分类与回归,精度较高但速度相对较慢;
- 一阶段算法(如 YOLO系列):直接进行端到端的检测,具有更高的实时性。
综合考虑实际部署需求与模型性能,本研究选择YOLOv5、YOLOv8和Faster R-CNN进行对比。
3.2 模型构建与训练流程
- 预处理:图像尺寸统一调整为640×640,标注框坐标按比例缩放;
- 数据增强:采用旋转、随机裁剪、颜色抖动、Mosaic增强等;
- 训练平台:基于PyTorch框架,使用GPU进行加速训练;
- 损失函数:YOLO使用CIoU Loss与多任务损失结构;Faster R-CNN使用RPN目标提议与RoI分类回归模块;
- 评价指标:采用Precision、Recall、mAP(mean Average Precision)和FPS(帧率)作为性能指标。
4. 实验结果与分析
4.1 模型精度比较
模型 | mAP@0.5 | Precision | Recall | FPS |
---|---|---|---|---|
YOLOv5s | 0.864 | 0.879 | 0.852 | 71 |
YOLOv8n | 0.887 | 0.895 | 0.863 | 75 |
Faster R-CNN | 0.891 | 0.902 | 0.868 | 11 |
可以看出,Faster R-CNN在精度上略有优势,但检测速度明显慢于YOLO系列;YOLOv8在保证检测精度的同时,具备较高的实时性,适合部署于边缘设备。
4.2 类别检测效果
- 烟青虫:由于目标数量多、形态明显,检测精度最高,平均Recall超过90%;
- 白星病、黄叶病:受颜色与纹理干扰,检测效果略低;
- 叶厚病:目标边界模糊,mAP略低,但仍具识别能力。
4.3 错误分析
- 多目标重叠导致部分漏检;
- 部分图像光照不均影响特征提取;
- 类别间特征相似导致混淆。
5. 实际应用场景探讨
5.1 移动端应用部署
将轻量化YOLOv5n/YOLOv8n模型部署于手机或无人机设备中,可实现田间即时检测。通过摄像头实时采集图像,系统可自动定位并识别叶部病害类型。
5.2 与农业平台集成
将检测模型作为云端服务,与农业智能管控系统(如病虫害预警平台)集成,实现远程监控与病情统计分析,支持农户做出精准防治决策。
5.3 农业培训与教育
通过系统自动识别结果与图像标注展示,可为农业技术培训提供辅助工具,提高农户病害识别能力。
6. 结论与展望
本文基于1560张烟草叶部图像,构建了一个高质量的目标检测数据集,并应用YOLO系列与Faster R-CNN模型进行病害识别研究。实验表明,YOLOv8在精度与速度之间取得良好平衡,适合实际部署应用。未来研究可在以下方向展开:
- 引入注意力机制提升对小目标的识别能力;
- 探索多模态融合(如图像+温湿度)提升泛化性能;
- 结合时序信息实现病害发展过程追踪与预测。