自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

记录图像处理中遇到的点点滴滴

记录、创新、思考、落地

  • 博客(67)
  • 问答 (2)
  • 收藏
  • 关注

原创 FFCV性能优化——快速加载大规模图像数据训练

图像通常可以负责大部分资源(存储和/或 compute) 中。 FFCV 提供了多种选项来控制 图像,允许用户满足每个项目的特定需求,以及 硬件配置在大多数机器学习数据集中,图像是使用 then 数据处理。虽然这种方案非常节省空间,但对图像进行解码 需要 大量资源,通常是加载速度的瓶颈。 获得快速足够数量的存储(RAM、SSD),其他替代方案可能是首选

2025-04-23 16:53:38 332

原创 Pytorch分布式训练(DDP)(记录)

pytorch分布式训练DDP基本流程

2025-04-18 20:03:47 306 2

原创 SSH免密登录服务器方法

【代码】SSH免密登录服务器方法。

2025-03-26 16:23:35 322 2

原创 深度学习中LayerNorm与RMSNorm对比

对比LayerNorm和RMSNorm的区别和应用场景

2025-03-15 15:09:29 714

原创 深度学习中学习率调整策略

不同学习率策略的一些记录和整理

2025-03-13 20:05:51 753 1

原创 NAFNet:Simple Baselines for Image Restoration

提出了一种简单的基线,它超越了SOTA方法,并且计算效率很高。为了进一步简化基线,我们揭示了非线性激活函数,例如Sigmoid、ReLU、GELU、Softmax等不是必需的:它们可以被乘法替换或去除。因此,我们从基线推导出一个非线性无激活网络,即NAFNet

2025-03-11 19:39:23 1443

原创 Restormer: Efficient Transformer for High-Resolution Image Restoration

Restormer:提出了一个有效的Transformer模型,通过在构建模块(多头注意力和前馈网络)中进行几个关键设计,使其可以捕获长距离像素交互,同时仍然适用于大图像。我们的模型名为Restoration Transformer(Restormer),在多个图像恢复任务上实现了最先进的结果

2025-03-11 19:27:52 691

原创 深度学习中TorchScript原理、作用浅析(Trace/Script)

关于torch.jit.trace和torch.jit.script的使用以及其工作原理的理解

2025-03-06 18:04:30 592

原创 论文阅读和代码实现EfficientDet(BiFPN)

提出了一个加权双向特征金字塔网络(BIFPN),它允许简单且快速的多尺度特征融合;其次,我们提出了一种复合缩放方法,该方法均匀地缩放了所有骨干,功能网络和框/类预测网络的分辨率,深度和宽度。基于这些优化和更好的骨干,我们开发了一个新的对象探测器家族,称为EfficientDet

2025-03-04 19:51:19 1095 5

原创 ONNX转RKNN的环境搭建

以yolov8为例记录onnx转换为rknn的环境需要和部署流程

2025-02-24 19:14:52 947

原创 YoloV8/V11 OBB-onnx 模型推理含完整代码(Python)

python 推理旋转目标检测onnx模型和验证onnx模型精确率、召回率指标

2025-02-21 15:51:40 531 1

原创 PaddleOCR模型训练1-检测模型

paddle ocr 训练 文本检测模型基础过程记录

2025-02-13 16:38:34 450

原创 PaddleOCR环境搭建(记录)

简单记录搭建paddleocr环境过程

2025-02-11 15:04:20 413

原创 解决每次打开终端都需要source ~/.bashrc的问题(记录)

解决新服务器或者电脑通常需要设置一些环境变量,例如新电脑安装了Anaconda等软件,在配置环境变量后发现每次都需要重新source

2025-02-05 17:46:40 394

原创 深度学习中Batch Normalization(BN)原理、作用浅析

浅析深度学习中BN层的原理和作用,以及为什么使用BN层通常可以帮助网络更好的学习

2025-01-21 16:10:55 1360

原创 论文Learning Efficient Convolutional Networks through Network Slimming(剪枝相关)

我们提出了网络瘦身技术来学习更紧凑的CNN。它直接对批量归一化层中的缩放因子施加稀疏性引起的正则化,因此可以在训练过程中自动识别不重要的通道,然后进行修剪。在多个数据集上,我们已经证明所提出的方法能够显着降低最先进网络的计算成本(高达20倍),并且不会损失准确性。更重要的是,所提出的方法同时减少了模型大小、运行时内存、计算操作,同时为训练过程引入最小的开销,并且生成的模型不需要特殊的库/硬件来进行有效的推理。

2025-01-20 15:18:08 999

原创 CUDA C 编程入门学习记录

CUDA C编程入门基础知识学习和整理

2025-01-18 11:43:14 393

原创 tensorflow源码编译在C++环境使用

tensorflow源码编译在C++环境使用

2025-01-18 11:36:05 1365

原创 Python Numba多流和共享内存CUDA优化技术学习记录

CUDA优化技术学习整理

2025-01-18 10:35:30 1026

原创 Python_CUDA入门教程学习记录

CUDA的基础知识记录和整理

2025-01-18 10:31:42 1095

原创 Yolov8 目标检测剪枝学习记录

以yolov8目标检测为例子,跑通剪枝全流程,帮助自己更好的理解剪枝和应用在自己的任务中

2025-01-16 13:47:51 1644 6

原创 激活函数篇——Relu、Leaky ReLU、SiLU(对比计算量、内存)

Relu系列常见激活函数(记录)、随时补充更新

2025-01-09 11:17:06 1989

原创 论文Slim-neck by GSConv: A lightweight-design for real-time detector architectures

Slim-neck by GSConv论文解读,轻量化网络

2024-12-31 16:39:52 709

原创 YOLOv8改进之SPPF添加LSKA注意力机制,增强多尺度特征提取能力

在YOLO中SPPF层添加LSKA注意力,提升网络特征提取能力

2024-12-30 16:50:14 678

原创 用命令行重启资源管理器(记录win解决找不到资源管理器问题)

如何用命令重启资源管理器

2024-12-28 14:30:55 286

原创 论文《NWD》和YOLOv8中的实现提升小目标检测A Normalized Gaussian Wasserstein Distance for Tiny Object Detection

对小目标检测的损失优化思路和代码复现、和A Normalized Gaussian Wasserstein Distance for Tiny Object Detection论文的理解

2024-12-28 14:22:22 1038 4

原创 VarifocalLoss在Yolov8中的应用

YOLOv8调用VarifocalLoss过程和方法

2024-12-20 15:33:50 364

原创 Yolo中OBB的角度范围和角度损失设计思路

理解YOLOv8 OBB角度相关知识,和获取角度并设计损失的思路

2024-12-17 19:23:53 742

原创 YoloV8实现简化版数据增强mosaic

Yolo系列对训练十分有效的策略马赛克增强,对于模型泛化能力、最终性能都有很大提升,由于Yolo在mosaic时涉及到一些其他变换例如缩放、随机图像占比等,这里单纯实现将4张图合并成一张,同时更新对应的标签,适合想要将单张图加入多个目标的简单实现。

2024-12-13 17:49:50 798

原创 YoloV8数据增强扩增数据集OBB(旋转、缩放、噪声、模糊、抖动)

在Yolo训练自己数据集的时候,如果数据量少为了提升训练效果,通过数据增强的方法让已有的数据扩增是一种有效的方法。

2024-12-13 16:24:43 2001 3

原创 结合YoloV8讲解论文:Gaussian Bounding Boxes and Probabilistic Intersection-over-Union for Object Detection

基于yolov8 obb iou讲解其原理和代码实现,通过读取文章以了解其局限性和改进方法

2024-12-10 20:17:18 1548 1

原创 论文:IoU Loss for 2D/3D Object Detection

在2D/3D目标检测任务中,IoU (Intersection-over- Union)作为一种评价指标,被广泛用于评价不同探测器在测试阶段的性能。然而,在训练阶段,通常采用常见的距离损失(如L1或L2)作为损失函数,以最小化预测值与真实值边界盒(Bbox)之间的差异。为了消除训练和测试之间的性能差距,在[1]和[2]中引入了IoU损失用于二维目标检测。

2024-12-03 15:05:57 1169

原创 YOLO issues 问题整理(持续更新记录)

整理本人遇到的或者觉得比较好的关于YOLO issues集合

2024-11-25 10:08:32 943

原创 YOLO v8热力图OBB代码实现(全网首发)

主要是yolo v8 obb 热力图实现方法,帮助大家更好的分析模型,yolo热力图代码实现。

2024-11-12 19:58:02 950 21

原创 Yolov8保存best模型依据和修改方法

记录了YOLOv8中修改训练时,验证map范围方法和保存最优模型依据

2024-11-08 15:16:12 593

原创 训练时过拟合解决方法(记录)

网络训练过拟合的一些记录

2024-10-24 19:51:24 226

原创 论文Query2Label: A Simple Transformer Way to Multi-Label Classification

本文将Transformer解码器用于多标签分类,将label embedding作为query,计算与featuremap的cross-attention,取得了SOTA结果。

2024-09-20 10:58:28 1183

原创 Git常用命令(记录)

常用的git命令汇总,不定期记录和补充

2024-09-14 09:24:27 629

原创 通过TensorBoard查看服务器训练过程

在本地查看服务器训练代码过程

2024-09-12 11:28:23 688

原创 YoloV8修改分类、检测的前处理(记录)

记录修改yolov8中分类前处理的方法和效果,代码等

2024-09-10 14:40:29 1572 8

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除