江木27-CSDN博客

原创 FFCV性能优化——快速加载大规模图像数据训练

图像通常可以负责大部分资源（存储和/或 compute）中。 FFCV 提供了多种选项来控制图像，允许用户满足每个项目的特定需求，以及硬件配置在大多数机器学习数据集中，图像是使用 then 数据处理。虽然这种方案非常节省空间，但对图像进行解码需要大量资源，通常是加载速度的瓶颈。获得快速足够数量的存储（RAM、SSD），其他替代方案可能是首选

2025-04-23 16:53:38 332

原创 Pytorch分布式训练(DDP)（记录）

pytorch分布式训练DDP基本流程

2025-04-18 20:03:47 306 2

原创 SSH免密登录服务器方法

【代码】SSH免密登录服务器方法。

2025-03-26 16:23:35 322 2

原创深度学习中LayerNorm与RMSNorm对比

对比LayerNorm和RMSNorm的区别和应用场景

2025-03-15 15:09:29 714

原创深度学习中学习率调整策略

不同学习率策略的一些记录和整理

2025-03-13 20:05:51 753 1

原创 NAFNet:Simple Baselines for Image Restoration

提出了一种简单的基线，它超越了SOTA方法，并且计算效率很高。为了进一步简化基线，我们揭示了非线性激活函数，例如Sigmoid、ReLU、GELU、Softmax等不是必需的：它们可以被乘法替换或去除。因此，我们从基线推导出一个非线性无激活网络，即NAFNet

2025-03-11 19:39:23 1443

原创 Restormer: Efficient Transformer for High-Resolution Image Restoration

Restormer:提出了一个有效的Transformer模型，通过在构建模块（多头注意力和前馈网络）中进行几个关键设计，使其可以捕获长距离像素交互，同时仍然适用于大图像。我们的模型名为Restoration Transformer（Restormer），在多个图像恢复任务上实现了最先进的结果

2025-03-11 19:27:52 691

原创深度学习中TorchScript原理、作用浅析(Trace/Script)

关于torch.jit.trace和torch.jit.script的使用以及其工作原理的理解

2025-03-06 18:04:30 592

原创论文阅读和代码实现EfficientDet（BiFPN）

提出了一个加权双向特征金字塔网络（BIFPN），它允许简单且快速的多尺度特征融合；其次，我们提出了一种复合缩放方法，该方法均匀地缩放了所有骨干，功能网络和框/类预测网络的分辨率，深度和宽度。基于这些优化和更好的骨干，我们开发了一个新的对象探测器家族，称为EfficientDet

2025-03-04 19:51:19 1095 5

原创 ONNX转RKNN的环境搭建

以yolov8为例记录onnx转换为rknn的环境需要和部署流程

2025-02-24 19:14:52 947

原创 YoloV8/V11 OBB-onnx 模型推理含完整代码(Python)

python 推理旋转目标检测onnx模型和验证onnx模型精确率、召回率指标

2025-02-21 15:51:40 531 1

原创 PaddleOCR模型训练1-检测模型

paddle ocr 训练文本检测模型基础过程记录

2025-02-13 16:38:34 450

原创 PaddleOCR环境搭建(记录)

简单记录搭建paddleocr环境过程

2025-02-11 15:04:20 413

原创解决每次打开终端都需要source ~/.bashrc的问题（记录）

解决新服务器或者电脑通常需要设置一些环境变量，例如新电脑安装了Anaconda等软件，在配置环境变量后发现每次都需要重新source

2025-02-05 17:46:40 394

原创深度学习中Batch Normalization(BN)原理、作用浅析

浅析深度学习中BN层的原理和作用，以及为什么使用BN层通常可以帮助网络更好的学习

2025-01-21 16:10:55 1360

原创论文Learning Efficient Convolutional Networks through Network Slimming(剪枝相关)

我们提出了网络瘦身技术来学习更紧凑的CNN。它直接对批量归一化层中的缩放因子施加稀疏性引起的正则化，因此可以在训练过程中自动识别不重要的通道，然后进行修剪。在多个数据集上，我们已经证明所提出的方法能够显着降低最先进网络的计算成本（高达20倍），并且不会损失准确性。更重要的是，所提出的方法同时减少了模型大小、运行时内存、计算操作，同时为训练过程引入最小的开销，并且生成的模型不需要特殊的库/硬件来进行有效的推理。

2025-01-20 15:18:08 999

原创 CUDA C 编程入门学习记录

CUDA C编程入门基础知识学习和整理

2025-01-18 11:43:14 393

原创 tensorflow源码编译在C++环境使用

tensorflow源码编译在C++环境使用

2025-01-18 11:36:05 1365

原创 Python Numba多流和共享内存CUDA优化技术学习记录

CUDA优化技术学习整理

2025-01-18 10:35:30 1026

原创 Python_CUDA入门教程学习记录

CUDA的基础知识记录和整理

2025-01-18 10:31:42 1095

原创 Yolov8 目标检测剪枝学习记录

以yolov8目标检测为例子，跑通剪枝全流程，帮助自己更好的理解剪枝和应用在自己的任务中

2025-01-16 13:47:51 1644 6

原创激活函数篇——Relu、Leaky ReLU、SiLU（对比计算量、内存）

Relu系列常见激活函数（记录）、随时补充更新

2025-01-09 11:17:06 1989

原创论文Slim-neck by GSConv: A lightweight-design for real-time detector architectures

Slim-neck by GSConv论文解读，轻量化网络

2024-12-31 16:39:52 709

原创 YOLOv8改进之SPPF添加LSKA注意力机制,增强多尺度特征提取能力

在YOLO中SPPF层添加LSKA注意力，提升网络特征提取能力

2024-12-30 16:50:14 678

原创用命令行重启资源管理器（记录win解决找不到资源管理器问题）

如何用命令重启资源管理器

2024-12-28 14:30:55 286

原创论文《NWD》和YOLOv8中的实现提升小目标检测A Normalized Gaussian Wasserstein Distance for Tiny Object Detection

对小目标检测的损失优化思路和代码复现、和A Normalized Gaussian Wasserstein Distance for Tiny Object Detection论文的理解

2024-12-28 14:22:22 1038 4

原创 VarifocalLoss在Yolov8中的应用

YOLOv8调用VarifocalLoss过程和方法

2024-12-20 15:33:50 364

原创 Yolo中OBB的角度范围和角度损失设计思路

理解YOLOv8 OBB角度相关知识，和获取角度并设计损失的思路

2024-12-17 19:23:53 742

原创 YoloV8实现简化版数据增强mosaic

Yolo系列对训练十分有效的策略马赛克增强，对于模型泛化能力、最终性能都有很大提升，由于Yolo在mosaic时涉及到一些其他变换例如缩放、随机图像占比等，这里单纯实现将4张图合并成一张，同时更新对应的标签，适合想要将单张图加入多个目标的简单实现。

2024-12-13 17:49:50 798

原创 YoloV8数据增强扩增数据集OBB(旋转、缩放、噪声、模糊、抖动)

在Yolo训练自己数据集的时候，如果数据量少为了提升训练效果，通过数据增强的方法让已有的数据扩增是一种有效的方法。

2024-12-13 16:24:43 2001 3

原创结合YoloV8讲解论文：Gaussian Bounding Boxes and Probabilistic Intersection-over-Union for Object Detection

基于yolov8 obb iou讲解其原理和代码实现，通过读取文章以了解其局限性和改进方法

2024-12-10 20:17:18 1548 1

原创论文：IoU Loss for 2D/3D Object Detection

在2D/3D目标检测任务中，IoU (Intersection-over- Union)作为一种评价指标，被广泛用于评价不同探测器在测试阶段的性能。然而，在训练阶段，通常采用常见的距离损失(如L1或L2)作为损失函数，以最小化预测值与真实值边界盒(Bbox)之间的差异。为了消除训练和测试之间的性能差距，在[1]和[2]中引入了IoU损失用于二维目标检测。

2024-12-03 15:05:57 1169