- 博客(67)
- 问答 (2)
- 收藏
- 关注
原创 FFCV性能优化——快速加载大规模图像数据训练
图像通常可以负责大部分资源(存储和/或 compute) 中。 FFCV 提供了多种选项来控制 图像,允许用户满足每个项目的特定需求,以及 硬件配置在大多数机器学习数据集中,图像是使用 then 数据处理。虽然这种方案非常节省空间,但对图像进行解码 需要 大量资源,通常是加载速度的瓶颈。 获得快速足够数量的存储(RAM、SSD),其他替代方案可能是首选
2025-04-23 16:53:38
332
原创 NAFNet:Simple Baselines for Image Restoration
提出了一种简单的基线,它超越了SOTA方法,并且计算效率很高。为了进一步简化基线,我们揭示了非线性激活函数,例如Sigmoid、ReLU、GELU、Softmax等不是必需的:它们可以被乘法替换或去除。因此,我们从基线推导出一个非线性无激活网络,即NAFNet
2025-03-11 19:39:23
1443
原创 Restormer: Efficient Transformer for High-Resolution Image Restoration
Restormer:提出了一个有效的Transformer模型,通过在构建模块(多头注意力和前馈网络)中进行几个关键设计,使其可以捕获长距离像素交互,同时仍然适用于大图像。我们的模型名为Restoration Transformer(Restormer),在多个图像恢复任务上实现了最先进的结果
2025-03-11 19:27:52
691
原创 深度学习中TorchScript原理、作用浅析(Trace/Script)
关于torch.jit.trace和torch.jit.script的使用以及其工作原理的理解
2025-03-06 18:04:30
592
原创 论文阅读和代码实现EfficientDet(BiFPN)
提出了一个加权双向特征金字塔网络(BIFPN),它允许简单且快速的多尺度特征融合;其次,我们提出了一种复合缩放方法,该方法均匀地缩放了所有骨干,功能网络和框/类预测网络的分辨率,深度和宽度。基于这些优化和更好的骨干,我们开发了一个新的对象探测器家族,称为EfficientDet
2025-03-04 19:51:19
1095
5
原创 YoloV8/V11 OBB-onnx 模型推理含完整代码(Python)
python 推理旋转目标检测onnx模型和验证onnx模型精确率、召回率指标
2025-02-21 15:51:40
531
1
原创 解决每次打开终端都需要source ~/.bashrc的问题(记录)
解决新服务器或者电脑通常需要设置一些环境变量,例如新电脑安装了Anaconda等软件,在配置环境变量后发现每次都需要重新source
2025-02-05 17:46:40
394
原创 深度学习中Batch Normalization(BN)原理、作用浅析
浅析深度学习中BN层的原理和作用,以及为什么使用BN层通常可以帮助网络更好的学习
2025-01-21 16:10:55
1360
原创 论文Learning Efficient Convolutional Networks through Network Slimming(剪枝相关)
我们提出了网络瘦身技术来学习更紧凑的CNN。它直接对批量归一化层中的缩放因子施加稀疏性引起的正则化,因此可以在训练过程中自动识别不重要的通道,然后进行修剪。在多个数据集上,我们已经证明所提出的方法能够显着降低最先进网络的计算成本(高达20倍),并且不会损失准确性。更重要的是,所提出的方法同时减少了模型大小、运行时内存、计算操作,同时为训练过程引入最小的开销,并且生成的模型不需要特殊的库/硬件来进行有效的推理。
2025-01-20 15:18:08
999
原创 论文Slim-neck by GSConv: A lightweight-design for real-time detector architectures
Slim-neck by GSConv论文解读,轻量化网络
2024-12-31 16:39:52
709
原创 论文《NWD》和YOLOv8中的实现提升小目标检测A Normalized Gaussian Wasserstein Distance for Tiny Object Detection
对小目标检测的损失优化思路和代码复现、和A Normalized Gaussian Wasserstein Distance for Tiny Object Detection论文的理解
2024-12-28 14:22:22
1038
4
原创 YoloV8实现简化版数据增强mosaic
Yolo系列对训练十分有效的策略马赛克增强,对于模型泛化能力、最终性能都有很大提升,由于Yolo在mosaic时涉及到一些其他变换例如缩放、随机图像占比等,这里单纯实现将4张图合并成一张,同时更新对应的标签,适合想要将单张图加入多个目标的简单实现。
2024-12-13 17:49:50
798
原创 YoloV8数据增强扩增数据集OBB(旋转、缩放、噪声、模糊、抖动)
在Yolo训练自己数据集的时候,如果数据量少为了提升训练效果,通过数据增强的方法让已有的数据扩增是一种有效的方法。
2024-12-13 16:24:43
2001
3
原创 结合YoloV8讲解论文:Gaussian Bounding Boxes and Probabilistic Intersection-over-Union for Object Detection
基于yolov8 obb iou讲解其原理和代码实现,通过读取文章以了解其局限性和改进方法
2024-12-10 20:17:18
1548
1
原创 论文:IoU Loss for 2D/3D Object Detection
在2D/3D目标检测任务中,IoU (Intersection-over- Union)作为一种评价指标,被广泛用于评价不同探测器在测试阶段的性能。然而,在训练阶段,通常采用常见的距离损失(如L1或L2)作为损失函数,以最小化预测值与真实值边界盒(Bbox)之间的差异。为了消除训练和测试之间的性能差距,在[1]和[2]中引入了IoU损失用于二维目标检测。
2024-12-03 15:05:57
1169
原创 YOLO v8热力图OBB代码实现(全网首发)
主要是yolo v8 obb 热力图实现方法,帮助大家更好的分析模型,yolo热力图代码实现。
2024-11-12 19:58:02
950
21
原创 论文Query2Label: A Simple Transformer Way to Multi-Label Classification
本文将Transformer解码器用于多标签分类,将label embedding作为query,计算与featuremap的cross-attention,取得了SOTA结果。
2024-09-20 10:58:28
1183
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人