- 博客(22)
- 收藏
- 关注
原创 算法论文/模型集成1——未来集成多个模型时,仅需推理一次!
Model soups to increase inference without increasing compute time
2025-02-20 17:11:59
684
原创 解决docker: Error response from daemon: could not select device driver ““ with capabilities: [[gpu]].
4步解决docker容器无法调用gpu的报错 docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]].
2025-01-24 09:56:45
5169
5
原创 算法论文/部署加速1——你的Transformer其实可以更快!量化Transformer的方法(2024最新综述)
量化Transformers的方法,Model Quantization and Hardware Acceleration for Vision Transformers: A Comprehensive Survey
2024-12-28 16:18:02
1470
原创 算法论文/目标检测4——介绍DETR家族到DINO的发展史
2023DETR综述:Object Detection with Transformers: A Review
2024-12-28 14:59:58
1786
原创 算法论文/半监督1——2024最新半监督目标检测综述(CNN和Transformer)全文1.5W字
Semi-Supervised Object Detection: A Survey on Progress from CNN to Transformer
2024-12-10 10:03:43
1441
原创 算法论文/预训练1——NeurIPS 2022巨型预训练图像模型能否提取通用表征?中科大、西安交大、微软亚洲研究院出品
Could Giant Pretrained Image Models Extract Universal Representations?
2024-12-06 17:14:54
1685
原创 算法论文/目标检测3——D-FINE: REDEFINE REGRESSION TASK IN DETRS AS FINE-GRAINED DISTRIBUTION REFINEMENT
D-FINE: Redefine Regression Task in DETRs as Fine-grained Distribution Refinement 包括两个关键组成部分:细粒度分布细化 (FDR) 和全局最优定位自蒸馏 (GO-LSD)。
2024-10-30 11:14:02
2324
2
原创 算法论文/目标检测2——RT-DETRv3: Real-time End-to-End Object Detection with Hierarchical Dense Positive
RT-DETRv3引入了一个基于 CNN 的辅助分支,提供密集监督,与原始解码器协作以增强编码器特征表示。其次,为了解决解码器训练不足的问题,我们提出了一种涉及自注意力扰动的新型学习策略。该策略使多个查询组中的正样本的标签分配多样化,从而丰富了正监督。此外,我们引入了一个共享权重解码器分支进行密集正监督,以确保更多高质量查询与每个基本事实匹配。
2024-09-20 17:14:58
3306
3
原创 算法论文/目标检测1——RT-DETRv2: Improved Baseline with Bag-of-Freebies for Real-Time Detection Transformer
为了提高灵活性,我们建议在可变形关注中为不同尺度的特征设置不同数量的采样点,以实现解码器选择性的多尺度特征提取。为了提高实用性,我们提出了一个可选的离散采样算子来取代 YOLO 特定于 RT-DETR 的 grid_sample 算子
2024-09-20 16:27:33
2113
原创 算法论文/数据集1——数据集蒸馏得更小!Dataset Distillation: A Comprehensive Review
海量数据大大增加了存储和传输的负担,并进一步导致了繁琐的模型训练过程。引入了数据集蒸馏 (DD),也称为数据集压缩 (DC),DD 旨在推导出一个包含合成样本的更小的数据集,在此基础上,经过训练的模型产生的性能与在原始数据集上训练的模型相当。
2024-09-19 14:56:48
2415
原创 算法论文/自监督2——2024年8月13日最新的MIM综述论文Masked Image Modeling: A Survey
在这项工作中,我们调查了最近关于掩码图像建模(MIM)的研究,这种方法在计算机视觉中成为一种强大的自我监督学习技术。MIM 任务涉及屏蔽一些信息,例如像素、补丁甚至潜在表示,并训练模型(通常是自动编码器)以使用输入可见部分中可用的上下文来预测缺失的信息。我们确定并正式确定了如何将 MIM 作为借口任务实施的两类方法,一种基于重建,另一类基于对比学习。然后,我们构建了一个分类法并回顾了近年来最突出的论文。我们用通过应用分层聚类算法获得的树状图来补充手动构建的分类法。
2024-09-14 14:52:37
2645
原创 算法论文/自监督1——CNN-JEPA: Self-Supervised Pretraining Convolutional Neural Networks
一起阅读CNN的JEPA算法论文,CNN-JEPA: Self-Supervised Pretraining Convolutional Neural Networks Using Joint Embedding Predictive Architecture 成功地将联合嵌入预测架构方法应用于CNN
2024-09-09 20:35:54
1316
原创 【避坑经验】训练CNN的MAE——自监督SparK预训练Designing BERT for Convolutional Networks
实现的预训练方法简称为SparK,在配置环境中有一些坑,分享一些经验
2024-08-21 15:08:47
548
原创 Python通过OpenVINO调用Intel GPU推理YOLOv8模型
Python通过OpenVINO调用Intel GPU推理YOLOv8模型
2024-08-09 17:36:33
1538
10
原创 使用Graphviz进行Python项目代码可视化:理解各类函数调用关系及耗时
使用Graphviz工具进行项目代码可视化,更好地理解Python项目的运行逻辑,直观展示陌生项目各类方法之间的调用关系,
2023-12-22 17:11:33
3845
原创 python 扑克记牌器 windows软件 pytorch|计算机视觉|深度学习
单人基于python\深度学习\PYQT开发windows软件—扑克记牌器
2023-10-18 15:13:35
1040
2
原创 3分钟解决报错NVIDIA_SMI has failed because it couldn’t communicate with the NVIDIA driver.
有时在重启机器后,nvidia-smi之后会显示nvidia驱动丢失,这是由于linux内核升级,之前的nvidia驱动就不匹配。报错。
2022-12-10 15:44:46
20487
13
原创 解决报错RUNTIMEWARNING: GLYPH 27979 MISSING FROM CURRENT FONT. FONT.SET_TEXT(S, 0, FLAGS=FLAGS)
解决报错RUNTIMEWARNING: GLYPH 27979 MISSING FROM CURRENT FONT. FONT.SET_TEXT(S, 0, FLAGS=FLAGS)需要下载字体包https://www.freesion.com/article/80011281764/
2022-04-20 17:23:42
994
原创 安装mmsegmentation经验-ubuntu18.0.4
@安装mmsegmentation经验-ubuntu18.0.4在安装mmseg过程中遇到了很多版本不兼容的问题,最后成功了,分享一点经验。服务器状态我使用的显卡是3090,显卡驱动是470.94,cuda版本是11.4建立虚拟环境建立环境不必多说,我这里使用的是python3.8安装mmcv-full我之前使用的torch1.8.1,在mmcv-full的版本对应表没有cuda11.4的命令(目前我的cuda是最新的)。我借鉴其他版本的mmcv-full命令,修改对应cu***和torch*
2022-01-10 19:14:15
1823
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人