自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(270)
  • 资源 (4)
  • 收藏
  • 关注

原创 语音克隆(Voice Cloning)

要将文字转化为“自己声音”的音频,需要用到语音克隆(Voice Cloning)技术。这种技术通常要求用户提供一定量的语音样本(几分钟到几小时不等),然后通过 AI 模型生成与你声音相似的音频。

2025-03-31 22:18:00 527

原创 多头注意力相比单头注意力的内涵是什么?

多头注意力是将多个单头注意力的结果`concat`在一起,例如`embedding`是`64`维的,`12`头就是`12x64=768`,那为什么不直接生成`768`维的特征向量做单头注意力呢?二者的区别到底是什么?

2025-03-17 08:53:01 768

原创 self.cls_token在 Vision Transformer (ViT) 模型中的训练阶段和推理阶段的行为和作用的异同

self.cls_token 在 Vision Transformer (ViT) 模型中,在训练阶段和推理阶段的行为和作用是不同的,而且它的值在训练过程中会发生变化。

2025-03-13 19:11:09 541

原创 Create a game that is a mixture of two classic games. Make it in pygame and make it look pretty.

Create a game that is a mixture of two classic games. Make it in pygame and make it look pretty.

2025-02-25 17:49:34 240

原创 深度学习图像预处理可视化:拆解Compose操作的全过程

深度学习图像预处理可视化:拆解Compose操作的全过程

2025-02-22 00:39:48 436

原创 ptflops——用于分析 PyTorch 模型计算复杂度

ptflops 是一个用于分析 PyTorch 模型计算复杂度的工具包,它可以帮助开发者快速了解模型的 FLOPs (Floating Point Operations) 和参数量,从而进行模型优化和选择。

2025-02-18 18:08:45 1493

原创 huggingface/pytorch-image-models

pytorch-image-models

2025-02-16 19:08:49 641

原创 信息量与信息熵

信息量与信息熵

2025-02-15 20:07:10 1739

原创 一口井深7米,一只蜗牛从井底往上爬每天爬3米掉下去1米,问几天能爬上井口?

一个井深7米,一只蜗牛从井底往上爬每天爬3米掉下去1米,问几天能爬上井口?

2025-02-15 20:05:40 1017

原创 CVPR论文阅读优先级建议

CVPR论文阅读优先级建议

2025-02-15 20:04:07 841 1

原创 什么是调制?

调制(Modulation)是指在通信和信号处理中,将信息(如数据、声音、图像等)嵌入到载波信号中,以便通过传输介质(如空气、光纤、电缆等)传递的过程。通过调制,信息可以更有效地传输,并且可以减少噪声和干扰的影响。在不同的领域,调制的具体应用和形式会有所不同。

2025-02-11 13:58:24 949

原创 CVPR论文批量下载方法

CVPR论文批量下载方法

2025-02-10 16:53:51 344

原创 关于QKV

QKV的理解

2025-01-12 09:23:53 978

原创 CLIP (Contrastive Language-Image Pre-training)用途及使用方法

CLIP (Contrastive Language-Image Pre-training) 是由 OpenAI 开发的多模态模型,可以同时处理图像和文本。

2025-01-01 21:07:21 333

原创 ultralytics中rtdetr的.pt模型转onnx

ultralytics中rtdetr的.pt模型转onnx

2025-01-01 21:01:34 362

原创 Linux指令

Linux指令

2025-01-01 20:59:48 335

原创 pytorch打印每层的输出尺寸

pytorch打印每层的输出尺寸

2025-01-01 20:58:58 301

原创 URL Moniker API

urlmon 是指 URL Moniker API,它是 Microsoft Windows 操作系统中的一部分,通常用于处理 URL 和相关的任务。

2025-01-01 20:58:07 502

原创 PyTorch的torch.onnx.export函数导出包含多个输出的模型

PyTorch的torch.onnx.export函数导出包含多个输出的模型

2025-01-01 20:57:03 884

原创 ffmpeg指令

ffmpeg指令

2025-01-01 20:55:34 827

原创 Wndows bat将一个目录下所有子文件夹的路径导出到txt文本

Wndows bat将一个目录下所有子文件夹的路径导出到txt文本

2025-01-01 20:55:05 843

原创 Microsoft Visual Studio中的/MT, /MTd,/MD,/MDd分别是什么意思?

Microsoft Visual C++ 编译器的运行时库链接选项决定了程序如何链接 C 运行时库(CRT)。具体含义如下:(多线程静态链接):(多线程静态链接调试版):(多线程动态链接):(多线程动态链接调试版):选择考虑因素:发布类型:通常 Release 版本用或,Debug 版本用或。部署需求:如果希望程序独立运行,选择;如果允许依赖系统 DLL,可选择。内存使用:可能在多个程序间共享内存,而每个程序都有自己的 CRT 副本。兼容性:使用第三方库时,需确保所有组件使用相同的运行时库选

2025-01-01 20:53:18 1205

原创 pytorch语义分割内置模型

pytorch语义分割内置模型

2024-10-13 21:20:00 347

原创 torchvision内置模型maskrcnn

torchvision内置模型maskrcnn

2024-10-07 16:04:08 342

原创 使用钩子函数的方式提取视觉特征

通过注册钩子函数,可以在模型的计算过程中插入需要执行的任意代码片段。在视觉特征提取过程中可以根据模型的结构,将正向钩子函数注册到指定的层中,然后通过读取该层的输入或输出数据,将视觉特征提取出来。

2024-10-02 22:36:15 240

原创 使用pytorch进行迁移学习的两个步骤

迁移学习一般都会使用两个步骤进行训练:1. 固定预训练模型的特征提取部分,只对最后一层进行训练,使其快速收敛;2. 使用较小的学习率,对全部模型进行训练,并对每层的权重进行细微的调节。

2024-10-02 16:46:15 502

原创 使用torchvision中的模型进行预测

使用torchvision中的模型进行预测

2024-10-01 16:38:42 263

原创 python logging包的用法

python logging包的用法

2024-10-01 16:38:09 460 1

原创 hasattr

在Python中,`hasattr`函数用于检查一个对象是否具有指定名称的属性或方法。这个函数的用法非常简单,它接收两个参数:对象和属性名(以字符串形式传递),并返回一个布尔值,表示对象是否具有该属性或方法。

2024-10-01 16:37:35 295

原创 Python中异常的用法

Python中异常的用法

2024-10-01 16:36:40 290

原创 Python定义函数时可以为参数指定名称、类型提示和默认值

Python定义函数时可以为参数指定名称、类型提示和默认值

2024-10-01 16:36:10 1257

原创 Python中使用一个和两个星号*/**作为函数参数的用法

Python中使用一个和两个星号*/**作为函数参数的用法

2024-10-01 16:35:48 249

原创 argparse用法示例

argparse用法示例

2024-10-01 16:35:17 967

原创 将onnx模型中的类别信息导出到文本

将ONNX模型中的类别信息导出到txt

2024-10-01 16:34:34 333

原创 使用PyTorch优化一个边缘检测器

使用PyTorch优化一个边缘检测器

2024-09-22 09:45:04 468

原创 PyTorch构建模型的三大类方法

PyTorch构建模型的三大类方法

2024-09-19 23:13:06 568

原创 pytorch优化器

在反向传播计算完所有参数的梯度后,还需要使用优化方法更新网络的权重和参数。

2024-09-17 09:21:15 244

原创 PyTorch数据处理

pytorch数据处理

2024-09-17 09:20:50 231

原创 torchvision

【代码】torchvision。

2024-09-17 09:20:21 232

原创 pytorch持久化

在pytorch中以下对象可以持久化到硬盘,并能通过相应的方法加载到内存:Tensor、Variable、nn.Module、Optimizer

2024-09-17 09:19:38 363

pytorch + torchvision + resnet + finetune + dataset

使用pytorch进行迁移学习的两个步骤 https://blog.csdn.net/liugan528/article/details/142677923

2024-10-02

为什么有的视频在Windows上不能显示缩略图?因为少了编解码器包 安装一个K-Lite Codec Pack吧

K-Lite_Codec_Pack_1855_Mega.exe,丰富Windows的编解码器包,解决有些格式的视频、图片在Windows下不显示缩略图的问题。 http://www.codecguide.com/download_kl.htm

2024-09-24

yuvplayer.exe

图像查看器,支持YUV各种格式、支持RGB各种格式。

2024-04-15

yolov5-obb保姆级教程

yolov5-obb保姆级教程

2023-06-05

roLabelImg.exe

https://github.com/cgvict/roLabelImg/blob/master/README.rst 对应的编译好的windows端可执行文件。

2023-05-04

mask-wearing data for yolov8

开源数据集roboflow上戴口罩检测,适用于yolov8 https://public.roboflow.com/object-detection/mask-wearing/4

2023-03-20

CMake关于ctest的示例

建议多参考官方文档:https://cmake.org/cmake/help/latest/manual/ctest.1.html?highlight=ctest

2022-05-31

CMakeLists.txt编写示例

CMake入门级范例,针对相对简单的工程管理。

2022-05-22

cifar10_multi_gpu_train.py

TensorFlow多GPU训练官方示例,绝壁不是草泥马写个CUDA_VISIBLE_DEVICES就可以解决的事情。整体思路关键是求变量在各个GPU上的梯度平均值,然后用梯度平均值去更新变量。

2020-11-29

黄金分割算法

黄金分割算法

2013-12-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除