- 博客(270)
- 资源 (4)
- 收藏
- 关注
原创 语音克隆(Voice Cloning)
要将文字转化为“自己声音”的音频,需要用到语音克隆(Voice Cloning)技术。这种技术通常要求用户提供一定量的语音样本(几分钟到几小时不等),然后通过 AI 模型生成与你声音相似的音频。
2025-03-31 22:18:00
527
原创 多头注意力相比单头注意力的内涵是什么?
多头注意力是将多个单头注意力的结果`concat`在一起,例如`embedding`是`64`维的,`12`头就是`12x64=768`,那为什么不直接生成`768`维的特征向量做单头注意力呢?二者的区别到底是什么?
2025-03-17 08:53:01
768
原创 self.cls_token在 Vision Transformer (ViT) 模型中的训练阶段和推理阶段的行为和作用的异同
self.cls_token 在 Vision Transformer (ViT) 模型中,在训练阶段和推理阶段的行为和作用是不同的,而且它的值在训练过程中会发生变化。
2025-03-13 19:11:09
541
原创 Create a game that is a mixture of two classic games. Make it in pygame and make it look pretty.
Create a game that is a mixture of two classic games. Make it in pygame and make it look pretty.
2025-02-25 17:49:34
240
原创 ptflops——用于分析 PyTorch 模型计算复杂度
ptflops 是一个用于分析 PyTorch 模型计算复杂度的工具包,它可以帮助开发者快速了解模型的 FLOPs (Floating Point Operations) 和参数量,从而进行模型优化和选择。
2025-02-18 18:08:45
1493
原创 一口井深7米,一只蜗牛从井底往上爬每天爬3米掉下去1米,问几天能爬上井口?
一个井深7米,一只蜗牛从井底往上爬每天爬3米掉下去1米,问几天能爬上井口?
2025-02-15 20:05:40
1017
原创 什么是调制?
调制(Modulation)是指在通信和信号处理中,将信息(如数据、声音、图像等)嵌入到载波信号中,以便通过传输介质(如空气、光纤、电缆等)传递的过程。通过调制,信息可以更有效地传输,并且可以减少噪声和干扰的影响。在不同的领域,调制的具体应用和形式会有所不同。
2025-02-11 13:58:24
949
原创 CLIP (Contrastive Language-Image Pre-training)用途及使用方法
CLIP (Contrastive Language-Image Pre-training) 是由 OpenAI 开发的多模态模型,可以同时处理图像和文本。
2025-01-01 21:07:21
333
原创 URL Moniker API
urlmon 是指 URL Moniker API,它是 Microsoft Windows 操作系统中的一部分,通常用于处理 URL 和相关的任务。
2025-01-01 20:58:07
502
原创 PyTorch的torch.onnx.export函数导出包含多个输出的模型
PyTorch的torch.onnx.export函数导出包含多个输出的模型
2025-01-01 20:57:03
884
原创 Microsoft Visual Studio中的/MT, /MTd,/MD,/MDd分别是什么意思?
Microsoft Visual C++ 编译器的运行时库链接选项决定了程序如何链接 C 运行时库(CRT)。具体含义如下:(多线程静态链接):(多线程静态链接调试版):(多线程动态链接):(多线程动态链接调试版):选择考虑因素:发布类型:通常 Release 版本用或,Debug 版本用或。部署需求:如果希望程序独立运行,选择;如果允许依赖系统 DLL,可选择。内存使用:可能在多个程序间共享内存,而每个程序都有自己的 CRT 副本。兼容性:使用第三方库时,需确保所有组件使用相同的运行时库选
2025-01-01 20:53:18
1205
原创 使用钩子函数的方式提取视觉特征
通过注册钩子函数,可以在模型的计算过程中插入需要执行的任意代码片段。在视觉特征提取过程中可以根据模型的结构,将正向钩子函数注册到指定的层中,然后通过读取该层的输入或输出数据,将视觉特征提取出来。
2024-10-02 22:36:15
240
原创 使用pytorch进行迁移学习的两个步骤
迁移学习一般都会使用两个步骤进行训练:1. 固定预训练模型的特征提取部分,只对最后一层进行训练,使其快速收敛;2. 使用较小的学习率,对全部模型进行训练,并对每层的权重进行细微的调节。
2024-10-02 16:46:15
502
原创 hasattr
在Python中,`hasattr`函数用于检查一个对象是否具有指定名称的属性或方法。这个函数的用法非常简单,它接收两个参数:对象和属性名(以字符串形式传递),并返回一个布尔值,表示对象是否具有该属性或方法。
2024-10-01 16:37:35
295
原创 pytorch持久化
在pytorch中以下对象可以持久化到硬盘,并能通过相应的方法加载到内存:Tensor、Variable、nn.Module、Optimizer
2024-09-17 09:19:38
363
pytorch + torchvision + resnet + finetune + dataset
2024-10-02
为什么有的视频在Windows上不能显示缩略图?因为少了编解码器包 安装一个K-Lite Codec Pack吧
2024-09-24
roLabelImg.exe
2023-05-04
mask-wearing data for yolov8
2023-03-20
CMake关于ctest的示例
2022-05-31
cifar10_multi_gpu_train.py
2020-11-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人