留意_yl-CSDN博客

原创【模型量化】入门学习笔记

此外，尾数存在一个隐含的前置值 1，即实际尾数为1+小数部分，因此，尾数的有效范围为 [1.0,1.99999988]，即在 [1, 2) 之间。在模型训练及保存阶段，参数常以float32的形式存在，具备较高的数据精度及训练稳定性，但float32的模型占用空间较大，且高精度在推理阶段对模型性能的提升往往有限。具体来说，指数值的范围从原本的 [0, 255]（即 8 位二进制的最大值）被转换为 [-126, 127]，使得最终的数值范围可以覆盖更大的数量级，从而扩展到[精度降低后的模型大小。

2025-04-24 15:17:37 457

原创【Masked Spectrogram Prediction for Unsupervised Domain Adaptation in Speech Enhancement】

domain adaptation

2024-09-08 21:59:57 141

原创【self-supervised learning for speech enhancement】

自监督/无监督/域自适应语音增强方法

2024-09-08 21:56:11 166

原创【import error, version ‘GLIBCXX_3.4.26‘ not found】

在导入librosa时报错，本来我以为是torchaudio和librosa版本冲突，因为我发现两者只要是先导入torchaudio再导入librosa就回报这个错，如果调换顺序先导入librosa再导入torchaudio或者只导入librosa就不会有这个问题，因此我首先换了一个环境来找到torchaudio和librosa同时导入而不会报错的版本，并把当前环境的两个包的版本都替换了，但仍然在报错。但是我并不明白为什么重装scipy就可以解决，对原理不太懂，有知道的大佬可以解答一下。

2024-06-29 23:45:47 341

原创【comet_ml报错COMET ERROR: Run will not be logged】

出现错误的原因是comet和服务器握手失败，可以通过修改为本地实验避开这个问题。然后所有信息会保存到本地。

2024-06-15 21:43:57 603

原创【conda虚拟环境误删！！！】

今天想给虚拟环境重命名，中途混淆了conda命令，差点以为自己将虚拟环境全部删掉了，记录这次小乌龙，给虚拟环境导出并备份是很重要的！！

2024-06-12 23:44:34 890

原创 REMIXED2REMIXED: DOMAIN ADAPTATION FOR SPEECH ENHANCEMENT BY NOISE2NOISE LEARNING WITH REMIXING

本文提出了一种基于域适应的语音增强方法Remixed2Remixed。该方法采用Noise2NOise(N2N)学习使在人工合成的数据（out-of-domain,OOD,域外数据）上训练的模型更好地该方法采用Noise2Noise ( N2N )学习来适应在人工生成的带噪-干净语音对( out-of-domain：OOD )数据上训练的模型更好地分离真实带噪语音（in-domain，域内数据）。

2024-04-28 20:23:42 861 2

原创【语音增强评价指标】

语音增强指标介绍

2023-10-16 21:24:14 3087 1

原创【文件误删】

文件误删

2023-09-17 15:12:05 191 1

原创【torch.nn.DataParallel】

DataParallel数据报错

2023-09-07 11:28:58 435 2

原创获取DNS2020 testset

获取DNS2020 挑战赛测试集

2023-09-03 10:38:13 370

原创【MetricGAN系列】

MetricGAN系列

2023-08-31 12:00:01 627 1

原创无监督语音分离MixIT

在已经有模型能分离出目标数目（假设为2）的语音的条件下，使输出语音顺序固定，计算出Ground truth所有可能的排列，将每个排列内的语音和输出语音一一对应计算距离作为该组排列的loss，计算出每组排列的loss，最小loss的作为最终答案更新网络。对于speaker separation来说，假设输入语音包含两个说话人，那么输出应是两条分开的语音，而ground truth也是两条语音，他们都没有特定的顺序，那么如何对齐训练后输出语音和ground truth呢？提出时间： 2017。

2023-07-23 20:31:49 630