音频处理_audiocool的博客-CSDN博客

音频处理

关注

关注数：文章数：11 文章阅读量：64666 文章收藏量：217

作者: audiocool

专注于音频数字信号处理领域，掌握语音降噪，回声消除，啸叫抑制，均衡器，自动增益，限幅器等音频前级处理算法。熟悉数字麦克风阵列波束处理，数字音频水印等。欢迎志同道合的朋友一起探讨！

展开

专栏收录文章

语音编解码G.711 G.729

1. 语音编码分类（1）波形编码: 以逼近声音波形为目标，其代表算法有G.711,其声音清楚度好，语音的自然度高，但是压缩效率比较差，常在32kbps以上。（2）参数编码: 将人的声道抽象成一个发声模型，对这个模型的参数进行编码，其特点是压缩效率高，但是自然度比较差，能够以极低速率进行编码。（3）波形参数混合编码: 结合了波形编码和参数编码的优点，代表算法有G.723, G.729等，能够在4-16kbps速率进行高质量语音合成。2. G.711 也称为PCM（脉冲编码调制...

转载 2020-05-27 18:12:30 · 2225 阅读 · 0 评论
Audition人声美化

聲音的「壓限」、「均衡」、「混響」是做好人聲的關鍵。１Ultrafunk fx: Equalizer R3（均衡）聲音過暗會感覺吐詞含糊不清，聲音過亮，會有爆音現象。要處理好這些，均衡的作用就大了。頻段5–增益：6.5 dBRe: 很簡單的設定，加6.5dB就對了^^２BBE Sonic Maximizer（激勵）當BBE和均衡器同時使用的時候，一般來說，應該把BBE放在均衡的後面。此過程目的是為了調節所錄人聲的高音和低音部分，使聲音顯得更加清晰明亮或是厚重。激勵的作用就是產生諧波，對聲

原创 2020-05-19 15:11:30 · 5779 阅读 · 0 评论
直流分量的危害

正常情况下，音频的系统的输入和输出都是交流信号，不存在直流分量。有时系统的输出出现了直流分量。这时便可以认为发生了直流偏置。使用积分能够反映出一段时间的音频信号是否出现直流偏移，如果积分等于0，就不存在直流偏移，否则就存在直流偏移。如下图红色标注的位置，代表当前信号有直流分量。直流偏移的危害：...

转载 2020-03-12 11:13:11 · 6068 阅读 · 0 评论
kaldi运行timit

1、下载timit数据，将数据解压在egs/timit/data 目录下2、打开s5目录，编辑run.sh 如下（根据timit数据存放的目录修改）：echo ============================================================================echo " Data & Lexico...

原创 2019-04-09 20:07:35 · 1174 阅读 · 1 评论
Sphinx语音识别

一、语音识别简介语音识别的一般框架一般包含几个部分：声学模型、语音模型、以及词典。语音信号（波形）经过前级处理（包括降噪，语音增强，人声检测等）后，提取特征，送入解码模块，进行解析得到识别结果。而解码模块则由声学模型、语言模型映射、链接组成的网络。目前主流的语音模型一般采用 n-gram 语言模型，声学模型采样隐马尔科夫模型（HMM），这些模型都需要经过预先训练得到。 ...

原创 2018-08-07 10:28:53 · 3649 阅读 · 0 评论
MFCC特征提取

一、MFCC概述在语音处理领域里，梅尔频率倒谱(mel-frequency cepstrum简称MFC)表示一个语音的短时功率谱，是一个语音的对数功率谱在频率的一个非线性梅尔刻度上进行线性余弦转换所得，而所有的梅尔频率倒谱系数(Mel-frequency cepstral coefficients 简称MFCC)共同的组成一个MFC。 mfcc是为了完成声音识别而开发出来的一套算法...

原创 2018-07-02 15:37:22 · 12645 阅读 · 2 评论
webrtc 单通道降噪算法（ANS）简析

WebRtcNs_ProcessCore 降噪处理核心函数1、分为高频、低频子带进行处理，采样率为8-16K时，一般只用到低频处理。2、计算输入带噪语音数据帧的能量值。3、FFT傅里叶变换4、计算维纳滤波增益，通过直接判决法计算先验信噪比。 theFilter=snrPrior / (self->overdrive+ snrPrior);5、对维纳增益值根据用户设置的降噪等级，进行下溢与上...

原创 2018-06-26 11:10:06 · 12998 阅读 · 0 评论
Win7搭建HTK语音识别平台

Step 1下载 HTK 和 HTK – samples 两个压缩文件，保存至D盘根目录下新建的HTK文件夹。下载地址：http://htk.eng.cam.ac.uk/download.shtml我下载的版本：3.4.1遇到问题：（1）HTK官方网站需要先注册（2）（chrome浏览器）注册后下载速度为0。解决办法：点“取消下载”，再点“重新下载”。Step 2观察下载的文件夹里都有些什么：在解...

转载 2018-06-21 17:37:05 · 773 阅读 · 0 评论
AAC编解码（一）

一、ADTS格式：ADTS的全称是Audio Data Transport Stream。是AAC音频的传输流格式。1. adts_sequence(){ while (nextbits() == syncword) { adts_frame(); }}2. adts_frame(){ adts_fixed_header(); adts_variable_header(); if (number_...

原创 2018-03-29 11:31:17 · 6610 阅读 · 0 评论
各类滤波器比较 &&卷积理解

巴特沃斯滤波器、切比雪夫滤波器、贝塞尔滤波器均包括模拟滤波器和数字滤波器两种形式。　　数字滤波器是指完成信号滤波处理功能的，用有限精度算法实现的离散时间线性非时变系统，其输入是一组数字量，其输出是经过变换的另一组数字量。因此，它本身即可以是用数字硬件装配成的一台完成给定运算的专用数字计算机，也可以是将所需运算编成程序，让通用计算机来执行。数字滤波器具有稳定性高、精度高、灵活性大等优点。随着数字技术...

转载 2018-03-28 11:02:59 · 5461 阅读 · 0 评论
预加重/去加重/直流滤波

预加重(Pre-emphasis)：输入信号高频分量的提升。去加重(De-emphasis) ：解调后对高频分量的压低。一般预加重与去加重需配合使用。speex中处理：设第n时刻的语音采样值为x(n)，经过预加重处理后的结果是y(n)=x(n)-ax(n-1)去加重处理与预加重处理相反：y(n) = x(n) + ax(n-1)其中a为加重系数，一般是0.9~1.0

原创 2017-12-07 11:46:49 · 7285 阅读 · 1 评论

音频处理

作者: audiocool

语音编解码G.711 G.729

Audition人声美化

直流分量的危害

kaldi运行timit

Sphinx语音识别

MFCC特征提取

webrtc 单通道降噪算法（ANS）简析

Win7搭建HTK语音识别平台

AAC编解码（一）

各类滤波器比较 &amp;&amp;卷积理解

预加重/去加重/直流滤波

各类滤波器比较 &&卷积理解