Python0018 音频处理（一）音频基础知识_python对wav处理更容易识别-CSDN博客

本文链接：https://blog.csdn.net/Moluth/article/details/79793903

本文介绍了音频处理的基础知识，包括声音的产生、采样率、采样大小、声道等概念。讲解了人耳能听到的频率范围以及音色的影响，并提供了Python读取和写入.wav音频文件的代码示例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Python0018 音频处理（一）音频基础知识

1.声音音频基础知识

（1）声音是由震动产生，表现为波的形式。波有频率，振幅等参数。对于声波而言：频率越大，音调越高，反之越低。振幅越大，声音越大，反之越小。

（2）采样率，帧率：波是连续（无穷）的，计算机存储是离散（有限）的。要想用有限存储无限，几乎不可能。因此，要每隔一段时间对波进行一次采样。每秒采样次数采样率。长用采样率是44.1kHz(这里的1k不是1024，是1000！！！切记。)。

（3）采样大小，采样宽度：波每一个时刻都有一个对应的能量值，在计算机中用整数存储。通常使用16bit有符号整数存储，采样大小是16bit。

（4）声道：这个不好解释，引用百度百科上的一句话。声道(Sound Channel) 是指声音在录制或播放时在不同空间位置采集或回放的相互独立的音频信号，所以声道数也就是声音录制时的音源数量或回放时相应的扬声器数量。

（5）人耳能听到的声波频率范围是20Hz ~20000Hz，人耳对160Hz~2500Hz的声音比较敏感。

（6）音色：不同物体发音有所不同，这些不同表现在音色上。音色在音频曲线级别的表现是频率的特定变化，振幅的特定变化。

2.python读取.wav音频

下面是python3读取音频代码，详细说明都在注释里。

import wave
import struct

wave_file=wave.open("./sound111.wav", 'r')
channels=wave_file.getnchannels()#声道数
samp_width=wave_file.getsampwidth()#采样大小
frame_rate=wave_file.getframerate()#帧率
numframes=wave_file.getnframes(