解析WAV音频文件----》生成WAV音频文件头

最新推荐文章于 2024-07-16 15:50:55 发布

南国以南i

最新推荐文章于 2024-07-16 15:50:55 发布

阅读量1.1k

点赞数 1

分类专栏： Audio SpringBoot 文章标签： java

本文链接：https://blog.csdn.net/springhub/article/details/108298732

版权

SpringBoot 同时被 2 个专栏收录

24 篇文章

订阅专栏

Audio

2 篇文章

订阅专栏

本文深入探讨了WAV音频文件格式，包括其历史背景、特点以及如何正确截取WAV文件而不影响播放。介绍了生成WAV头部文件所需参数及代码实现，强调了与MP3格式的不同。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

请各大网友尊重本人原创知识分享，谨记本人博客：南国以南i、

WAV音频文件介绍：

WAV文件是在PC机平台上很常见的、最经典的多媒体音频文件，最早于1991年8月出现在Windows3.1操作系统上，文件扩展名为WAV，是WaveForm的简写，也称为波形文件，可直接存储声音波形，还原的波形曲线十分逼真。WAV文件格式简称WAV格式是一种存储声音波形的数字音频格式，是由微软公司和IBM联合设计的，WAV文件还原而成的声音的音质取决于声音卡采样样本的尺寸，采样频率越高，音质就越好，但开销就越大，WAV文件也就越大。

对WAV音频文件截取说明：

WAV文件不像MP3格式音频文件，对一段完整的MP3格式音频做任意截取是完全OK的，音频文件依然可以播放，因为MP3音频格式文件每一部分截取它都带有音频头文件信息，但对一段完整的WAV音频文件做部分截取，截取出来的音频文件是无法播放的，除非截取的是从第一位开始截取，截取的数据已经包含的头文件，否则文件无法解析播放。

生成WAV头部文件需要四个参数（附代码说明）：

注：获取WAV音频信息参数
一、声道数、

二、采样率、

三、采样精度

四、音频数据总长度、

/**
     * @param totalAudioLen  不包括header的音频数据总长度
     * @param longSampleRate 采样率,也就是录制时使用的频率、音频采样级别 8000 = 8KHz
     * @param channels       audioRecord的声道数1/2
     * @param audioFormat    采样精度; 譬如 16bit
     * @throws IOException 写文件错误
     */
    private static byte[] writeWavFileHeader(long totalAudioLen, long longSampleRate,
                                             int channels, int audioFormat) throws IOException {
        byte[] header = generateWavFileHeader(totalAudioLen, longSampleRate, channels,audioFormat);
        return header;
    }

    /**
     * @param totalAudioLen  不包括header的音频数据总长度
     * @param longSampleRate 采样率,也就是录制时使用的频率
     * @param channels       audioRecord的频道数量
     * @param audioFormat    采样精度; 譬如 16bit
     */
    private static byte[] generateWavFileHeader(long totalAudioLen, long longSampleRate, int channels,int audioFormat) {
        long totalDataLen = totalAudioLen + 36;
        long byteRate = longSampleRate * 2 * channels;
        byte[] header = new byte[44];
        header[0] = 'R'; // RIFF
        header[1] = 'I';
        header[2] = 'F';
        header[3] = 'F';
        //文件长度  4字节文件长度，这个长度不包括"RIFF"标志(4字节)和文件长度本身所占字节(4字节),即该长度等于整个文件长度 - 8
        header[4] = (byte) (totalDataLen & 0xff);
        header[5] = (byte) ((totalDataLen >> 8) & 0xff);
        header[6] = (byte) ((totalDataLen >> 16) & 0xff);
        header[7] = (byte) ((totalDataLen >> 24) & 0xff);
        //fcc type：4字节 "WAVE" 类型块标识, 大写
        header[8] = 'W';
        header[9] = 'A';
        header[10] = 'V';
        header[11] = 'E';
        //FMT Chunk   4字节 表示"fmt" chunk的开始,此块中包括文件内部格式信息，小写, 最后一个字符是空格
        header[12] = 'f'; // 'fmt '
        header[13] = 'm';
        header[14] = 't';
        header[15] = ' ';//过渡字节
        //数据大小  4字节，文件内部格式信息数据的大小，过滤字节（一般为00000010H）
        header[16] = 16;
        header[17] = 0;
        header[18] = 0;
        header[19] = 0;
        //编码方式 10H为PCM编码格式   FormatTag：2字节，音频数据的编码方式，1：表示是PCM 编码
        header[20] = 1; // format = 1
        header[21] = 0;
        //通道数  Channels：2字节，声道数，单声道为1，双声道为2
        header[22] = (byte) channels;
        header[23] = 0;
        //采样率，每个通道的播放速度
        header[24] = (byte) (longSampleRate & 0xff);
        header[25] = (byte) ((longSampleRate >> 8) & 0xff);
        header[26] = (byte) ((longSampleRate >> 16) & 0xff);
        header[27] = (byte) ((longSampleRate >> 24) & 0xff);
        //音频数据传送速率,采样率*通道数*采样深度/8
        //4字节，音频数据传送速率, 单位是字节。其值为采样率×每次采样大小。播放软件利用此值可以估计缓冲区的大小
        //byteRate = sampleRate * (bitsPerSample / 8) * channels
        header[28] = (byte) (byteRate & 0xff);
        header[29] = (byte) ((byteRate >> 8) & 0xff);
        header[30] = (byte) ((byteRate >> 16) & 0xff);
        header[31] = (byte) ((byteRate >> 24) & 0xff);
        // 确定系统一次要处理多少个这样字节的数据，确定缓冲区，通道数*采样位数
        header[32] = (byte) (2 * channels);
        header[33] = 0;
        //每个样本的数据位数
        //2字节，每个声道的采样精度; 譬如 16bit 在这里的值就是16。如果有多个声道，则每个声道的采样精度大小都一样的；
        header[34] = (byte) audioFormat;
        header[35] = 0;
        //Data chunk
        //ckid：4字节，数据标志符（data），表示 "data" chunk的开始。此块中包含音频数据，小写；
        header[36] = 'd';
        header[37] = 'a';
        header[38] = 't';
        header[39] = 'a';
        //音频数据的长度，4字节，audioDataLen = totalDataLen - 36 = fileLenIncludeHeader - 44
        header[40] = (byte) (totalAudioLen & 0xff);
        header[41] = (byte) ((totalAudioLen >> 8) & 0xff);
        header[42] = (byte) ((totalAudioLen >> 16) & 0xff);
        header[43] = (byte) ((totalAudioLen >> 24) & 0xff);
        return header;
    }