什么是音频文件大小计算器?
这款计算器可以根据四个基本录音参数——采样率、位深度、声道数和时长——估算未压缩(PCM/WAV)音频文件的大小。由于未压缩音频会为每个采样点存储固定的位数,因此它的容量完全可以精确推算出来;这一点与 MP3、AAC、FLAC 等压缩格式不同,后者的大小取决于编码器和音频内容本身。
使用方法
输入以 Hz 为单位的采样率(CD 音质为 44,100 Hz,专业音频常用 48,000 或 96,000 Hz),选择位深度(CD 用 16 位,录音棚制作用 24 位),设置声道数(1 为单声道,2 为立体声,6 为 5.1 环绕,8 为 7.1 环绕),再填入以秒为单位的时长。计算结果会以兆字节(MB)显示,下方还会同时列出字节数、千字节数和原始比特率。
公式解析
每秒的数据量等于采样率 × 位深度 × 声道数。乘以时长即可得到总位数,再除以 8 就能把位(bit)换算成字节(byte):
$$\text{文件大小(字节)} = \frac{\text{采样率} \times \text{位深度} \times \text{声道数} \times \text{时长}}{8}$$
结果除以 1024 即为千字节(KB),除以 1024² 即为兆字节(MB)。
实例演算
以一段 3 分钟(180 秒)的 CD 音质立体声音轨为例:$$44{,}100 \times 16 \times 2 \times 180 \div 8 = 31{,}752{,}000 \text{ 字节} \approx 30.28 \text{ MB}$$它的比特率为 $$44{,}100 \times 16 \times 2 \div 1000 = 1{,}411.2 \text{ kbps}$$也就是人们常说的 CD 音频经典码率「1411 kbps」。
关键音频术语解释
- 采样率 (Hz)
- 将连续模拟信号转换为数字时,每秒采取的幅度测量(采样)数量。单位为赫兹 (Hz) 或千赫兹 (kHz)。根据奈奎斯特定理,采样率 \(f_s\) 可以准确表示最高 \(f_s/2\) 的频率,因此 44.1 kHz 可以捕捉约 22.05 kHz 以下的音频。
- 位深度 (bits/sample)
- 用于编码每个单独采样的比特数。更高的位深度意味着更精细的幅度分辨率和更大的动态范围 — 对于 \(n\) 比特,大约为 \(6.02 \times n\) dB。16 位约为 96 dB;24 位约为 144 dB。
- 通道
- 存储的独立音频流的数量。单声道为 1 个通道,立体声为 2 个,环绕声格式使用 6 个 (5.1) 或 8 个 (7.1)。文件大小与通道数成线性关系,因为每个通道都存储自己的采样。
- PCM (脉冲编码调制)
- 通过以均匀时间间隔记录信号幅度来以数字方式表示未压缩音频的标准方法。PCM 是未压缩格式直接存储的原始音频数据。
- WAV (波形音频文件格式)
- 一种常见的容器格式,通常包含未压缩的 PCM 音频以及描述采样率、位深度和通道的头部元数据。因为它存储原始采样,WAV 大小完全可以从其参数预测。
- 比特率 (kbps)
- 每秒音频的数据量,单位为千比特每秒。对于未压缩的 PCM,它等于 \(\text{采样率} \times \text{位深度} \times \text{通道数}\)。例如,CD 音频为 \(44100 \times 16 \times 2 = 1{,}411{,}200\) 比特/秒,或 1,411 kbps。
- 字节与比特
- 比特是最小的数字数据单位(0 或 1);字节为 8 比特。比特率通常以每秒比特数为单位,而文件大小通常以字节为单位 — 这就是为什么大小公式将比特总数除以 8。
- 未压缩与有损
- 未压缩音频 (PCM/WAV) 准确存储每个采样,提供完整保真度但文件较大。有损格式 (MP3、AAC) 丢弃不可听或较不重要的数据以缩小文件,用一些质量换取更小的大小。无损压缩 (FLAC、ALAC) 以无质量损失的方式减少大小,但不遵循此固定的 PCM 大小公式。
常见问题
这适用于 MP3 或 AAC 吗?不适用。这两种格式采用有损压缩,其文件大小取决于编码器设定的目标比特率,而不是原始采样的数学计算。本工具仅适用于未压缩的 PCM 格式(WAV/AIFF)。
为什么要除以 8?位深度以「位(bit)」为单位,而文件大小以「字节(byte)」为单位,1 字节 = 8 位,所以需要除以 8。
实际的 WAV 文件会稍大一些吗?是的。WAV 文件头大约会多出 44 字节,但对于任何正常时长的文件来说,这点差异都可以忽略不计。