音声ファイルサイズ計算機とは?
このツールは、録音時の4つの基本パラメーター(サンプリングレート、ビット深度、チャンネル数、再生時間)から非圧縮(PCM/WAV)音声ファイルの容量を見積もります。非圧縮音声は1サンプルごとに決まったビット数で記録されるため、サイズは計算だけで正確に予測できます。これは、コーデックや音の内容によってサイズが変わるMP3・AAC・FLACなどの圧縮形式とは大きく異なる点です。
使い方
まずサンプリングレートをHz単位で入力します(CD品質は44,100 Hz、プロ向けでは48,000 Hzや96,000 Hzがよく使われます)。次にビット深度を選び(CDは16ビット、スタジオ制作では24ビット)、チャンネル数を指定します(1はモノラル、2はステレオ、6は5.1ch、8は7.1ch)。最後に再生時間を秒単位で入力してください。結果はメガバイトで表示され、その下にバイト・キロバイト・ビットレートも併せて確認できます。
計算式の仕組み
1秒あたりのデータ量は サンプリングレート × ビット深度 × チャンネル数 で求められます。これに再生時間を掛けると総ビット数になり、さらに8で割るとビットからバイトへ変換できます。
$$\text{サイズ(バイト)} = \frac{\text{サンプリングレート} \times \text{ビット深度} \times \text{チャンネル数} \times \text{再生時間}}{8}$$
1024で割ればキロバイト、1024²で割ればメガバイトになります。
計算例
3分(180秒)のCD品質ステレオ音源で計算してみましょう。$$44{,}100 \times 16 \times 2 \times 180 \div 8 = 31{,}752{,}000 \text{バイト} \approx 30.28 \text{ MB}$$ となります。ビットレートは $$44{,}100 \times 16 \times 2 \div 1000 = 1{,}411.2 \text{ kbps}$$ で、これがCD音源でおなじみの「1411 kbps」です。
主要なオーディオ用語の説明
- サンプリングレート (Hz)
- 連続的なアナログ信号をデジタルに変換する際に、1秒間に取得される振幅測定値(サンプル)の数。ヘルツ (Hz) またはキロヘルツ (kHz) で測定されます。ナイキスト定理により、サンプリングレート \(f_s\) は \(f_s/2\) までの周波数を正確に表現できるため、44.1 kHz では約 22.05 kHz までのオーディオをキャプチャできます。
- ビット深度 (ビット/サンプル)
- 個別のサンプルを符号化するために使用されるビット数。ビット深度が高いほど、振幅分解能が高くなり、ダイナミックレンジが広がります。これは大体 \(6.02 \times n\) dB(\(n\) はビット数)になります。16 ビットで約 96 dB、24 ビットで約 144 dB となります。
- チャンネル
- 保存される独立したオーディオストリームの数。モノラルは 1 チャンネル、ステレオは 2 チャンネル、サラウンドフォーマットは 6 チャンネル(5.1)または 8 チャンネル(7.1)を使用します。ファイルサイズはチャンネル数に比例して増加します。各チャンネルが独自のサンプルを保存するためです。
- PCM(パルスコード変調)
- 信号の振幅を均一な間隔で記録することで、非圧縮オーディオをデジタルで表現する標準的な方法。PCM は、非圧縮フォーマットが直接保存するオーディオの生データです。
- WAV(波形オーディオファイル形式)
- 一般的にサンプリングレート、ビット深度、チャンネル数を説明するヘッダーメタデータとともに非圧縮 PCM オーディオを含むコンテナフォーマット。生のサンプルを保存するため、WAV のサイズはそのパラメータから完全に予測可能です。
- ビットレート (kbps)
- オーディオ 1 秒あたりのデータ量(キロビット毎秒単位)。非圧縮 PCM の場合、\(\text{サンプリングレート} \times \text{ビット深度} \times \text{チャンネル数}\) に等しくなります。例えば、CD オーディオは \(44100 \times 16 \times 2 = 1{,}411{,}200\) ビット/秒、つまり 1,411 kbps です。
- バイトとビット
- ビットは最小のデジタルデータ単位(0 または 1)で、バイトは 8 ビット。ビットレートは通常ビット毎秒で表示され、ファイルサイズはバイトで表示されます。これが、サイズ計算式がビット合計を 8 で割る理由です。
- 非圧縮対非可逆圧縮
- 非圧縮オーディオ(PCM/WAV)はすべてのサンプルをそのまま保存し、完全な忠実度を提供しますが、ファイルサイズが大きくなります。非可逆フォーマット(MP3、AAC)は、聞こえない、またはあまり重要でないデータを破棄してファイルを縮小し、品質を多少トレードオフにして、はるかに小さいサイズを実現します。ロスレス圧縮(FLAC、ALAC)は品質を失わずにサイズを削減しますが、固定の PCM サイズ計算式に従いません。
よくある質問
MP3やAACにも使えますか? いいえ。これらは非可逆圧縮を使うため、サイズはエンコーダーが目標とするビットレートで決まり、生データの単純計算では求められません。本ツールは非圧縮PCM(WAV/AIFF)を対象としています。
なぜ8で割るのですか? ビット深度は「ビット」単位ですが、ファイルサイズは「バイト」単位で表すためです。1バイト=8ビットだからです。
実際のWAVは少し大きくなりますか? はい。WAVには約44バイトのヘッダーが付きますが、通常の長さのファイルではほぼ無視できる差です。