明瞭度と明瞭性(C50・C80・D50)
明瞭度は、音のエネルギーがどれだけ「早く」 — 音や音節を補強できるほど早く — 到達し、どれだけ「遅く」 — 残響のにじみに溶け込む — 到達するかを測ります。
残響時間は部屋がどれだけ長く鳴るかを示しますが、聞き取れるかどうかは示しません。RT60 が中程度でも、初期エネルギーが優勢なら十分に明瞭になり、後部残響が優勢ならこもります。明瞭度と明瞭性は、インパルス応答を時間の境界で分け、両側のエネルギーを比べることで、このバランスを数値にします。
C50 — 音声明瞭度
C50 は、最初の 50 ミリ秒のエネルギーと、それ以降の全エネルギーの比(デシベル)です。
C50 = 10·log₁₀( 初期エネルギー (0〜50 ms) / 後期エネルギー (>50 ms) )
50 ミリ秒は、耳が初期反射を直接音と 1 つのより大きく明瞭な事象に融合する、おおよその時間窓です(先行音効果、ハース効果)。それより遅く到達するエネルギーは別個の残響として聞こえ、次の音節をマスクします。
- 高い C50(正、数 dB)— 子音がくっきり保たれ、会話・台詞・講演に向きます。
- 低い C50(負)— 尾が直接音を覆い、音声がにじんで明瞭度が落ちます。
C80 — 音楽明瞭度
C80 は境界を 80 ミリ秒にします。音楽は音声より残響の溶け合いを許容し、しばしば求めるため、初期窓を広げます。
C80 = 10·log₁₀( 初期エネルギー (0〜80 ms) / 後期エネルギー (>80 ms) )
C80 はコンサートホールの標準的な明瞭度指標です。ホール設計者は慎重に整えます。高すぎると音楽が乾いて分析的になり、低すぎると速いパッセージがぼやけます。
| C80 | 音楽的な印象 |
|---|---|
| > +4 dB | 乾いて分離がよく近い |
| 0 〜 +4 dB | 明瞭だが部屋に支えられる |
| −2 〜 0 dB | 残響が多く溶け合う |
| < −2 dB | にじんで不明瞭 |
D50 — 明瞭性
明瞭性(D50)は、同じ 50 ms の分割を比ではなく割合で表します。Deutlichkeit は同じ量を指すドイツ語の原語にすぎません。
D50 = 初期エネルギー (0〜50 ms) / 全エネルギー (パーセント)
D50 と C50 は同じ測定の 2 つの見方で、互いに直接変換できます。D50 は 0% から 100% までで、高いほどエネルギーの多くが早く到達し、部屋がより「明瞭」です。dB の比よりパーセントのほうが明瞭度として直感的だと感じる人も多くいます。
なぜ 3 つとも見るのか
3 つは少しずつ違う問いに答えます。C50 は音声、C80 は音楽、D50 は初期エネルギーの直感的な割合です。話し言葉に最適化した空間(高い C50、高い D50)は、オーケストラに最適化した空間(適度でバランスのよい C80)とは別物です。3 つすべてを見ることで、録音空間が単にどれだけ鳴るかではなく、実際に何に向くかを判断できます。
libsonare が明瞭度をどう算出するか
libsonare はインパルス応答の二乗を 50 ms と 80 ms の境界の両側で積分して初期エネルギーと後期エネルギーの和を作り、C50 と C80 を初期/後期比の 10·log₁₀ として、D50 を初期/全体の割合として報告します。積分はノイズフロアでの打ち切り点(Lundeby 法で求める。減衰が録音のノイズフロアに達する位置)で止めるため、残響テールの後ろに続く背景ノイズが後期エネルギーに数えられて明瞭度を引き下げることはありません。入力が通常の音楽のときはブラインドで復元した減衰に同じ境界を適用しますが、明瞭度はクリーンなインパルス応答から測るのが最も信頼できます。明瞭度は直接音の到達時刻に依存するため、解析はまず直接音のピークを特定し、それを基準に窓を測ります。直接音の位置を誤ると C50/C80/D50 を概算として扱うべき理由になり、信頼度スコアが低いときはなおさらです。
関連: 残響時間(RT60 と EDT), 音源距離と DRR, 逆問題による部屋推定, 音響解析