Skip to content

音源距離と DRR

1 本の録音から、libsonare は音源がマイクからどれだけ遠かったかを推定します。ただしどの方向かは分かりません。そこへ至る流れは、直接音/残響音比から部屋の臨界距離を経て、メートル単位の距離へとつながります。

DRR — 直接音/残響音比

直接音/残響音比(DRR) は、音源からまっすぐマイクに届く最初の波面である直接音のレベルを、それに続く残響エネルギーに対して表したもので、単位はデシベルです。

DRR = 10·log₁₀( 直接音エネルギー / 残響エネルギー )

DRR は距離の最も強い手がかりです。マイクを近づけると直接音が大きくなる一方、部屋の残響音場はおおむね一定のままなので DRR は上がります。離れると直接音が一定の残響レベルへ近づくため DRR は下がります。

  • 高い DRR — 近く、乾いて、存在感がある。音源が「目の前」にある。
  • 低い DRR — 遠く、にじむ。部屋が音を支配する。

これはまさに、慣れた部屋であなたの耳が距離を判断するときの手がかりです。だからこそ近接マイクのボーカルは親密に、遠いボーカルは「部屋の向こう」のように聞こえます。

臨界距離

臨界距離は、音源からの距離のうち、直接音と残響音場が「同じ大きさ」になる地点 — DRR が 0 dB になる距離です。

臨界距離より近ければ直接音が勝ち、音源は明瞭で定位します。遠ければ残響音場が勝ち、音は拡散して部屋に支配されます。臨界距離は部屋によって変わります。デッドな部屋(高い吸音、短い RT60)では遠くへ押し出され、かなり下がっても直接音が聞こえます。ライブな部屋では近くに引き寄せられ、数歩下がるだけで音源が残響に埋もれます。

おおまかに言えば、部屋の吸音が大きいほど残響音場は弱くなり、直接音はより遠くまで支配的なままになります。臨界距離は部屋の総吸音力(ザビーンの式の A。各面の吸音の度合いで重み付けした面積)の平方根に比例して大きくなります。これが、同じ話者が処理されたスタジオでは聞き取りやすく、大聖堂では同じ距離でもこもる理由です。

音源距離

これらを合わせると、測定した DRR を部屋の臨界距離を基準に参照することで、音源をリスナー/マイクからメートル単位の推定距離に置けます。DRR が 0 dB なら音源はちょうど臨界距離に、それより高ければ近くに、低ければ遠くになります。

限界は幾何にあります。1 チャンネルが運ぶのはエネルギー対時間という 1 つの数なので、等価な距離を 1 つ解けても方向の情報は一切ありません。そのためスキャナーは推定音源を点ではなく、推定半径でリスナーを囲む完全なシェル(球)として描きます。1 本のマイクが聞いた内容に対しては、その距離のあらゆる方向が等しく整合するからです。方向を求めるには少なくとも 2 チャンネルと、その間の時間差・レベル差が必要です。

さらなる帰結として、複数の実音源 — 複数の話者やバンド全体 — は 1 つの等価距離へまとめられます。1 チャンネルではそれらを分離できないためです。

libsonare が距離をどう推定するか

libsonare は(場合によってはブラインドで復元した)インパルス応答から直接音を残響の尾と分離し、両者のエネルギー比から DRR を作り、復元した容積と吸音から部屋の臨界距離を推定します。音源距離は拡散音場モデルにおける DRR と臨界距離の関係から得られます。モデルは単一チャンネルなので、結果は位置ではなく半径であり、可視化ではリスナーを囲む距離シェルとして描かれます。距離推定の信頼度は、直接音を尾からどれだけきれいに分離できたかに追従します。臨界距離をはるかに超えた音源は直接音が弱く、本質的に位置を求めにくくなります。

関連: 残響時間(RT60 と EDT), 部屋の形状と容積, 逆問題による部屋推定, 音響解析