Skip to content

逆問題による部屋推定

録音から部屋を復元するのは逆問題です。順方向の音響は「この部屋があるとき、どう聞こえるか」を問いますが、libsonare はその逆 — 「この音があるとき、どんな部屋がそれを生んだか」 — を問います。推定モードと信頼度スコアは、その逆問題をどう解くか、そしてどこまで信じるかを左右する 2 つの要素です。

順方向と逆方向

順方向では、既知の部屋はそのインパルス応答(IR) — 空間内の完全で瞬間的なクリックの音で、直接音に加えてあらゆる反射と残響の尾を丸ごと含む — でとらえられます。それ以外(RT60、明瞭度、形状、吸音)はすべて、その 1 つの信号から導かれます。

逆問題はその流れを逆向きに走らせます。録音から減衰を復元し、減衰から部屋を推測します。それがどれだけうまくいくかは、録音が減衰をどれだけ明確に露出させているかに完全に依存します。2 つのモードはまさにこの点に関わります。

インパルス応答モード

インパルス応答モードでは、実質的にインパルス応答そのものに近い録音 — 手拍子、風船の破裂音、スターターピストル、再生したサインスイープ — を解析器に与えます。減衰がそのまま信号に露出して汚れていないため、推定は最も高精度になります。自分で録音できるときは必ずこのモードを使います。

アップロードしたファイルがこうしたクリーンな励起のときは「インパルス応答として扱う」を ON にします。すると解析器は尾を掘り出そうとせず、そのまま読み取ります。

ブラインドモード

ブラインドモードでは、入力は通常の素材 — 音楽、音声、フィールド録音 — で、部屋を露出させる意図がありません。クリーンなクリックはなく、残響は音源信号と絡み合っています。解析器は、尾が一瞬だけ単独で聞こえる音の隙間・ノートの切れ目・休符から、減衰をブラインドで復元しなければなりません。

ブラインド推定は、空間のランキングや可視化 — 2 つの部屋の比較、録音環境の把握 — には実際に有用ですが、建築的な測定値ではありません。それは根拠のある推測であり、復元できるのは音源信号が実際に露出させた減衰だけです。そのため、隙間のない密な素材 — 静かな瞬間のない大音量で連続したマスター — は、はっきりしたノートの切れ目や休符を持つ音楽より推定が弱くなります。

信頼度

信頼度スコア(パーセント)は、解析器が見つけた減衰領域の質に基づいて、推定がどれだけ信頼できるかを報告します。長く途切れない尾を持つクリーンなインパルス応答は高く、ノイズの多い・圧縮された・残響の乏しい素材は低くなります。

信頼度結果の読み方
高い(≳ 70%)クリーンな減衰が見つかり、数値は信頼できる。
中程度(約 35〜70%)比較や可視化には使えるが、細部は慎重に。
低い(≲ 35%)クリーンな減衰領域がなく、推定は粗い。インパルス応答の録音を試す。

信頼度が低いときの対処はほぼ同じです。クリーンなインパルス(手拍子、破裂音、スイープ)を録音し、インパルス応答モードで解析します。低い信頼度はアルゴリズムの失敗というより、録音に逆問題を解くだけの露出した残響が含まれていなかったという合図です。

libsonare が録音をどう逆解析するか

libsonare は入力からエネルギー減衰曲線を作り、それに部屋のパラメータ(RT60、明瞭度、帯域別吸音、容積、DRR)を当てはめます。インパルス応答モードでは減衰曲線は与えられた IR からそのまま得られ、ブラインドモードでは残響の尾が一瞬露出する区間 — ノートの解放、過渡の隙間、無音 — を特定し、それらから減衰の推定を継ぎ合わせて復元します。信頼度スコアは、見つかったクリーンな減衰の量、その直線性、当てはめが外挿せざるを得なかった度合いを組み合わせるため、スタジオで測定したスイープでは高く、大音量で密度が高く強く圧縮されたマスターでは低く、と自然にスケールします。

関連: 残響時間(RT60 と EDT), 部屋の形状と容積, 音源距離と DRR, 音響解析