はじめに

libsonare は、音楽情報検索（MIR）、マスタリング、ミキシング、編集、クリエイティブ FX、ブラウザネイティブな音楽ツールのための、外部依存なし C++17 オーディオ DSP ツールキットです。

必要な機能や実行環境がまだ決まっていない場合は、先に学習順ガイドを読んでください。このページは、最初のサンプルを動かす段階のための入口です。

このページで身につくこと

このページを読むと、次のことを判断・実行できるようになります。

すべての API で使うサンプル、サンプルレート、モノラル、ステレオの基本語彙を説明できる。
インストール前に、自分のプロジェクトに合う実行環境を選べる。
ブラウザ、Python、CLI、Node ネイティブの最小例を 1 つ動かせる。
次に開くべき実行環境別リファレンスを判断できる。

利用環境を選ぶ前に

多くの例は同じ流れです。音声を読み込むかデコードし、Float32Array のサンプルとサンプルレートを渡し、解析結果や処理結果を受け取ります。ブラウザでは通常、ファイルのデコードを呼び出し側で行います。Python と CLI では、一般的な音声ファイルを直接読み込めることが多いです。

用語	意味
サンプル	音声波形の 1 点の振幅値
サンプルレート	1 秒あたりのサンプル数。44,100 や 48,000 など
モノラル	1 チャンネルの音声
ステレオ	左右 2 チャンネルの音声
WASM	WebAssembly。npm パッケージがブラウザで使う実行形式

初めてなら「ファイル」と「サンプル」を分けて考える

MP3 や WAV は音声を保存するファイル形式です。libsonare の多くの API が受け取る Float32Array や Python の配列は、ファイルを読み込んだ後の PCM サンプルです。ブラウザでは自分でデコードしてサンプルを渡し、Python / CLI ではパッケージ側がファイル読み込みまで担当できる場面があります。

利用環境を選ぶ

まず、libsonare をどこで使うかを選んでください。

やりたいこと	使うもの	最初に読むページ
Web アプリのブラウザ上で解析したい	npm の WebAssembly パッケージ	ブラウザ / WASM
Python スクリプトやノートブックで音声ファイルを解析したい	PyPI の Python パッケージ	Python API
ターミナルやバッチ処理から解析したい	`pip install libsonare` で入る `sonare` CLI	CLI リファレンス
ピッチや声質の編集を入れたい	編集 DSP	編集 DSP
ミキサー、ルーティング画面、ステムレンダーを作りたい	WASM、Python、Node、C++ から使えるミキシングエンジン	ミキシングエンジン
判断根拠を見せるマスタリング UI を作りたい	マスタリングアシスタント／プロファイル／プレビュー API	マスタリングアシスタント
ライブ可視化や再生ツールを作りたい	ストリーミングアナライザーとリアルタイムエンジン	リアルタイムとストリーミング
作曲・アレンジしたい、MIDI を音声にレンダリングしたい	内蔵インストゥルメントとヘッドレス DAW のプロジェクト編集	組み込み楽器、プロジェクト編集
ルーム音響を推定・合成・モーフィングしたい	ルーム音響ヘルパー	ルーム音響解析
Node.js のサーバーやデスクトップツールから使いたい	N-API ネイティブバインディング	Node.js ネイティブ
C++ ライブラリとして組み込みたい	C++17 ライブラリ	C++ API

ブラウザ向け npm パッケージは主にサンプルベースで、多くの API はデコード済みの Float32Array PCM を受け取ります。Audio.fromMemory(...) は WAV/MP3 バイト列をデコードでき、Audio.fromMemoryWithBrowserFallback(...) はブラウザのコーデックで対応形式を読めます。Python パッケージと CLI は標準で WAV/MP3 を読み込めます。FFmpeg 有効ビルドでは、より多くの形式を直接読み込めます。

パッケージ名

ブラウザ / WASM: npm から @libraz/libsonare をインストールします。
Python API と CLI: PyPI から libsonare を pip install libsonare でインストールします。
Node.js ネイティブバインディング: bindings/node の @libraz/libsonare-native を使います。現在はソースビルド前提です。

クイックスタート

ブラウザ（WebAssembly）

ブラウザでは、まずファイルをデコードし、モノラルの Float32Array サンプルを libsonare に渡します。次のスニペットはこれだけで動きます — モジュールスクリプトに貼り付けて URL を差し替えてください:

typescript

import { init, analyze } from '@libraz/libsonare';

// WASM モジュールを初期化
await init();

// Web Audio API でデコード（デコードはブラウザ、解析は libsonare の役割）
const audioContext = new AudioContext();
const response = await fetch('audio.mp3');
const arrayBuffer = await response.arrayBuffer();
const audioBuffer = await audioContext.decodeAudioData(arrayBuffer);
const samples = audioBuffer.getChannelData(0); // モノラルの Float32Array

// 音声サンプルを解析
const result = analyze(samples, audioBuffer.sampleRate);

console.log('BPM:', result.bpm);
console.log('キー:', result.key.name);
console.log('コード:', result.chords);

次に読むページ: WebAssembly ガイド、JavaScript API リファレンス。

Python

bash

pip install libsonare

標準のホイールは WAV と MP3 を読み込みます。M4A/AAC/FLAC/OGG/Opus を直接読み込む場合は、FFmpeg を有効にしてソースからビルドします。

python

from libsonare import Audio, analyze

# 音声ファイルを解析
audio = Audio.from_file("music.mp3")
result = analyze(audio.data, audio.sample_rate)

print(f"BPM: {result.bpm}")
print(f"キー: {result.key.name}")
print(f"ビート数: {len(result.beat_times)}")

次に読むページ: Python API リファレンス。

CLI（コマンドライン）

CLI は、ターミナルでの簡易確認、バッチ処理、JSON サマリーの出力に向いています。sonare コマンドは PyPI の Python パッケージに含まれます。npm の WebAssembly パッケージには含まれません。

bash

pip install libsonare

# BPM とキーをすばやく確認
sonare bpm music.mp3
sonare key music.mp3

# JSON 形式で完全解析
sonare analyze music.mp3 --json

CLI の対応フォーマットは、インストールされている Python パッケージのデコード対応と同じです。

次に読むページ: CLI リファレンス。

Node.js（ネイティブ）

Node.js からネイティブのファイル読み込みやデスクトップ/サーバーサイドの性能が必要な場合は、N-API バインディングを使います。現在はソースビルド前提です。

bash

git clone https://github.com/libraz/libsonare.git
cd libsonare/bindings/node
yarn install
yarn build

typescript

import { Audio } from '@libraz/libsonare-native';

const audio = Audio.fromFile('music.mp3');
const result = audio.analyze();

console.log('BPM:', result.bpm);
console.log('キー:', result.key.name);

次に読むページ: Node.js / ネイティブバインディング。

できること

この一覧のルーム音響用語

RIR は room impulse response の略です。等価ルーム推定は、音声から実用上の部屋モデルを推定する処理で、正確な実寸の復元ではありません。ルームモーフィングは音作り向けのルーム効果です。

BPM 検出 - テンポグラムと自己相関を使用したテンポ推定
キー検出 - Krumhansl-Schmuckler プロファイルによる調性検出
ビート検出 - 動的計画法に基づくビート抽出
コード認識 - 192テンプレート（16種類のコードクオリティ × 12ルート）によるテンプレートマッチング
セクション検出 - イントロ、Aメロ、サビなどの構造的セグメンテーション
メロディ / ピッチ検出 - YIN / pYIN アルゴリズムによる基本周波数検出
音響特性 - 音色、ダイナミクス、リズム分析
ルーム音響解析 - RT60 / EDT、明瞭度、定義度、オクターブバンド別減衰、ブラインド／等価ルーム推定、RIR 合成、ルームモーフィング
スペクトル特徴量 - メルスペクトログラム、MFCC、クロマ、CQT/VQT、スペクトル重心、平坦度
オーディオエフェクト - HPSS、タイムストレッチ、ピッチシフト、ノーマライズ、トリム
ストリーミング解析 - チャンク単位処理とプログレッシブBPM/キー/コード推定
マスタリング - LUFS ターゲット、トゥルーピークリミッター、EQ、ダイナミクス、リペア、ステレオ処理、リファレンスマッチングを含むプリセット／設定式チェーン
ミキシング - チャンネルストリップ、センド、バス、オートメーション、シーンプリセット、ゴニオメーター／トゥルーピーク計測、オフラインステレオレンダー
編集 DSP とインサート - ピッチ補正、ノート区間ストレッチ、ピッチ／フォルマントによるボイスチェンジを直接提供し、リバーブやダッキングは有効な場合に名前付きプロセッサまたはミキサーインサート経路から使えます
逆変換ヘルパー - メルスペクトログラムや MFCC から STFT／音声を近似的に再構成

この一覧に出る略語

BPM — 1 分あたりの拍数。曲の速さです。
STFT — 音を短い窓ごとに周波数へ分ける解析。スペクトログラムの土台です。
MFCC — 音色の特徴を少ない数値にまとめたもの。ML や分類でよく使います。
CQT / VQT — 音楽の音高間隔に合わせた周波数解析です。
HPSS — 倍音成分と打撃成分を分ける処理です。
LUFS / True Peak — 配信向けの音量感とピーク安全性を見るマスタリング指標です。
ゴニオメーター — 左右の広がりや位相の状態を視覚化するメーターです。

今すぐ試す

デモにアクセスして、ブラウザで libsonare を試せます。音声ファイルをドラッグ & ドロップするだけで解析結果が表示されます。

あるいはこの場で。これはページ上でライブに動く短時間フーリエ変換で、これからインストールするのと同じ WASM ビルドが計算しています。

STFT · SPECTRALIDLE

STFT — 時間と周波数を同時に見る

用語集

基礎

解析ガイド

ミキシングガイド

編集ガイド

楽器と MIDI

アレンジとプロジェクト

リアルタイムガイド

室内音響

マスタリング概念

マスタリングガイド

はじめに

このページで身につくこと

利用環境を選ぶ前に

利用環境を選ぶ

クイックスタート

ブラウザ（WebAssembly）

Python

CLI（コマンドライン）

Node.js（ネイティブ）

できること

今すぐ試す

はじめに ​

このページで身につくこと ​

利用環境を選ぶ前に ​

利用環境を選ぶ ​

クイックスタート ​

ブラウザ（WebAssembly） ​

Python ​

CLI（コマンドライン） ​

Node.js（ネイティブ） ​

できること ​

今すぐ試す ​

はじめに

このページで身につくこと

利用環境を選ぶ前に

利用環境を選ぶ

クイックスタート

ブラウザ（WebAssembly）

Python

CLI（コマンドライン）

Node.js（ネイティブ）

できること

今すぐ試す