论文信息 - F-16 Prototyping of Sound Source Separation Processes for MIDI Encoding

F-16 Prototyping of Sound Source Separation Processes for MIDI Encoding

筆者らは音楽素材に限らずあらゆる音響信号を一律に平均律音階に分解できる高精度な周波数解析技術の開発を進めてきた。この技術を高能率符号化分野に応用すると、再生品質に関しては3倍程度の 16kbps のビットレートで符号化された MP3 方式より優位性が確認されている[1]。また、カラオケなどエンターテインメント分野に応用すると、 MIDI コンテンツの制作工程が省力化される[2]。しかし、 MIDI 符号化の適用素材を拡大し、高品質な MIDI コンテンツを生成するためには、音源分離の開発が必須になる。そこで、MIDI 符号化の過程で複数の音色パラメータを算出し、高精度多チャンネルな音源分離を実現するモデルを提案した[3]。本稿では、3つの音色パラメータを定義付け、ピアノ・ギター・ボーカルに関する音色管理データベースを構築し、 2種の音色が混在する音響信号に対して MIDI 符号化を試み、音源分離精度の定量的評価を行ったので、その結果を報告する。

Toshio Modegi

[1] Toshio Modegi. Development of midi encoder "auto-f" for creating midi controllable general audio contents , 2002, IWEC.

[2] Toshio Modegi. Very low bit-rate audio coding technique using MIDI representation , 2001, NOSSDAV '01.