F-16 Prototyping of Sound Source Separation Processes for MIDI Encoding

筆者らは音楽素材に限らずあらゆる音響信号を一律に平 均律音階に分解できる高精度な周波数解析技術の開発を進 めてきた。この技術を高能率符号化分野に応用すると、再 生品質に関しては3倍程度の 16kbps のビットレートで符 号化された MP3 方式より優位性が確認されている[1]。ま た、カラオケなどエンターテインメント分野に応用すると、 MIDI コンテンツの制作工程が省力化される[2]。しかし、 MIDI 符号化の適用素材を拡大し、高品質な MIDI コンテン ツを生成するためには、音源分離の開発が必須になる。そ こで、MIDI 符号化の過程で複数の音色パラメータを算出 し、高精度多チャンネルな音源分離を実現するモデルを提 案した[3]。 本稿では、3つの音色パラメータを定義付け、ピアノ・ ギター・ボーカルに関する音色管理データベースを構築し、 2種の音色が混在する音響信号に対して MIDI 符号化を試 み、音源分離精度の定量的評価を行ったので、その結果を 報告する。