Modeling of Speech Structure without Small Energy Components

要約 : 帯域制限波 の 極大値 と極小値か ら元の 波形 を再構成す る手法 は 、聴 覚系の 情報抽出 を模倣 し た もの で あ るが、ノ イ ズ レ ベ ル に あ る無数の 極値が記録 され る の で 、情報削減 の 上 で課題 を残 して い た 。 先行 研 究で は 、振幅包絡 の 極小 部に在 る極値 を削 除す る こ とを提案 し たが、情報削減率は 約 2 割 に留 まっ た。そ こ で 木研究で は 、振幅包絡 をカーネル 関数 で 近似 し、卞観評価 と明 瞭度を使用 して ノ イ ズ の 閾値 を決 定 した。閾値未満の 極値をカ ーネル 関数 単位で 削 除 し た後 に 、 振 幅包絡 の 極 小部 も削除 、 さ らに全て の 極小値 も削除す る こ とで 、 情 報 削減率は 7 割 5 分 を超 えた。カーネル 関数は 隣 り合 う極大値 を周期 の 正 弦波状につ ない