论文信息 - 정현파 모델을 이용한 2.4kbps 음성부호화 알고리즘

정현파 모델을 이용한 2.4kbps 음성부호화 알고리즘

STC(Sinusoidal Transform Coding) 방식은 주파수 영역에서 음성신호의 스펙트럼 피크치들을 정현파로 모렐링 하여 합성하는 음성부호화 방식을 말한다. 저전송률 STC 방식에서는 스펙트럼의 모든 피크를 이용하는 대신, 기본 주파수와 고조파에 해당하는 스펙트럼 포락선에서의 크기와 그때의 위상을 이용하여 음성을 합성한다. 본 논문에서는 정현파 모델에 기반한 2.4kbps 음성부호화 알고리즘을 제안한다. 피치정보는 모든 스펙트럼 피크를 사용한 합성음과 선택된 주파수와 고조파를 이용한 합성음과의 평균자승에러를 이용하여 추정하고, 위상정보는 여기신호 펄스의 시작시기를 나타내는 onset time 과 성도 모델 전달함수의 위상을 이용하여 얻는다. 크기정보는 SEEVOC 알고리즘과 선형예측계수감 이용 하여 추정한다. 실험결과, 합성음의 스펙트럼 특성은 원음성의 포만프 정보플 대부분 가지고 있으며 , 위상정보도 원음성의 위상을 잘 따라감을 확인하였다. 함성음의 음질평가를 위해서 informal 한 MOS(Mean Opinion Score) 테스트를 시행하였으며 , 2.0kbps 의 HVXC 와 비교하여 대체적으로 MOS 3.1 이상의 음질을 얻을 수 있었다.

배건성 | 백성기