d-vector 기반 화자 인증 시스템의 성능 비교를 통한 심층 신경망의 범용성 확인

d-vector 는 심층 신경망으로부터 추출된 특징으로서, 특정 발성의 화자 특성을 표현한다. 학습데이터(development set)를 사용해 화자 식별기로 학습된 심층 신경망의 특정 은닉층의 출력값을 취함으로써 d-vector 를 추출할 수 있다. 본 연구에서는 d-vector 를 사용한 화자 인증 실험을 통해, 학습에 사용된 데이터와 d-vector 추출에 사용된 은닉층의 깊이에 따라 결정되는, 추출된 d-vector 의 범용성(generality power)이 화자 인증 성능에 미치는 영향을 확인하였다. 실험 결과, 심층 신경망을 화자식별기로 학습시킬 때 다른 도메인(domain)의 데이터를 추가 활용하여 더욱 범용성(generality power)이 높은 심층 신경망 화자 식별기를 학습시킬수 있음을 확인하였다.