Desarrollo y evaluación de diferentes metodologías para la gestión automática del diálogo
暂无分享,去创建一个
El objetivo principal de la tesis que se presenta es el estudio y
desarrollo de diferentes metodologias para la gestion del dialogo
en sistemas de dialogo hablado. El principal reto planteado en la
tesis reside en el desarrollo de metodologias puramente
estadisticas para la gestion del dialogo, basadas en el
aprendizaje de un modelo a partir de un corpus de dialogos
etiquetados. En este campo, se presentan diferentes aproximaciones
para realizar la gestion, la mejora del modelo estadistico y la
evaluacion del sistema del dialogo.
Para la implementacion practica de estas metodologias, en el
ambito de una tarea especifica, ha sido necesaria la adquisicion y
etiquetado de un corpus de dialogos. El hecho de disponer de un
gran corpus de dialogos ha facilitado el aprendizaje y evaluacion
del modelo de gestion desarrollado. Asi mismo, se ha implementado
un sistema de dialogo completo, que permite evaluar el
funcionamiento practico de las metodologias de gestion en
condiciones reales de uso.
Para evaluar las tecnicas de gestion del dialogo se proponen
diferentes aproximaciones: la evaluacion mediante usuarios reales;
la evaluacion con el corpus adquirido, en el cual se han definido
unas particiones de entrenamiento y prueba; y la utilizacion de
tecnicas de simulacion de
usuarios. El simulador de usuario desarrollado
permite modelizar de forma estadistica el proceso completo del
dialogo. En la aproximacion que se presenta, tanto la obtencion de
la respuesta del sistema como la generacion del turno de usuario
se modelizan como un problema de clasificacion, para el que se
codifica como entrada un conjunto de variables que representan el
estado actual del dialogo y como resultado de la clasificacion se
obtienen las probabilidades de seleccionar cada una de las
respuestas (secuencia de actos de dialogo) definidas
respectivamente para el usuario y el sistema.
A partir de los dialogos generados mediante el uso de este modulo
de simulacion se ha ampliado y mejorado el corpus ad