Desarrollo y evaluación de diferentes metodologías para la gestión automática del diálogo

El objetivo principal de la tesis que se presenta es el estudio y desarrollo de diferentes metodologias para la gestion del dialogo en sistemas de dialogo hablado. El principal reto planteado en la tesis reside en el desarrollo de metodologias puramente estadisticas para la gestion del dialogo, basadas en el aprendizaje de un modelo a partir de un corpus de dialogos etiquetados. En este campo, se presentan diferentes aproximaciones para realizar la gestion, la mejora del modelo estadistico y la evaluacion del sistema del dialogo. Para la implementacion practica de estas metodologias, en el ambito de una tarea especifica, ha sido necesaria la adquisicion y etiquetado de un corpus de dialogos. El hecho de disponer de un gran corpus de dialogos ha facilitado el aprendizaje y evaluacion del modelo de gestion desarrollado. Asi mismo, se ha implementado un sistema de dialogo completo, que permite evaluar el funcionamiento practico de las metodologias de gestion en condiciones reales de uso. Para evaluar las tecnicas de gestion del dialogo se proponen diferentes aproximaciones: la evaluacion mediante usuarios reales; la evaluacion con el corpus adquirido, en el cual se han definido unas particiones de entrenamiento y prueba; y la utilizacion de tecnicas de simulacion de usuarios. El simulador de usuario desarrollado permite modelizar de forma estadistica el proceso completo del dialogo. En la aproximacion que se presenta, tanto la obtencion de la respuesta del sistema como la generacion del turno de usuario se modelizan como un problema de clasificacion, para el que se codifica como entrada un conjunto de variables que representan el estado actual del dialogo y como resultado de la clasificacion se obtienen las probabilidades de seleccionar cada una de las respuestas (secuencia de actos de dialogo) definidas respectivamente para el usuario y el sistema. A partir de los dialogos generados mediante el uso de este modulo de simulacion se ha ampliado y mejorado el corpus ad