Génération multiparamétrique de la prosodie du français par apprentissage automatique
暂无分享,去创建一个
Cette these a pour objet la conception, l'apprentissage automatique et l'evaluation d'un modele de generation de la prosodie du francais. Ce modele, d'inspiration cognitive, suppose un encodage direct des informations linguistiques et para-linguistiques vehiculees par un enonce via des formes prosodiques prototypiques. Ces formes - ou mouvements - sont enchainees au sein d'un meme niveau linguistique (phrase, groupe, mot. . . ) et se superposent a des enchainements encodant les niveaux superieurs. Cette morphologie superpositionnelle opere de maniere multiparametrique. Dans le cadre de cette these, nous avons etudie deux niveaux linguistiques - la phrase et le groupe - et deux dimensions prosodiques - la melodie et le rythme. Pour ces deux niveaux, nous avons elabore un systeme de generation conjoint des contours melodiques et rythmiques, parametre par un apprentissage automatique hierarchique sur des corpus de parole naturelle. L'architecture du modele est un reseau de neurones recurrent a connections partielles. Les corpus de parole ont ete concus de facon a prendre en compte le phenomene linguistique etudie avec une representativite statistique suffisante, et a faire varier systematiquement le contenu des niveaux linguistiques inferieurs. A partir d'un corpus de phrases isolees prononcees par un locuteur selon six consignes attitudinales, nous avons entrepris la generation des prototypes melodiques et rythmiques du niveau de la phrase vehiculant l'attitude du locuteur vis-a-vis de son propos. Nous avons egalement etudie, sur la base d'un corpus de phrases declaratives, les modulations du niveau porte de groupe prenant en charge la fonction de structuration de l'enonce. Chaque etape d'apprentissage de notre modele a ete sanctionnee par un test de perception destine a evaluer sa capacite a capturer les informations necessaires et suffisantes pour communiquer les fonctions linguistiques donne