Analyse faiblement supervisée de conversation en actes de dialogue (Weakly supervised dialog act analysis)

Nous nous interessons ici a l'analyse de conversation par chat dans un contexte oriente-tâche avec un conseiller technique s'adressant a un client, ou l'objectif est d'etiqueter les enonces en actes de dialogue, pour alimenter des analyses des conversations en aval. Nous proposons une methode legerement supervisee a partir d'heuristiques simples, de quelques annotations de developpement, et une methode d'ensemble sur ces regles qui sert a annoter automatiquement un corpus plus large de facon bruitee qui peut servir d'entrainement a un modele supervise. Nous comparons cette approche a une approche supervisee classique et montrons qu'elle atteint des resultats tres proches, a un cout moindre et tout en etant plus facile a adapter a de nouvelles donnees.

[1]  Li Wang,et al.  The Utility of Discourse Structure in Identifying Resolved Threads in Technical User Forums , 2012, COLING.

[2]  Tomas Mikolov,et al.  Enriching Word Vectors with Subword Information , 2016, TACL.

[3]  Delphine Charlet,et al.  Web Chat Conversations from Contact Centers: a Descriptive Study , 2016, LREC.

[4]  Jean Carletta,et al.  Unleashing the killer corpus: experiences in creating the multi-everything AMI Meeting Corpus , 2007, Lang. Resour. Evaluation.

[5]  Harshit Kumar,et al.  Dialogue Act Sequence Labeling using Hierarchical encoder with CRF , 2017, AAAI.

[6]  Mihai Surdeanu,et al.  The Stanford CoreNLP Natural Language Processing Toolkit , 2014, ACL.

[7]  Christopher Ré,et al.  Learning the Structure of Generative Models without Labeled Data , 2017, ICML.

[8]  John J. Godfrey,et al.  SWITCHBOARD: telephone speech corpus for research and development , 1992, [Proceedings] ICASSP-92: 1992 IEEE International Conference on Acoustics, Speech, and Signal Processing.

[9]  Alexis Nasr,et al.  Annotation en Actes de Dialogue pour les Conversations d’Assistance en Ligne (Dialog Acts Annotations for Online Chats) , 2018, JEPTALNRECITAL.

[10]  Nicholas Asher,et al.  Discourse Structure and Dialogue Acts in Multiparty Dialogue: the STAC Corpus , 2016, LREC.

[11]  Gholamreza Haffari,et al.  A Latent Variable Recurrent Neural Network for Discourse Relation Language Models , 2016, ArXiv.

[12]  Christopher De Sa,et al.  Data Programming: Creating Large Training Sets, Quickly , 2016, NIPS.