Identification des noms sous-spécifiés, signaux de l’organisation discursive

Dans cet article, nous nous interessons aux noms sous-specifies, qui forment une classe d’indices de l’organisationdiscursive. Ces indices ont ete peu etudies dans le cadre de l’analyse du discours et en traitement automatiquedes langues. L’objectif est d’effectuer une etude linguistique de leur participation a la structuration discursive, notammentlorsqu’ils interviennent dans des sequences organisationnelles frequentes (e.g. le patron Probleme-Solution). Dans cetarticle, nous presentons les differentes etapes mises en oeuvre pour identifier automatiquement ces noms en corpus. Enpremier lieu, nous detaillons la construction d’un lexique de noms sous-specifies pour le francais a partir d’un corpusconstitue de 7 annees du journal Le Monde. Puis nous montrons comment utiliser des techniques fondees sur la fouille dedonnees sequentielles pour acquerir de nouvelles constructions syntaxiques caracteristiques des emplois de noms sousspecifies.Enfin, nous presentons une methode d’identification automatique des occurrences de noms sous-specifies et sonevaluation.

[1]  Dominique Legallois,et al.  Quand le texte signale sa structure : la fonction textuelle des noms sous-spécifiés , 2006 .

[2]  Dominique Legallois,et al.  Fouille de données pour la stylistique : cas des motifs séquentiels émergents , 2012 .

[3]  Lynne Flowerdew,et al.  Corpus-based Analyses of the Problem-Solution Pattern: A phraseological approach , 2008 .

[4]  Graeme Hirst,et al.  Annotating Anaphoric Shell Nouns with their Antecedents , 2013, LAW@ACL.

[5]  Xifeng Yan,et al.  CloSpan: Mining Closed Sequential Patterns in Large Datasets , 2003, SDM.

[6]  Denis Apothéloz A l'interface du système linguistique et du discours : l'exemple des constructions identificatives (e.g. pseudo-clivées) , 2007 .

[7]  Ramakrishnan Srikant,et al.  Mining sequential patterns , 1995, Proceedings of the Eleventh International Conference on Data Engineering.

[8]  Joakim Nivre,et al.  MaltParser: A Data-Driven Parser-Generator for Dependency Parsing , 2006, LREC.

[9]  William C. Mann,et al.  Rhetorical Structure Theory: Toward a functional theory of text organization , 1988 .

[10]  Nicholas Asher,et al.  Reference to abstract objects in discourse , 1993, Studies in linguistics and philosophy.

[11]  F. R. Higgins,et al.  The Pseudo-Cleft Construction in English , 2015 .

[12]  Dominique Legallois "Quand le texte signale sa structure: la fonction textuelle d'une certaine catégorie nominale" , 2006 .

[13]  J. Flowerdew Signalling nouns in discourse , 2003 .

[14]  Bruno Crémilleux,et al.  Discovering Linguistic Patterns Using Sequence Mining , 2012, CICLing.

[15]  Laure Vieu,et al.  Discourse Contribution of Enumerative Structures involving "pour deux raisons" , 2011 .

[16]  Alex Lascarides,et al.  Logics of Conversation , 2005, Studies in natural language processing.

[17]  Pascal Denis,et al.  Coupling an Annotated Corpus and a Morphosyntactic Lexicon for State-of-the-Art POS Tagging with Less Human Effort , 2009, PACLIC.

[18]  Hyunsook Yoon,et al.  Corpus-Based Analyses of the Problem – Solution Pattern: A Phraseological Approach. Lynne Flowerdew. John Benjamins, Amsterdam (2008). xi+179 pp., US $143, ISBN: 978-90-272-2303-6 , 2009 .

[19]  Jinyan Li,et al.  Efficient mining of emerging patterns: discovering trends and differences , 1999, KDD '99.

[20]  Dominique Legallois,et al.  "L'objectif de cet article est de ...: construction spécificationnelle et grammaire phraséologique" , 2006 .

[21]  J. Swales Aspects of article introductions , 2011 .

[22]  Graeme Hirst,et al.  Interpreting Anaphoric Shell Nouns using Antecedents of Cataphoric Shell Nouns as Training Data , 2013, EMNLP.

[23]  Joakim Nivre,et al.  Benchmarking of Statistical Dependency Parsers for French , 2010, COLING.

[24]  Thomas A. Upton,et al.  An approach to corpus-based discourse analysis: The move analysis as example , 2009 .

[25]  Hans-Jörg Schmid,et al.  English abstract nouns as conceptual shells : from corpus to cognition , 2000 .