Approche quantitative en syntaxe : l’exemple de l’alternance de position de l’adjectif épithète en français

Cet article présente une analyse statistique sur des données de syntaxe qui a pour but d’aider à mieux cerner le phénomène d’alternance de position de l’adjectif épithète par rapport au nom en français. Nous montrons comment nous avons utilisé les corpus dont nous disposons (French Treebank et le corpus de l’Est-Républicain) ainsi que les ressources issues du traitement automatique des langues, pour mener à bien notre étude. La modélisation à partir de 13 variables relevant principalement des propriétés du syntagme adjectival, de celles de l’item adjectival, ainsi que de contraintes basées sur la fréquence, permet de prédire à plus de 93% la position de l’adjectif. Nous insistons sur l’importance de contraintes relevant de l’usage pour le choix de la position de l’adjectif, notamment à travers la fréquence d’occurrence de l’adjectif, et la fréquence de contextes dans lesquels il apparaît.

[1]  Fiammetta Namer,et al.  Acquisition automatique de sens à partir d’opérations morphologiques en français : études de cas , 2002, JEPTALNRECITAL.

[2]  Michèle Noailly,et al.  L'adjectif en français , 1999 .

[3]  A. Abeillé,et al.  La position de l'adjectif épithète en français : le poids des mots , 1999 .

[4]  A. Goldberg Constructions at Work: The Nature of Generalization in Language , 2006 .

[5]  Fiammetta Namer FLEMM : Un analyseur flexionnel du français à base de règles , 2000 .

[6]  J. Bresnan Is syntactic knowledge probabilistic ? Experiments with the English dative alternation ∗ , 2006 .

[7]  Marie Candito,et al.  Improving generative statistical parsing with semi-supervised word clustering , 2009, IWPT.

[8]  Hinrich Schütze,et al.  Book Reviews: Foundations of Statistical Natural Language Processing , 1999, CL.

[9]  A. Agresti An introduction to categorical data analysis , 1997 .

[10]  Benoît Crabbé,et al.  Prédire la position de l'adjectif épithète en français : approche quantitative , 2012 .

[11]  Ted Pedersen,et al.  Fishing for Exactness , 1996, ArXiv.

[12]  Denis Maurel,et al.  Prolexbase. Un dictionnaire relationnel multilingue de noms propres [Prolexbase: a multilingual relational dictionary of Proper Names] , 2006, TAL.

[13]  Alexandra Kinyon,et al.  Building a Treebank for French , 2000, LREC.

[14]  S. Gries,et al.  Extending collostructional analysis: A corpus-based perspective on `alternations' , 2004 .

[15]  Marie Candito,et al.  Expériences d’analyse syntaxique statistique du français , 2008, JEPTALNRECITAL.

[16]  I. Krämer,et al.  Cognitive foundations of interpretation , 2007 .

[17]  Abhishek Arun,et al.  Statistical Parsing of the French Treebank , 2004 .

[18]  Wei-Yin Loh,et al.  Classification and regression trees , 2011, WIREs Data Mining Knowl. Discov..

[19]  H. Nølke Où placer l'adjectif épithète ? Focalisation et modularité , 1996 .

[20]  Christiane Laeufer,et al.  Le Bon Usage , 1986 .

[21]  Anne Abeillé,et al.  Enriching a French Treebank , 2004, LREC.

[22]  Leo Breiman,et al.  Classification and Regression Trees , 1984 .

[23]  R. Harald Baayen,et al.  Predicting the dative alternation , 2007 .

[24]  H. Akaike A new look at the statistical model identification , 1974 .

[25]  Marc Wilmet La place de l'épithète qualificative en français contemporain. Etude grammaticale et stylistique , 1981 .

[26]  James L. McClelland,et al.  Alternatives to the combinatorial paradigm of linguistic theory based on domain general principles of human cognition , 2005 .

[27]  Thomas Wasov,et al.  Postverbal behavior , 2002, CSLI lecture notes series.

[28]  Josef van Genabith,et al.  Learning Morphology with Morfette , 2008, LREC.

[29]  Elisabeth Dévière,et al.  Analyzing linguistic data: a practical introduction to statistics using R , 2009 .