Etude sémantique des mots-clés et des marqueurs lexicaux stables dans un corpus technique (Semantic Analysis of Keywords and Stable Lexical Markers in a Technical Corpus) [in French]

RESUME ____________________________________________________________________________________________________________ 
Cet article presente les resultats d’une analyse semantique quantitative des unites lexicales specifiques dans un corpus technique, relevant du domaine des machines-outils pour l’usinage des metaux. L’etude vise a verifier si et dans quelle mesure les mots-cles du corpus technique sont monosemiques. A cet effet, nous procedons a une analyse statistique de regression simple, qui permet d’etudier la correlation entre le rang de specificite des mots-cles et leur rang de monosemie, mais qui souleve des problemes statistiques et methodologiques, notamment un biais de frequence. Pour y remedier, nous adoptons une approche alternative pour le reperage des unites lexicales specifiques, a savoir l’analyse des marqueurs lexicaux stables ou Stable Lexical Marker Analysis (SLMA). Nous discutons les resultats quantitatifs et statistiques de cette approche dans la perspective de la correlation entre le rang de specificite et le rang de monosemie.

[1]  Charles Muller,et al.  Dépouillements et statistiques en lexicométrie , 1984 .

[2]  R. Dirven,et al.  Cognitive sociolinguistics : language variation, cultural models, social systems , 2008 .

[3]  Dirk Speelman,et al.  A profile-based calculation of region and register variation: the synchronic and diachronic status of the two main national varieties of Dutch , 2006 .

[4]  Anne Condamines,et al.  Point de vue en langue spécialisée , 1997 .

[5]  Paul Rayson,et al.  Corpus linguistics around the world , 2006 .

[6]  Benoît Habert,et al.  Dégrouper les sens : pourquoi, comment? , 2004 .

[7]  Hendrik Kockaert,et al.  A variational linguistics approach to term extraction , 2010 .

[8]  Magali Paquot,et al.  Distinctive words in academic writing: a comparison of three statistical tests for keyword extraction , 2009 .

[9]  Deny Arnos Kwary,et al.  A Hybrid Method for Determining Technical Vocabulary. , 2011 .

[10]  Marianne Hundt,et al.  Corpora: Pragmatics and Discourse , 2009 .

[11]  Marie-Claude L'Homme,et al.  Two methods for extracting "specific" single-word terms from specialized corpora Experimentation and evaluation , 2005 .

[12]  Dirk Speelman,et al.  Variation in the choice of adjectives in the two main national varieties of Dutch , 2006 .

[13]  M. Teresa Cabre,et al.  Terminologie et linguistique: la théorie des portes , 2000 .

[14]  Mike Scott,et al.  Textual Patterns: Key words and corpus analysis in language education , 2006 .

[15]  Jean Véronis,et al.  Cartographie lexicale pour la recherche d”information , 2003, JEPTALNRECITAL.

[16]  Ted Dunning,et al.  Accurate Methods for the Statistics of Surprise and Coincidence , 1993, CL.

[17]  Anne Condamines Sémantique et corpus , 2005 .

[18]  Damon Mayaffre Quand « travail », « famille », « patrie » co-occurrent dans le discours de Nicolas Sarkozy. Etude de cas et réflexion théorique sur la co-occurrence , 2008 .

[19]  Laura Daniela Ferrari Un caso de polisemia en el discurso jurídico , 2002 .

[20]  Rita Temmerman,et al.  Towards New Ways of Terminology Description: The Sociocognitive-Approach , 2000 .

[21]  Ann Bertels,et al.  La corrélation entre la spécificité et la sémantique dans un corpus spécialisé , 2010 .

[22]  Iéda Maria Alves,et al.  Socioterminologie. Une approche sociolinguistique de la terminologie , 2003 .