Grands corpus et linguistique outillée pour l'étude du français en interaction (plateforme CLAPI et corpus CIEL)

Cet article s’inscrit dans le domaine des grands corpus de langue en interaction, plus particulierement des corpus de francais ; et presente differents enjeux theoriques et analytiques poses par le traitement de ces corpus. L’article se fonde sur les experiences menees au laboratoire ICAR depuis la fin des annees 90, qui ont permis de constituer la base de donnees de corpus CLAPI (Corpus de Langue Parlee en Interaction). Il integre aussi un projet en cours, qui vise la constitution d’un grand corpus de francais international, CIEL-F (Corpus International Ecologique de Langue Francaise). Apres avoir decrit la maniere dont est concue la base de donnees de corpus d’interaction ; en parcourant un certain nombre de problemes et de solutions, relatifs aux choix de recueil des donnees, a la transcription, a l’anonymisation, mais aussi au developpement d’outils facilitant le traitement de grandes masses de donnees, nous exposons quelques questions d’analyse auxquelles ces corpus permettent d’envisager des reponses.