Constitution et exploitation de bi-textes pour l'Aide à la traduction
暂无分享,去创建一个
La presente etude est centree sur les problemes lies a la constitution des corpus bi-textuels et a leur exploitation pour l'aide a la traduction. D'abord, nous distinguons la traduction en tant qu'activite de communication du simple transcodage, impliquant le transfert des unites et des structures d'une langue vers une autre. Ainsi nous montrons que la traduction est une affaire d'interpretation. Nous examinons les problemes decoulant des divergences entre les organisations lexicales et grammaticales des deux langues, et montrons qu'il est difficile d'aboutir a des systemes de transformation generaux des lors qu'on integre les phenomenes idiomatiques. Nous en tirons la notion d'unite de traduction, cristallisant differents types de phenomenes contrastifs. La deuxieme partie est consacree a l'alignement phrastique, visant a la constitution automatique de bi-textes. Nous developpons les techniques les plus repandues et les mieux eprouvees, tant du point de vue des indices que des algorithmes. Par un travail empirique, nous montrons comment articuler ces techniques de facon optimale sur la base d'une heuristique simple. Enfin nous abordons les problemes de l'alignement au niveau lexical. Nous montrons que le critere de compositionnalite traductionnelle au niveau des mots ne permet pas d'extraire des couples coherents, tant du point de vue de la segmentation qu'au niveau de l'equivalence des segments apparies. Nous introduisons le concept de correspondance lexicale, designant l'appariement d'unites predefinies au niveau contrastif, et dont le transfert est considere comme facultatif. Nous montrons empiriquement comment ces correspondances peuvent etre extraites a partir d'indices adaptes et d'algorithmes simples. Les bi-textes apparaissent comme des gisements d'informations contrastives, dont les outils d'observation statistique permettent d'extraire les regularites, les equivalences generales emergeant a travers la masse des traductions particulieres.