Etude de l'impact d'un lexique bilingue spécialisé sur la performance d'un moteur de traduction à base d'exemples (Studying the impact of a specialized bilingual lexicon on the performance of an example-based machine translation engine)

La traduction automatique statistique bien que performante est aujourd’hui limitee parce qu’elle necessite de gros volumes de corpus paralleles qui n’existent pas pour tous les couples de langues et toutes les specialites et que leur production est lente et couteuse. Nous presentons, dans cet article, un prototype d’un moteur de traduction a base d’exemples utilisant la recherche d’information interlingue et ne necessitant qu’un corpus de textes en langue cible. Plus particulierement, nous proposons d’etudier l’impact d’un lexique bilingue de specialite sur la performance de ce prototype. Nous evaluons ce prototype de traduction et comparons ses resultats a ceux du systeme de traduction statistique Moses en utilisant les corpus paralleles anglais-francais Europarl (European Parliament Proceedings) et Emea (European Medicines Agency Documents). Les resultats obtenus montrent que le score BLEU du prototype du moteur de traduction a base d’exemples est proche de celui du systeme Moses sur des documents issus du corpus Europarl et meilleur sur des documents extraits du corpus Emea.