Aspects algorithmiques de la prédiction des structures secondaires d'ARN

Cette these traite deux types de problemes algorithmiques : des problemes de triangularisation de matrices booleennes par permutation des lignes et des colonnes et des problemes de decouverte de structures secondaires d'ARN. Nous etudions des problemes de triangularisation de matrices booleennes par permutation des lignes et des colonnes. Ce probleme apparait, par exemple, lorsque l'on souhaite calculer "en place" un systeme d'equations. Une facon naturelle d'aborder ce probleme est de se placer dans le cadre general de la theorie des graphes et des graphes bipartis en particulier. Nous presentons de nombreux resultats de complexite - essentiellement de NP-completude - lies a ce probleme et introduisons quelques extensions dont nous precisons toujours la complexite. Certaines familles d'ARN sont tres precisement definies par des motifs de sequence, et des contraintes structurelles secondaires et tertiaires. La plupart des outils ne sont pas adaptes puisqu'ils n'integrent pas toutes les connaissances sur la molecule lors de l'exploration des banques de sequences. D'ou l'interet d'algorithmes de recherche assurant une recherche en sequence et structure par le biais d'un descripteur defini par l'utilisateur integrant l'ensemble des connaissances caracterisant l'ARN a detecter. Une nouvelle facon d'aborder ce probleme consiste en l'etude de problemes algorithmiques sur les graphes d'intersection d'un ensemble de 2-intervalles. Cette notion de 2-intervalles se trouve dans la lignee des etudes actuelles en matiere d'algorithmique de graphes ou l'on etudie de plus en plus les structures des graphes issues de modeles geometriques. Nous presentons plusieurs resultats de complexite et montrons en particulier que la recherche de motifs dans un ensemble de 2-intervalles est un probleme NP-complet. Nous nous interessons, plus particulierement, a appliquer ces travaux pour la prediction de motifs biologiques structures. Plus specifiquement, nous avons mis au point l'algorithme ORANGE pour la prediction des introns auto-catalytiques de groupe 1 dans de grandes sequences genomiques. Cet algorithme est une amelioration de l'algorithme CITRON mis au point par F. Lisacek et F. Michel du point de vue de la rapidite d'execution. De plus, une mise-en-œuvre de l'algorithme ORANGE est accessible en ligne sur Internet.