Nouvelles stratégies d'analyses et de prédiction des structures tridimensionnelles des protéines

La representation de la structure tridimensionnelle des proteines classiquement caracterisee avec 3 etats distincts (helice, feuillet, boucle) demeure assez pauvre structurellement. Nous avons donc developpe une nouvelle methodologie pour concevoir des series de petits prototypes moyens nommes blocs proteiques (bps) pour permettre une approximation correcte des structures proteiques associee a une prediction locale acceptable. L'analyse de la specificite des bps sur le plan de leur stabilite et structurale, de leur composition en acides amines et les comparaisons avec d'autres alphabets existants ont ete realisees par la suite. Cette prediction locale de la structure proteique en termes de bps se fonde sur une methode bayesienne qui permet de comprendre les affinites des acides amines de maniere simple. Pour ameliorer cette prediction, nous nous sommes bases sur deux concepts : (i) 1 repliement local -> n sequences et (ii) 1 sequence -> n repliements. Le premier concept signifie que plusieurs types de sequences peuvent etre associes a la meme structure et le second qu'une sequence peut etre associee a plusieurs type de repliements. Ces deux aspects sont developpes en se basant sur la recherche d'un indice de fiabilite de la prediction locale, pour trouver des zones de forte predictibilite. Certains mots, i. E. Successions de bps apparaissant frequemment nous ont permis de definir un graphe de liaison des bps decrivant au mieux l'architecture des domaines proteiques. Du fait de cette redondance qui peut apparaitre dans la structure proteique, une methode de compactage qui permet d'associer des structures structurellement proches sur le plan local a ete mise au point. Cette approche appelee proteine hybride de conception simple permet de categoriser en classes structurellement dependantes l'ensemble des structures de la base de donnees proteiques. Cette approche peut etre utilisee dans la recherche d'homologie structurale et des dependances entre structures et sequences.