Zielgerichtetes Design von Aminosäuresequenzen mit Künstlichen Neuronalen Netzen

Es wird eine allgemeine Methode zur Entwicklung von neuronalen Filtersystemen zur Mustererkennung in Proteinsequenzen und fur deren zielgerichtetes Design vorgestellt. Das Verfahren der Pro tein Fi lterinduktion (PROFI) wird am Beispiel der Filterentwicklung zur Erkennung von Signalpeptidase-Schnittstellen veranschaulicht. Mit diesen neuronalen Filtersystemen werden auch Schnittstellen in unabhangigen Testsequenzen mit absoluter Genauigkeit vorhergesagt. Dies stellt eine deutliche Verbesserung gegenuber den bislang verwendeten statistischen Verfahren dar. Der entscheidende Unterschied des PROFI-Systems gegenuber anderen kunstlichen neuronalen Netzen zur Untersuchung von Proteinsequenzen liegt in der biologisch orientierten Datenreprasentation: Nicht Buchstabenfolgen, sondern biophysikalische Aminosaureeigenschaften der Sequenzen werden auf charakteristische Merkmale hin untersucht. Die Merkmalssuche kann man als eine Optimierungsaufgabe betrachten. Als Optimierungsverfahren wurde die Evolutionsstrategie angewandt. Mit diesem neuen Verfahren konnen sich in Zukunft einige Decodierungsprobleme in Proteinsequenzen losen lassen. Die mit PROFI entwickelten neuronalen Filtersysteme werden zur Prozesskontrolle beim rationalen Design von Aminosauresequenzen eingesetzt. Dazu wird ein Protein-Design Zyklus vorgestellt, der die Optimierung von Aminosauresequenzen nach diesem kybernetischen Modell ermoglicht (PROSID: Pro tein S equence I nductive D esign). Trainierte kunstliche neuronale Netze dienen dabei zur Reprasentation eines „idealen“ Proteinmodells, welches in einer sich wiederholenden Mutations-Selektions Prozedur aus einer zuachst zufallig gewahlten Aminosauresequenz durch S imulierte M olekulare E volution (SME) erzeugt werden kann. Dieses neue Syntheseverfahren ist als Prototyp fur DOS-Rechner in Modula2 implementiert.

[1]  T. Steitz,et al.  Identifying nonpolar transbilayer helices in amino acid sequences of membrane proteins. , 1986, Annual review of biophysics and biophysical chemistry.

[2]  M J Sternberg,et al.  Prediction of structural and functional features of protein and nucleic acid sequences by artificial neural networks. , 1992, Biochemistry.

[3]  P. Wrede,et al.  Signal analysis of protein targeting sequences , 1993 .

[4]  Gunnar von Heijne,et al.  Patterns of Amino Acids near Signal‐Sequence Cleavage Sites , 1983 .

[5]  K. R. Woods,et al.  Prediction of protein antigenic determinants from amino acid sequences. , 1981, Proceedings of the National Academy of Sciences of the United States of America.

[6]  M J Sternberg,et al.  Machine learning approach for the prediction of protein secondary structure. , 1990, Journal of molecular biology.

[7]  Engelbert Ziegler Computer in der Chemie , 1984 .

[8]  Thomas Lengauer,et al.  Informatik in den Biowissenschaften, 1. Fachtagung der GI-FG 4.0.3 "Informatik in den Biowissenschaften", Bonn, 15./16. Februar 1993, Proceedings , 1993, Informatik in den Biowissenschaften.

[9]  Dietmar Schomburg,et al.  Computer Aided Protein Design: Methods and Applications , 1993, Informatik in den Biowissenschaften.

[10]  D. D. Jones,et al.  Amino acid properties and side-chain orientation in proteins: a cross correlation appraoch. , 1975, Journal of theoretical biology.

[11]  George Cybenko,et al.  Approximation by superpositions of a sigmoidal function , 1992, Math. Control. Signals Syst..

[12]  D Perlman,et al.  A putative signal peptidase recognition site and sequence in eukaryotic and prokaryotic signal peptides. , 1983, Journal of molecular biology.

[13]  A. Zamyatnin,et al.  Protein volume in solution. , 1972, Progress in biophysics and molecular biology.

[14]  Ingo Rechenberg,et al.  Evolutionsstrategie : Optimierung technischer Systeme nach Prinzipien der biologischen Evolution , 1973 .

[15]  B H Robinson,et al.  The design of a biochip: a self-assembling molecular-scale memory device. , 1987, Protein engineering.

[16]  T. Sejnowski,et al.  Predicting the secondary structure of globular proteins using neural network models. , 1988, Journal of molecular biology.

[17]  Kurt Hornik,et al.  Multilayer feedforward networks are universal approximators , 1989, Neural Networks.

[18]  Geoffrey E. Hinton,et al.  Learning representations by back-propagating errors , 1986, Nature.