Protein-Struktur-Vorhersage

Protein-Struktur-Vorhersage ist die Vorhersage der dreidimensionalen Struktur eines Proteins von seiner Aminosäure-Folge — d. h. die Vorhersage seines sekundären, tertiären, und Vierergruppe-Struktur von seiner primären Struktur. Struktur-Vorhersage ist vom umgekehrten Problem des Protein-Designs im Wesentlichen verschieden. Protein-Struktur-Vorhersage ist eine der wichtigsten Absichten, die durch bioinformatics und theoretische Chemie verfolgt sind; es ist in der Medizin (zum Beispiel, im Rauschgift-Design) und Biotechnologie (zum Beispiel, im Design von neuartigen Enzymen) hoch wichtig. Alle zwei Jahre wird die Leistung von aktuellen Methoden mit dem CASP-Experiment (Kritische Bewertung von Techniken für die Protein-Struktur-Vorhersage) bewertet.

Protein-Struktur und Fachsprache

Proteine sind Ketten von durch peptide Obligationen zusammengetroffenen Aminosäuren. Viele conformations dieser Kette sind wegen der Folge der Kette über jedes Cα Atom möglich. Es sind diese Informationsänderungen, die für Unterschiede in der dreidimensionalen Struktur von Proteinen verantwortlich sind. Jede Aminosäure in der Kette ist polar, d. h. es hat positive und negative angeklagte Gebiete mit einer freien C=O Gruppe getrennt, die als Wasserstoffband-Annehmer und eine NH Gruppe handeln kann, die als Wasserstoffband-Spender handeln kann. Diese Gruppen können deshalb in der Protein-Struktur aufeinander wirken. Die 20 Aminosäuren können gemäß der Chemie der Seitenkette klassifiziert werden, die auch eine wichtige Strukturrolle spielt. Glycine übernimmt eine spezielle Position, weil er keine Seitenkette hat und deshalb die lokale Flexibilität in der Protein-Struktur vergrößern kann. Cysteine kann andererseits mit einem anderen cysteine Rückstand reagieren und dadurch eine böse Verbindung bilden, die die ganze Struktur stabilisiert.

Die Protein-Struktur kann als eine Folge von sekundären Struktur-Elementen, wie α helices und β Platten betrachtet werden, die zusammen die gesamte dreidimensionale Konfiguration der Protein-Kette einsetzen. In diesen sekundären Strukturen werden regelmäßige Muster von H Obligationen zwischen benachbarten Aminosäuren gebildet, und die Aminosäuren haben ähnlichen Φ und Ψ-Winkel.

Die Bildung dieser Strukturen erklärt die polaren Gruppen auf jeder Aminosäure für neutral. Die sekundären Strukturen sind im Protein-Kern in einer hydrophoben Umgebung dicht gepackt. Jede Aminosäure-Seitengruppe hat ein beschränktes Volumen, um zu besetzen, und eine begrenzte Zahl von möglichen Wechselwirkungen mit anderem in der Nähe - Seitenketten, eine Situation, die im molekularen Modellieren und den Anordnungen in Betracht gezogen werden muss.

α-Spirale

Die α Spirale ist der reichlichste Typ der sekundären Struktur in Proteinen. Die α Spirale hat 3.6 Aminosäuren pro Umdrehung mit einem H zwischen jedem vierten Rückstand gebildeten Band; die durchschnittliche Länge ist 10 Aminosäuren (3 Umdrehungen) oder 10 Å, aber ändert sich von 5 bis

40 (1.5 zu 11 Umdrehungen). Die Anordnung der H Obligationen schafft einen Dipolmoment für die Spirale mit einer resultierenden teilweisen positiven Anklage am amino Ende der Spirale. Weil dieses Gebiet freie NH Gruppen hat, wird es mit negativ beladenen Gruppen wie Phosphate aufeinander wirken. Die allgemeinste Position von α helices ist an der Oberfläche von Protein-Kernen, wo sie eine Schnittstelle mit der wässrigen Umgebung versorgen. Die inner liegende Seite der Spirale neigt dazu, hydrophobe Aminosäuren und die Außen-Lseite wasserquellfähige Aminosäuren zu haben. So wird jedes Drittel von vier Aminosäuren entlang der Kette dazu neigen, ein Muster hydrophob zu sein, das ganz sogleich entdeckt werden kann. Im leucine Reißverschluss-Motiv ist ein sich wiederholendes Muster von leucines auf den liegenden Seiten von zwei angrenzenden helices das Motiv hoch prophetisch. Ein Anschlag des spiralenförmigen Rades kann verwendet werden, um dieses wiederholte Muster zu zeigen. Andere α helices begraben im Protein-Kern oder in Zellmembranen haben einen höheren und regelmäßigeren Vertrieb von hydrophoben Aminosäuren, und sind solche Strukturen hoch prophetisch. Auf der Oberfläche ausgestellte Helices haben ein niedrigeres Verhältnis von hydrophoben Aminosäuren. Aminosäure-Inhalt kann einen α - spiralenförmiges Gebiet prophetisch sein. Gebiete, die an alanine (A), glutamic Säure (E), leucine (L), und methionine (M) reicher sind und in der Pro-Linie (P), glycine (G), tyrosine (Y), und serine (S) schwächer sind, neigen dazu, eine α Spirale zu bilden. Pro-Linie destabilisiert oder bricht eine α Spirale, aber kann in längerem helices da sein, eine Kurve bildend. Es gibt Computerprogramme, um ganz zuverlässig die allgemeine Position von α helices in einer neuen Protein-Folge vorauszusagen.

β-Platte

β-Platten werden durch H Obligationen zwischen einem Durchschnitt von 5-10 Konsekutivaminosäuren in einem Teil der Kette mit weiterem 5-10 weiter unten die Kette gebildet. Die aufeinander wirkenden Gebiete, können mit einer kurzen Schleife zwischen, oder weit einzeln mit anderen Strukturen zwischen angrenzend sein. Jede Kette kann in derselben Richtung laufen, um eine parallele Platte zu bilden, jede andere Kette kann in der chemischen Rückrichtung laufen, um eine Anti-Parallele-Platte zu bilden, oder die Ketten können parallel sein und Anti-Parallele, um eine Mischplatte zu bilden. Das Muster des H-Abbindens ist in der Parallele und den Anti-Parallele-Konfigurationen verschieden. Jede Aminosäure in den Innenufern der Platte bildet zwei H Obligationen mit benachbarten Aminosäuren, wohingegen jede Aminosäure auf den Außenufern nur ein Band mit einem Innenufer bildet. Wenn man über die Platte rechtwinklig zu den Ufern schaut, werden entferntere Ufer ein bisschen gegen den Uhrzeigersinn rotieren gelassen, um eine linkshändige Drehung zu bilden. Die Cα Atome wechseln oben und unter der Platte in einer Plisseestruktur und den R Seitengruppen des Aminosäure-Stellvertreters oben und unter den Falten ab. Der Φ und die Ψ Winkel der Aminosäuren in Platten ändern sich beträchtlich in einem Gebiet des Anschlags von Ramachandran. Es ist schwieriger, die Position von β Platten vorauszusagen, als α helices. Die Situation verbessert einige was, wenn die Aminosäure-Schwankung in vielfachen Folge-Anordnungen in Betracht gezogen wird.

Schleife

Schleifen sind Gebiete einer Protein-Kette, die sind

(1) zwischen α helices und β Platten,

(2) verschiedener Längen und dreidimensionaler Konfigurationen und

(3) auf der Oberfläche der Struktur.

Haarnadel-Schleifen, die eine ganze Umdrehung in der polypeptide Kette vertreten, die sich zwei Antiparallele β Ufer anschließt, können mindestens zwei Aminosäuren in der Länge sein. Schleifen wirken mit der wässrigen Umgebungsumgebung und den anderen Proteinen aufeinander. Weil Aminosäuren in Schleifen durch den Raum und die Umgebung nicht beschränkt werden, wie Aminosäuren im Kerngebiet sind, und keine Wirkung auf die Einordnung von sekundären Strukturen im Kern, mehr Ersetzungen, den Einfügungen haben, und Auswischen vorkommen kann. So, in einer Folge-Anordnung, kann die Anwesenheit dieser Eigenschaften eine Anzeige einer Schleife sein. Die Positionen von introns in der genomic DNA entsprechen manchmal den Positionen von Schleifen im verschlüsselten Protein. Schleifen neigen auch dazu, gestürmt zu haben, und polare Aminosäuren und sind oft ein Bestandteil von aktiven Seiten. Eine ausführliche Überprüfung von Schleife-Strukturen hat gezeigt, dass sie in verschiedene Familien fallen.

Rollen

Ein Gebiet der sekundären Struktur, die nicht eine α Spirale, eine β Platte oder eine erkennbare Umdrehung ist, wird allgemein eine Rolle genannt.

Protein-Klassifikation

Proteine können sowohl gemäß der Strukturähnlichkeit als auch gemäß Folge-Ähnlichkeit klassifiziert werden. Für die Strukturklassifikation werden die Größen und Raumeinrichtungen von sekundären im obengenannten Paragrafen beschriebenen Strukturen in bekannten dreidimensionalen Strukturen verglichen. Auf der Folge-Ähnlichkeit gestützte Klassifikation war historisch erst, um verwendet zu werden. Am Anfang wurde auf Anordnungen von ganzen Folgen gestützte Ähnlichkeit durchgeführt. Später wurden Proteine auf der Grundlage vom Ereignis von erhaltenen Aminosäure-Mustern klassifiziert. Datenbanken, die Proteine durch ein oder mehr von diesen Schemas klassifizieren, sind verfügbar.

Im Betrachten von Protein-Klassifikationsschemas ist es wichtig, an mehrere Beobachtungen zu denken. Erstens können sich zwei völlig verschiedene Protein-Folgen von verschiedenen Entwicklungsursprüngen in eine ähnliche Struktur falten. Umgekehrt kann die Folge eines alten Gens für eine gegebene Struktur beträchtlich in verschiedenen Arten abgewichen sein, während sie zur gleichen Zeit dieselben grundlegenden Struktureigenschaften aufrechterhält. Das Erkennen jeder restlichen Folge-Ähnlichkeit in solchen Fällen kann eine sehr schwierige Aufgabe sein. Zweitens teilen zwei Proteine, die einen bedeutenden Grad der Folge-Ähnlichkeit entweder mit einander oder mit einer dritten Folge auch teilen, einen Entwicklungsursprung und sollten einige Struktureigenschaften auch teilen. Jedoch können Genverdoppelung und genetische Neuordnungen während der Evolution neue Genkopien verursachen, die sich dann zu Proteinen mit der neuen Funktion und Struktur entwickeln können.

Begriffe, die gebraucht sind, um Protein-Strukturen und Folgen zu klassifizieren

Die allgemeiner gebrauchten Begriffe, um Entwicklungs- und Strukturbeziehungen unter Proteinen zu beschreiben, werden unten verzeichnet. Viele zusätzliche Begriffe werden gebraucht, um verschiedene Arten von in Proteinen gefundenen Struktureigenschaften zu beschreiben. Beschreibungen solcher Begriffe können an der CATH Website die Website der Strukturklassifikation Von Proteinen (SCOP) und ein Glaxo-Wellcome Tutorenkurs auf dem schweizerischen bioinformatics Expasy Website gefunden werden.

1. Aktive Seite ist eine lokalisierte Kombination von Aminosäure-Seitengruppen innerhalb des tertiären (dreidimensional) oder Vierergruppe (Protein-Subeinheit) Struktur, die mit einem chemisch spezifischen Substrat aufeinander wirken kann und das das Protein mit der biologischen Tätigkeit versorgt. Proteine von sehr verschiedenen Aminosäure-Folgen können sich in eine Struktur falten, die dieselbe aktive Seite erzeugt.

2. Architektur beschreibt die Verhältnisorientierungen von sekundären Strukturen in einem dreidimensionalen - Struktur ohne Rücksicht darauf, ob sie eine ähnliche Schleife-Struktur teilen.

3. Falte ist ein Typ der Architektur, die auch eine erhaltene Schleife-Struktur hat.

4. Blöcke sind ein Begriff, der gebraucht ist, um ein erhaltenes Aminosäure-Folge-Muster in einer Familie von Proteinen zu beschreiben. Das Muster schließt eine Reihe von möglichen Matchs an jeder Position im Rips - übel genommene Folgen ein, aber es gibt nicht irgendwelche eingefügten oder gelöschten Positionen im Muster oder in den Folgen. Über die Unähnlichkeit sind Folge-Profile ein Typ, Matrix einzukerben, die einen ähnlichen Satz von Mustern vertritt, der Einfügungen und Auswischen einschließt.

5. Klasse ist ein Begriff, der gebraucht ist, um Protein-Gebiete gemäß ihrem sekundären Strukturinhalt und Organisation zu klassifizieren. Vier Klassen wurden von Levitt und Chothia (1976) ursprünglich anerkannt, und mehrere sind andere in der SCOP Datenbank hinzugefügt worden. Drei Klassen werden in der CATH Datenbank gegeben: hauptsächlich - α, mainly-β, und α-β, mit dem α-β Klasse sowohl einschließlich abwechselnd α/Β als auch einschließlich α +β Strukturen.

6. Kern ist der Teil eines gefalteten Protein-Moleküls, das das hydrophobe Interieur von α helices und β Platten umfasst. Die Kompaktstruktur bringt Seitengruppen von Aminosäuren in nahe genug Nähe zusammen, so dass sie aufeinander wirken können. Wenn er Protein-Strukturen, als in der SCOP Datenbank vergleicht, bezieht sich Kern auf das Gebiet, das für die meisten Strukturen üblich ist, die eine allgemeine Falte teilen, oder die in derselben Superfamilie sind. In der Struktur-Vorhersage wird Kern manchmal als die Einordnung von sekundären Strukturen definiert, die wahrscheinlich während der Entwicklungsänderung erhalten wird.

7. Gebiet (Folge-Zusammenhang)

Gebiet bezieht sich auf ein Segment einer polypeptide Kette, die sich in eine dreidimensionale Struktur ohne Rücksicht auf die Anwesenheit anderer Segmente der Kette falten kann. Die getrennten Gebiete eines gegebenen Proteins können umfassend aufeinander wirken oder können nur durch eine Länge der polypeptide Kette angeschlossen werden. Ein Protein mit mehreren Gebieten kann diese Gebiete für funktionelle Wechselwirkungen mit verschiedenen Molekülen verwenden.

8. Familie (Folge-Zusammenhang) ist eine Gruppe von Proteinen der ähnlichen biochemischen Funktion, die, wenn ausgerichtet, um mehr als 50 % identisch sind. Diese dieselbe Abkürzung wird noch von Protein Information Resource (PIR) verwendet. Eine Protein-Familie umfasst Proteine mit derselben Funktion in verschiedenen Organismen (orthologous Folgen), aber kann auch Proteine in denselben Organismus einschließen (paralogous Folgen) ist auf Genverdoppelung und Neuordnungen zurückzuführen gewesen. Wenn eine vielfache Folge-Anordnung einer Protein-Familie ein allgemeines Niveau der Ähnlichkeit überall in den Längen der Proteine offenbart, kennzeichnet PIR die Familie als eine homeomorphic Familie. Das ausgerichtete Gebiet wird ein homeomorphic Gebiet genannt, und dieses Gebiet kann mehrere kleinere Homologie-Gebiete umfassen, die mit anderen Familien geteilt werden. Familien können weiter in Unterfamilien unterteilt oder in auf jeweiligen höheren oder niedrigeren Ebenen der Folge-Ähnlichkeit gestützte Superfamilien gruppiert werden. Die SCOP Datenbank zeigt 1296 Familien und die CATH Datenbank (Beta der Version 1.7) an, zeigt 1846 Familien an.

Wenn die Folgen von Proteinen mit derselben Funktion im größeren Detail untersucht werden, wie man findet, teilen einige hohe Folge-Ähnlichkeit. Sie sind offensichtlich Mitglieder derselben Familie durch die obengenannten Kriterien. Jedoch werden andere gefunden, dass sehr wenig, oder sogar unbedeutend, Folge-Ähnlichkeit mit anderen Familienmitgliedern haben. In solchen Fällen kann die Familienbeziehung zwischen zwei entfernten Familienmitgliedern A und C häufig durch die Entdeckung eines zusätzlichen Familienmitgliedes B demonstriert werden, das bedeutende Ähnlichkeit sowohl mit A als auch mit C teilt. So stellt B ein Bindeglied zwischen A und C zur Verfügung. Eine andere Annäherung soll entfernte Anordnungen für hoch erhaltene Matchs untersuchen.

An einem Niveau der Identität von 50 % werden Proteine wahrscheinlich dasselbe drei-Dimensionen-al Struktur haben, und die identischen Atome in der Folge-Anordnung werden auch innerhalb von etwa 1 Å im Strukturmodell superbeeindrucken. So, wenn die Struktur eines Mitgliedes einer Familie bekannt ist, kann eine zuverlässige Vorhersage für ein zweites Mitglied der Familie, und je höher das Identitätsniveau, desto zuverlässiger die Vorhersage gemacht werden. Das Strukturmodellieren des Proteins kann durch das Überprüfen durchgeführt werden, wie gut die Aminosäure-Ersetzungen den Kern der dreidimensionalen Struktur einbauen.

9. Familie (Strukturzusammenhang), wie verwendet, in der FSSP Datenbank (Familien strukturell ähnlicher Proteine) und die DALI/FSSP Website, bezieht sich auf zwei Strukturen, die ein bedeutendes Niveau der Strukturähnlichkeit, aber nicht notwendigerweise bedeutenden Folge-Ähnlichkeit haben.

10. Falte ist ein Begriff mit der ähnlichen Bedeutung zum Strukturmotiv, aber bezieht sich im Allgemeinen auf eine etwas größere Kombination von sekundären Struktureinheiten in derselben Konfiguration. So haben Proteine, die dieselbe Falte teilen, dieselbe Kombination von sekundären Strukturen, die durch ähnliche Schleifen verbunden werden. Ein Beispiel ist die Falte von Rossman, die mehreres Wechseln α helices und Parallele β Ufer umfasst. Im SCOP, CATH und den FSSP Datenbanken, sind die bekannten Protein-Strukturen in hierarchische Niveaus der Strukturkompliziertheit mit der Falte als ein grundlegendes Niveau der Klassifikation eingeteilt worden.

11. Homologes Gebiet (Folge-Zusammenhang) bezieht sich auf ein verlängertes Folge-Muster, das allgemein durch Folge-Anordnungsmethoden gefunden ist, der einen allgemeinen Entwicklungsursprung unter den ausgerichteten Folgen anzeigt. Ein Homologie-Gebiet ist allgemein länger als Motive. Das Gebiet kann die ganze gegebene Protein-Folge oder nur einen Teil der Folge einschließen. Einige Gebiete sind kompliziert und aus mehreren kleineren Homologie-Gebieten zusammengesetzt, die angeschlossen geworden sind, um einen größeren während der Evolution zu bilden. Ein Gebiet, das eine komplette Folge bedeckt, wird das homeomorphic Gebiet durch PIR (Protein-Informationsquelle) genannt.

12. Modul ist ein Gebiet von erhaltenen Aminosäure-Mustern, die ein oder mehr Motive und betrachtet umfassen, eine grundsätzliche Einheit der Struktur oder Funktion zu sein. Die Anwesenheit eines Moduls ist auch verwendet worden, um Proteine in Familien einzuteilen.

13. Motiv (Folge-Zusammenhang) bezieht sich auf ein erhaltenes Muster von Aminosäuren, das in zwei oder mehr Proteinen gefunden wird. Im Pro-Seite-Katalog ist ein Motiv ein Aminosäure-Muster, das in einer Gruppe von Proteinen gefunden wird, die eine ähnliche biochemische Tätigkeit haben, und das häufig in der Nähe von der aktiven Seite des Proteins ist. Beispiele von Folge-Motiv-Datenbanken sind der Pro-Seite-Katalog (http://www.expasy.ch/prosite) und Stanford Motive Datenbank (http://dna.stanford.edu/emotif/).

14. Motiv (Strukturzusammenhang) bezieht sich auf eine Kombination von mehreren sekundären strukturellen ele-ments erzeugt durch die Falte von angrenzenden Abteilungen der polypeptide Kette in eine spezifische dreidimensionale Konfiguration. Ein Beispiel ist das Motiv der Schleife-Spirale der Spirale. Strukturmotive werden auch supersekundäre Strukturen und Falten genannt.

15. Mit der Position spezifische zählende Matrix (Folge-Zusammenhang, auch bekannt als Gewicht oder das Zählen der Matrix) vertritt ein erhaltenes Gebiet in einer vielfachen Folge-Anordnung ohne Lücken. Jede Matrixsäule vertritt die in einer Säule der vielfachen Folge-Anordnung gefundene Schwankung.

Mit der Position spezifische zählende Matrix — 3D (Strukturzusammenhang) vertritt die Aminosäure-Schwankung, die in einer Anordnung von Proteinen gefunden ist, die in dieselbe Strukturklasse fallen. Matrixsäulen vertreten die Aminosäure-Schwankung, die bei einer Aminosäure-Position in den ausgerichteten Strukturen gefunden ist.

16. Primäre Struktur bezieht sich auf die geradlinige Aminosäure-Folge eines Proteins, das chemisch eine polypeptide Kette ist, die aus durch peptide Obligationen angeschlossenen Aminosäuren zusammengesetzt ist.

17. Profil (Folge-Zusammenhang) ist eine Zählen-Matrix, die eine vielfache Folge-Anordnung einer Protein-Familie vertritt. Das Profil wird gewöhnlich bei einem gut erhaltenen Gebiet in einer vielfachen Folge-Anordnung erhalten. Das Profil ist in der Form einer Matrix mit jeder Säule, die eine Position in der Anordnung und jeder Reihe eine der Aminosäuren vertritt. Matrixwerte geben die Wahrscheinlichkeit jeder Aminosäure an der entsprechenden Position in der Anordnung. Das Profil wird entlang der Zielfolge bewegt, um die besten zählenden Gebiete durch einen dynamischen Programmieralgorithmus ausfindig zu machen. Lücken wird während des Zusammenbringens erlaubt, und eine Lücke-Strafe wird in diesem Fall als eine negative Kerbe eingeschlossen, wenn keine Aminosäure verglichen wird. Ein Folge-Profil kann auch durch ein verborgenes Modell von Markov, gekennzeichnet als ein Profil HMM (verborgenes markov Modell) vertreten werden.

18. Profil (Strukturzusammenhang) ist eine Zählen-Matrix, die vertritt, welche Aminosäuren gut passen sollten, und der schlecht an folgenden Positionen in einer bekannten Protein-Struktur passen sollte. Profil-Säulen vertreten folgende Positionen in der Struktur, und Profil-Reihen vertreten die 20 Aminosäuren. Als mit einem Folge-Profil wird das Strukturprofil entlang einer Zielfolge bewegt, um die höchstmögliche Anordnungskerbe durch einen dynamischen Programmieralgorithmus zu finden. Lücken können eingeschlossen werden und eine Strafe erhalten. Die resultierende Kerbe stellt eine Anzeige betreffs zur Verfügung, ob das Zielprotein solch eine Struktur annehmen könnte.

19. Vierergruppe-Struktur ist die dreidimensionale Konfiguration eines Protein-Moleküls, das mehrere unabhängige polypeptide Ketten umfasst.

20. Sekundäre Struktur bezieht sich auf die Wechselwirkungen, die zwischen dem C O und den NH Gruppen auf Aminosäuren in einer polypeptide Kette vorkommen, um α helices, β Platten, Umdrehungen, Schleifen und andere Formen zu bilden, und die die Falte in eine dreidimensionale Struktur erleichtern.

21. Superfamilie ist eine Gruppe von Protein-Familien derselben oder verschiedenen Längen, die durch den entfernten noch feststellbare Folge-Ähnlichkeit verbunden sind. Mitglieder einer gegebenen Superfamilie haben so einen allgemeinen Entwicklungsursprung. Ursprünglich hat Dayhoff die Abkürzung für den Superfamilienstatus als seiend die Chance definiert, dass die Folgen 10 6, auf der Grundlage von einer Anordnungskerbe nicht verbunden sind (Dayhoff u. a. 1978). Proteine mit weniger Identität in einer Anordnung der Folgen, aber mit einer überzeugend allgemeinen Zahl von strukturellen und funktionellen Eigenschaften werden in dieselbe Superfamilie gelegt. Am Niveau der dreidimensionalen Struktur werden Superfamilienproteine allgemeine Struktureigenschaften wie eine allgemeine Falte teilen, aber es kann auch Unterschiede in der Zahl und Einordnung von sekundären Strukturen geben. Die PIR Quelle gebraucht den Begriff homeomorphic Superfamilien, um sich auf Superfamilien zu beziehen, die aus Folgen zusammengesetzt werden, die von der Länge nach ausgerichtet werden können, ein Teilen des einzelnen Folge-Homologie-Gebiets, ein Gebiet der Ähnlichkeit vertretend, die sich während der Anordnung ausstreckt. Dieses Gebiet kann auch kleinere Homologie-Gebiete umfassen, die mit anderen Protein-Familien und Superfamilien geteilt werden. Obwohl eine gegebene Protein-Folge Gebiete enthalten kann, die in mehreren Superfamilien gefunden sind, so eine komplizierte Entwicklungsgeschichte anzeigend, werden Folgen nur einer homeomorphic Superfamilie zugeteilt, die auf der Anwesenheit der Ähnlichkeit während einer vielfachen Folge-Anordnung gestützt ist. Die Superfamilienanordnung kann auch Gebiete einschließen, die sich entweder innerhalb oder an den Enden der Anordnung nicht ausrichten. Im Gegensatz richten sich Folgen in derselben Familie gut während der Anordnung aus.

22. Supersekundäre Struktur ist ein Begriff mit der ähnlichen Bedeutung zu einem Strukturmotiv. Tertiäre Struktur ist die dreidimensionale oder kugelförmige Struktur, die durch die Verpackung zusammen oder Falte von sekundären Strukturen einer polypeptide Kette gebildet ist.

Sekundäre Struktur

Sekundäre Struktur-Vorhersage ist eine Reihe von Techniken in bioinformatics, die zum Ziel haben, die lokalen sekundären Strukturen von Proteinen und RNS-Folgen gestützt nur auf Kenntnissen ihrer primären Struktur — Aminosäure oder nucleotide Folge beziehungsweise vorauszusagen. Für Proteine besteht eine Vorhersage daraus, Gebiete der Aminosäure-Folge als wahrscheinliches Alpha helices, Beta-Ufer (häufig bemerkt, wie "erweitert", conformations), oder Umdrehungen zuzuteilen. Der Erfolg einer Vorhersage wird durch das Vergleichen davon mit den Ergebnissen des DSSP auf die Kristallstruktur des Proteins angewandten Algorithmus bestimmt; für Nukleinsäuren kann es vom Wasserstoffabbinden-Muster bestimmt werden. Spezialalgorithmen sind für die Entdeckung von spezifischen bestimmten Mustern wie transmembrane helices entwickelt worden und haben Rollen in Proteinen oder kanonische microRNA Strukturen in der RNS aufgerollt.

Die besten modernen Methoden der sekundären Struktur-Vorhersage in Proteinen erreichen ungefähr 80 % Genauigkeit; diese hohe Genauigkeit erlaubt den Gebrauch der Vorhersagen in der Falte-Anerkennung und ab initio Protein-Struktur-Vorhersage, Klassifikation von Strukturmotiven und Verbesserung von Folge-Anordnungen. Die Genauigkeit des aktuellen Proteins sekundäre Struktur-Vorhersagemethoden wird mit wöchentlichen Abrisspunkten wie LiveBench und EVA bewertet.

Hintergrund

Frühe Methoden der sekundären Struktur-Vorhersage, eingeführt in den 1960er Jahren und Anfang der 1970er Jahre, konzentriert das Identifizieren wahrscheinlichen Alphas helices und haben hauptsächlich auf Übergang-Modellen der Spirale-Rolle basiert. Bedeutsam genauere Vorhersagen, die Beta-Platten eingeschlossen haben, wurden in den 1970er Jahren eingeführt und haben sich auf statistische auf Wahrscheinlichkeitsrahmen gestützte Bewertungen verlassen ist auf bekannte gelöste Strukturen zurückzuführen gewesen. Diese Methoden, die auf eine einzelne Folge angewandt sind, sind normalerweise höchstens, und häufig underpredict Beta-Platten um ungefähr 60-65 % genau. Die Entwicklungsbewahrung von sekundären Strukturen kann durch das gleichzeitige Festsetzen vieler homologer Folgen in einer vielfachen Folge-Anordnung, durch das Rechnen der sekundären Nettostruktur-Neigung einer ausgerichteten Säule von Aminosäuren ausgenutzt werden. Gemeinsam mit größeren Datenbanken bekannter Protein-Strukturen und moderner Maschinenlernmethoden wie Nervennetze und Unterstützungsvektor-Maschinen können diese Methoden um gesamte 80-%-Genauigkeit in kugelförmigen Proteinen erreichen. Die theoretische obere Grenze der Genauigkeit ist ungefähr 90 % teilweise wegen Eigentümlichkeiten in der DSSP Anweisung in der Nähe von den Enden von sekundären Strukturen, wo lokal, ändern sich conformations unter heimischen Bedingungen, aber können gezwungen werden, eine einzelne Angleichung in Kristallen wegen sich verpacken lassender Einschränkungen anzunehmen. Beschränkungen werden auch durch die sekundäre Struktur-Vorhersageunfähigkeit auferlegt, für tertiäre Struktur verantwortlich zu sein; zum Beispiel kann eine als eine wahrscheinliche Spirale vorausgesagte Folge noch im Stande sein, eine Angleichung des Beta-Ufers anzunehmen, wenn sie innerhalb eines Gebiets der Beta-Platte des Proteins und seines Seitenkettensatzes gut mit ihren Nachbarn gelegen wird. Dramatische Conformational-Änderungen, die mit der Funktion oder Umgebung des Proteins verbunden sind, können auch lokale sekundäre Struktur verändern.

Methode von Chou-Fasman

Die Methode von Chou-Fasman war unter den ersten sekundären Struktur-Vorhersagealgorithmen entwickelt und verlässt sich vorherrschend auf Wahrscheinlichkeitsrahmen, die von Verhältnisfrequenzen des Äußeren jeder Aminosäure in jedem Typ der sekundären Struktur bestimmt sind. Die ursprünglichen Rahmen von Chou-Fasman, die von der kleinen Probe von Mitte der 1970er Jahre gelösten Strukturen bestimmt sind, erzeugen schlechte Ergebnisse im Vergleich zu modernen Methoden, obwohl der parameterization aktualisiert worden ist, seitdem es zuerst veröffentlicht wurde. Die Methode von Chou-Fasman ist im Voraussagen sekundärer Strukturen um ungefähr 50-60 % genau.

GOR Methode

Die GOR Methode, die für die drei Wissenschaftler genannt ist, die es — Garnier, Osguthorpe und Robson entwickelt haben — ist eine Information Theorie-basierte Methode entwickelt nicht lange nach Chou-Fasman. Es verwendet stärkere probabilistic Techniken der Schlussfolgerung von Bayesian. Die Methode ist eine spezifische optimierte Anwendung der Mathematik und Algorithmen, die in einer Reihe von Vorträgen von Robson und Kollegen, eg. und entwickelt sind). Die GOR Methode ist zur fortlaufenden Erweiterung durch solche Grundsätze fähig, und ist mehrere Versionen durchgegangen. Die GOR Methode zieht nicht nur die Wahrscheinlichkeit jeder Aminosäure in Betracht, die eine besondere sekundäre Struktur, sondern auch die bedingte Wahrscheinlichkeit der Aminosäure hat, die jede Struktur gegeben die Beiträge seiner Nachbarn annimmt (es nimmt nicht an, dass die Nachbarn diese dieselbe Struktur haben). Die Annäherung ist sowohl empfindlicher als auch genauer als dieser von Chou und Fasman, weil Aminosäure Strukturneigungen nur für eine kleine Zahl von Aminosäuren wie Pro-Linie und glycine stark ist. Schwache Beiträge von jedem von vielen Nachbarn können sich auf starke Wirkung insgesamt belaufen. Die ursprüngliche GOR Methode war um ungefähr 65 % genau und ist im Voraussagen des Alphas helices drastisch erfolgreicher als Beta-Platten, der es oft mispredicted als Schleifen oder aufgelöste Gebiete. Später haben GOR Methoden auch Paare von Aminosäuren gedacht, bedeutsam Leistung verbessernd. Der Hauptunterschied zur folgenden Technik ist vielleicht, dass die Gewichte in einem implizierten Netz, Begriffe beizutragen, a priori von der statistischen Analyse von Proteinen der bekannten Struktur damit beauftragt werden, nicht durch das Feed-Back, Abmachung mit einem Lehrsatz von solchem zu optimieren.

Das Maschinenlernen

Nervennetzmethoden verwenden Lehrsätze von gelösten Strukturen, um allgemeine mit besonderen Maßnahmen von sekundären Strukturen vereinigte Folge-Motive zu identifizieren. Diese Methoden sind in ihren Vorhersagen um mehr als 70 % genau, obwohl Beta-Ufer noch häufig underpredicted wegen des Mangels an der dreidimensionalen Strukturinformation sind, die Bewertung von Wasserstoffabbinden-Mustern erlauben würde, die Bildung der verlängerten für die Anwesenheit einer ganzen Beta-Platte erforderlichen Angleichung fördern können.

Unterstützungsvektor-Maschinen haben sich besonders nützlich erwiesen, für die Positionen von Umdrehungen vorauszusagen, die schwierig sind, sich mit statistischen Methoden zu identifizieren. Die Voraussetzung von relativ kleinen Lehrsätzen ist auch als ein Vorteil zitiert worden zu vermeiden, zu vorhandenen Strukturdaten überzupassen.

Erweiterungen der Maschine, die Techniken erfährt, versuchen, mehr feinkörnige lokale Eigenschaften von Proteinen wie Rückgrat-Dieder-Winkel in unbestimmten Gebieten vorauszusagen. Sowohl SVMs als auch Nervennetze sind auf dieses Problem angewandt worden.

Andere Verbesserungen

Es wird berichtet, dass zusätzlich zur Protein-Folge sekundäre Struktur-Bildung von anderen Faktoren abhängt. Zum Beispiel wird es berichtet, dass sekundäre Struktur-Tendenzen auch von der lokalen Umgebung, lösenden Zugänglichkeit von Rückständen, Protein Strukturklasse und sogar der Organismus abhängen, bei dem die Proteine erhalten werden. Gestützt auf solchen Beobachtungen haben einige Studien gezeigt, dass sekundäre Struktur-Vorhersage durch die Hinzufügung der Information über das Protein Strukturklasse, Rückstand zugängliche Fläche und auch Kontaktnummer-Information verbessert werden kann.

Folge covariation Methoden verlässt sich auf die Existenz einer Datei, die aus vielfachen homologen RNS-Folgen mit zusammenhängenden, aber unterschiedlichen Folgen zusammengesetzt ist. Diese Methoden analysieren den covariation von individuellen Grundseiten in der Evolution; die Wartung an zwei weit getrennten Seiten eines Paares der Grundpaarung nucleotides zeigt die Anwesenheit eines strukturell erforderlichen Wasserstoffbandes zwischen jenen Positionen an. Wie man gezeigt hat, ist das allgemeine Problem der Pseudoknoten-Vorhersage NP-complete gewesen.

Tertiäre Struktur

Die praktische Rolle der Protein-Struktur-Vorhersage ist jetzt wichtiger als jemals. Massive Beträge von Protein-Folge-Daten werden durch die moderne groß angelegte DNA sequencing Anstrengungen wie das Humangenomprojekt erzeugt. Trotz weiter Gemeinschaft Anstrengungen in strukturellem genomics vergeht die Produktion experimentell entschlossener Protein-Strukturen — normalerweise durch die zeitraubende und relativ teure Röntgenstrahl-Kristallographie oder NMR Spektroskopie — weit hinter der Produktion von Protein-Folgen langsam.

Die Protein-Struktur-Vorhersage bleibt ein äußerst schwieriges und ungelöstes Unternehmen. Die zwei Hauptprobleme sind Berechnung des Proteins freie Energie und Entdeckung des globalen Minimums dieser Energie. Eine Protein-Struktur-Vorhersagemethode muss den Raum von möglichen Protein-Strukturen erforschen, der astronomisch groß ist. Diese Probleme können im "vergleichenden" oder dem Homologie-Modellieren und den Falte-Anerkennungsmethoden teilweise umgangen werden, in denen der Suchraum durch die Annahme beschnitten wird, dass das fragliche Protein eine Struktur annimmt, die der experimentell entschlossenen Struktur eines anderen homologen Proteins nah ist. Andererseits müssen der de novo oder ab initio die Protein-Struktur-Vorhersagemethoden diese Probleme ausführlich auflösen. Der Fortschritt und die Herausforderungen in der Protein-Struktur-Vorhersage sind in Zhang 2008 nachgeprüft worden.

Ab initio das Protein-Modellieren

Ab initio oder bemühen sich de novo-Protein-Modellieren-Methoden, dreidimensionale Protein-Modelle "von Kratzer", d. h., gestützt auf physischen Grundsätzen aber nicht (direkt) auf vorher gelösten Strukturen zu bauen. Es gibt viele mögliche Verfahren, dass entweder versuchen Sie, Protein-Falte nachzuahmen oder eine stochastische Methode anzuwenden, mögliche Lösungen (d. h., globale Optimierung einer passenden Energiefunktion) zu suchen. Diese Verfahren neigen dazu, riesengroße rechenbetonte Mittel zu verlangen, und sind so nur für winzige Proteine ausgeführt worden. Protein-Struktur de novo für größere Proteine vorauszusagen, wird bessere Algorithmen und größere rechenbetonte Mittel wie diejenigen verlangen, die entweder durch starke Supercomputer (wie Blaues Gen oder durch MDGRAPE-3) oder verteilte Computerwissenschaft (solcher als Folding@home, der Menschliche Proteome gewährt sind, der Projekt und Rosetta@Home Faltet). Obwohl diese rechenbetonten Barrieren riesengroß sind, machen die potenziellen Vorteile von strukturellem genomics (durch vorausgesagte oder experimentelle Methoden) ab initio Struktur-Vorhersage ein aktives Forschungsfeld.

Als eine Zwischenstufe zu vorausgesagten Protein-Strukturen, setzen Sie sich mit Karte-Vorhersagen in Verbindung sind vorgeschlagen worden.

Das vergleichende Protein-Modellieren

Das vergleichende Protein-Modellieren verwendet vorher gelöste Strukturen als Startpunkte oder Schablonen. Das ist wirksam, weil es scheint, dass, obwohl die Zahl von wirklichen Proteinen riesengroß ist, es einen beschränkten Satz von tertiären Strukturmotiven gibt, denen die meisten Proteine gehören. Es ist darauf hingewiesen worden, dass es nur ungefähr 2,000 verschiedene Protein-Falten in der Natur gibt, obwohl es viele Millionen von verschiedenen Proteinen gibt.

Diese Methoden können auch in zwei Gruppen gespalten werden:

Das Homologie-Modellieren: Basiert auf der angemessenen Annahme, dass zwei homologe Proteine sehr ähnliche Strukturen teilen werden. Weil eine Falte eines Proteins evolutionärer erhalten wird als seine Aminosäure-Folge, kann eine Zielfolge mit der angemessenen Genauigkeit auf einer sehr entfernt zusammenhängenden Schablone modelliert werden, vorausgesetzt, dass die Beziehung zwischen Ziel und Schablone durch die Folge-Anordnung wahrgenommen werden kann. Es ist darauf hingewiesen worden, dass der primäre Engpass im vergleichenden Modellieren aus Schwierigkeiten in der Anordnung aber nicht aus Fehlern in der Struktur-Vorhersage gegeben ein bekannter - gute Anordnung entsteht. Unüberraschend ist das Homologie-Modellieren am genauesten, wenn das Ziel und die Schablone ähnliche Folgen haben.

Einfädelndes Protein: Scannt die Aminosäure-Folge einer unbekannten Struktur gegen eine Datenbank von gelösten Strukturen. In jedem Fall wird eine Zählen-Funktion verwendet, um die Vereinbarkeit der Folge zur Struktur zu bewerten, so mögliche dreidimensionale Modelle nachgebend. Dieser Typ der Methode ist auch bekannt als 3D-1D-Falte-Anerkennung wegen seiner Vereinbarkeitsanalyse zwischen dreidimensionalen Strukturen und geradlinigen Protein-Folgen. Diese Methode hat auch Methoden verursacht, die eine umgekehrte sich faltende Suche durch das Auswerten der Vereinbarkeit einer gegebenen Struktur mit einer großen Datenbank von Folgen, so das Voraussagen durchführen, welche Folgen das Potenzial haben, um eine gegebene Falte zu erzeugen.

Seitenkette-Geometrie-Vorhersage

Die genaue Verpackung der Aminosäure-Seitenketten vertritt ein getrenntes Problem in der Protein-Struktur-Vorhersage. Methoden, die spezifisch das Problem richten, Seitenkette-Geometrie vorauszusagen, schließen Sackgasse-Beseitigung und die konsequenten Mittelfeldmethoden ein. Die Seitenkette conformations mit der niedrigen Energie wird gewöhnlich auf dem starren polypeptide Rückgrat und Verwenden einer Reihe getrennter Seitenkette conformations bekannt als "rotamers" bestimmt. Die Methoden versuchen, den Satz von rotamers zu identifizieren, die die gesamte Energie des Modells minimieren.

Diese Methoden verwenden rotamer Bibliotheken, die Sammlungen von günstigem conformations für jeden Rückstand-Typ in Proteinen sind. Bibliotheken von Rotamer können Information über die Angleichung, seine Frequenz und die Standardabweichungen über zweiflächige Mittelwinkel enthalten, die in der Stichprobenerhebung verwendet werden können. Bibliotheken von Rotamer werden aus strukturellem bioinformatics oder anderer statistischer Analyse der Seitenkette conformations in bekannten experimentellen Strukturen von Proteinen, solcher als durch das Sammeln des beobachteten conformations für vierflächigen Kohlenstoff in der Nähe vom gestaffelten (60 °, 180 °,-60 °) Werte abgeleitet.

Bibliotheken von Rotamer können mit dem Rückgrat unabhängig, sekundär von der Struktur abhängig, oder von dem Rückgrat abhängig sein. Mit dem Rückgrat unabhängige rotamer Bibliotheken spielen auf die Rückgrat-Angleichung an, und werden von allen verfügbaren Seitenketten eines bestimmten Typs berechnet (zum Beispiel, das erste Beispiel einer rotamer Bibliothek, getan dadurch Grübeln und Richards an Yale 1987). Sekundäre von der Struktur abhängige Bibliotheken präsentieren verschiedene zweiflächige Winkel und/oder rotamer Frequenzen für - Spirale, - Platte, oder rollen sekundäre Strukturen auf. Vom Rückgrat abhängige rotamer Bibliotheken präsentieren conformations und/oder Frequenzabhängigen auf der lokalen Rückgrat-Angleichung, wie definiert, durch die Rückgrat-Dieder-Winkel und unabhängig von der sekundären Struktur.

Die modernen Versionen dieser im grössten Teil der Software so verwendeten Bibliotheken werden präsentiert wie mehrdimensionaler Vertrieb der Wahrscheinlichkeit oder Frequenz, wo die Spitzen dem zweiflächigen Winkel conformations betrachtet als individueller rotamers in den Listen entsprechen. Einige Versionen basieren auf sehr sorgfältig curated Daten und werden in erster Linie für die Struktur-Gültigkeitserklärung verwendet, während andere Verhältnisfrequenzen in viel größeren Dateien betonen und die Form verwendet in erster Linie für die Struktur-Vorhersage wie die Bibliotheken von Dunbrack rotamer sind.

Seitenkette-Verpackungsmethoden sind am nützlichsten, für den hydrophoben Kern des Proteins zu analysieren, wo Seitenketten näher gepackt sind; sie haben mehr Schwierigkeit, die loseren Einschränkungen und höhere Flexibilität von Oberflächenrückständen richtend, die häufig vielfachen rotamer conformations aber nicht gerade ein besetzen.

Vorhersage von Strukturklassen

Statistische Methoden sind entwickelt worden, um Strukturklassen von Proteinen vorauszusagen, die auf ihrer Aminosäure-Zusammensetzung, Pseudoaminosäure-Zusammensetzung und funktioneller Bereichszusammensetzung gestützt sind.

Vierergruppe-Struktur

Im Fall von Komplexen von zwei oder mehr Proteinen, wo die Strukturen der Proteine bekannt sind oder mit der hohen Genauigkeit vorausgesagt werden können, können Docken-Methoden des Protein-Proteins verwendet werden, um die Struktur des Komplexes vorauszusagen. Die Information der Wirkung von Veränderungen an spezifischen Seiten auf der Sympathie des Komplexes hilft, die komplizierte Struktur zu verstehen und dockende Methoden zu führen.

Software

I-TASSER ist der beste Server für die Protein-Struktur-Vorhersage gemäß den 2006-2010 CASP-Experimenten (CASP7, CASP8 und CASP9). Das eigenständige I-TASSER Paket ist für das Download frei verfügbar.

RaptorX ragt im Übereinstimmen harter Ziele gemäß den CASP9 2010-Experimenten hervor.

RaptorX erzeugt die bedeutsam besseren Anordnungen für die härtesten 50 CASP9 Schablone-basierten modellierenden Ziele als andere Server einschließlich derjenigen, die Einigkeit und Verbesserungsmethoden verwenden.

Der Server von RaptorX ist am Server verfügbar

MODELLIERER ist ein populäres Softwarewerkzeug, um Homologie-Modelle mit der Methodik zu erzeugen, ist auf NMR Spektroskopie-Datenverarbeitung zurückzuführen gewesen. SwissModel stellt einen automatisierten Webserver für das grundlegende Homologie-Modellieren zur Verfügung.

HHpred, bioinfo.pl und Robetta haben weit Server für die Protein-Struktur-Vorhersage verwendet. HHsearch ist ein Paket der kostenlosen Software für das Protein einfädelnde und entfernte Homologie-Entdeckung.

SPARKSx ist einer der leistenden Spitzenserver im CASP hat sich auf die entfernte Falte-Anerkennung konzentriert.

MIT DEM PEP FACH ist ein de novo Annäherung hat darauf gezielt, peptide Strukturen von Aminosäure-Folgen vorauszusagen, die auf einem HMM Strukturalphabet gestützt sind.

Phyre und Phyre2 sind unter den leistenden Spitzenservern in den CASP internationalen blinden Proben mit der Struktur-Vorhersage im Homologie-Modellieren und der entfernten Falte-Anerkennung, und werden mit einer Betonung auf der Bequemlichkeit des Gebrauches für Nichtexperten entworfen.

RAPTOR (Software) ist eine Protein-Einfädeln-Software, die auf der Programmierung der ganzen Zahl basiert. Der grundlegende Algorithmus für das Einfädeln wird darin beschrieben und ist ziemlich aufrichtig, um durchzuführen.

QUARK ist ein für ab initio das Protein-Struktur-Modellieren passender Online-Server.

Ist ein Molekulares Dynamik-Programm, um Simulationen mit ausführlichen oder impliziten Wassermodellen zu falten.

TIPP ist ein knowledgebase von STRUCTFAST Modellen und vorgeschätzten Ähnlichkeitsbeziehungen zwischen Folgen, Strukturen und verbindlichen Seiten. Mehrere verteilte Rechenprojekte bezüglich der Protein-Struktur-Vorhersage sind auch, solcher als Folding@home, Rosetta@home, Menschlicher Proteome durchgeführt worden, der Projekt, Predictor@home, und TANPAKU Faltet.

Das Foldit Programm bemüht sich, die Muster-Anerkennung und Rätsel lösenden zum Menschenverstand innewohnenden geistigen Anlagen zu untersuchen, um erfolgreichere Computerprotein-Struktur-Vorhersagesoftware zu schaffen.

Rechenbetonte Annäherungen stellen einen schnellen Alternativweg der Antikörper-Struktur-Vorhersage zur Verfügung. Kürzlich entwickelter Antikörper F Gebiet, wie man gezeigt hat, haben hohe Entschlossenheitsstruktur-Vorhersagealgorithmen, wie RosettaAntibody, hohe Entschlossenheitshomologie-Modelle erzeugt, die für das erfolgreiche Docken verwendet worden sind.

Rezensionen der Software für die Struktur-Vorhersage können daran gefunden werden.

Automatische Struktur-Vorhersageserver

CASP, der für Kritische Bewertung von Techniken für die Protein-Struktur-Vorhersage eintritt, ist ein weite Gemeinschaft Experiment für die Protein-Struktur-Vorhersage, die alle zwei Jahre seit 1994 stattfindet. CASP versorgt Benutzer und Forschungsgruppen mit einer Gelegenheit, die Qualität von verfügbaren Methoden und automatischen Servern für die Protein-Struktur-Vorhersage zu bewerten. Offizielle Ergebnisse für automatische Struktur-Vorhersageserver im CASP7-Abrisspunkt (2006) werden von Battey und al besprochen.. Offizielle CASP8-Ergebnisse sind für automatische Server und für den Menschen und die Server-Propheten verfügbar. Inoffizielle Ergebnisse für automatische Server des CASP8 2008-Abrisspunkts werden auf mehreren Laboratorium-Websites zusammengefasst und gemäß ein bisschen unterschiedlichen Kriterien aufgereiht: Laboratorium von Zhang, Laboratorium von Grishin, Laboratorium von McGuffin,

Bäcker-Laboratorium und Laboratorium von Cheng.

Siehe auch

  • Protein-Design
  • Protein-Funktionsvorhersage
  • Protein-Struktur-Vorhersagesoftware
  • Protein-Struktur-Vorhersage von De novo
  • Molekulare Designsoftware
  • Molekulare modellierende Software
  • Das Modellieren biologischer Systeme
  • Bruchstück-Bibliotheken
  • Gitter-Proteine
  • Statistisches Potenzial

Außenverbindungen


Baruch / Wasserqualität
Impressum & Datenschutz