Folge-Analyse

In bioinformatics bezieht sich die Begriff-Folge-Analyse auf den Prozess, eine DNA, RNS oder peptide Folge zu einigen einer breiten Reihe von analytischen Methoden zu unterwerfen, seine Eigenschaften, Funktion, Struktur oder Evolution zu verstehen. Verwendete Methodiken schließen Folge-Anordnung, Suchen gegen biologische Datenbanken und andere ein. Seit der Entwicklung von Methoden der Produktion des hohen Durchflusses des Gens und der Protein-Folgen hat die Rate der Hinzufügung neuer Folgen zu den Datenbanken exponential zugenommen. Solch eine Sammlung von Folgen vergrößert allein das Verstehen des Wissenschaftlers der Biologie von Organismen nicht. Jedoch ist das Vergleichen dieser neuen Folgen zu denjenigen mit bekannten Funktionen ein Schlüssel Weise, die Biologie eines Organismus zu verstehen, aus dem die neue Folge kommt. So kann Folge-Analyse verwendet werden, um Funktion Genen und Proteinen durch die Studie der Ähnlichkeiten zwischen den verglichenen Folgen zuzuteilen. Heutzutage gibt es viele Werkzeuge und Techniken, die die Folge-Vergleiche (Folge-Anordnung) zur Verfügung stellen und das Anordnungsprodukt analysieren, um seine Biologie zu verstehen.

Die Folge-Analyse in der molekularen Biologie schließt eine sehr breite Reihe von relevanten Themen ein:

  1. Der Vergleich von Folgen, um zu finden, dass Ähnlichkeit häufig ableitet, wenn sie (homologer) verbunden werden
  2. Identifizierung von inneren Eigenschaften der Folge wie aktive Seiten, schlagen Sie Übersetzungsmodifizierungsseiten, Genstrukturen an, Rahmen, Vertrieb von introns und exons und Durchführungselementen lesend
  3. Identifizierung von Folge-Unterschieden und Schwankungen wie Punkt-Veränderungen und einzelner nucleotide polymorphism (SNP), um den genetischen Anschreiber zu bekommen.
  4. Die Aufdeckung der Evolution und genetischen Ungleichheit von Folgen und Organismen
  5. Identifizierung der molekularen Struktur von der Folge allein

In der Chemie umfasst Folge-Analyse Techniken, die verwendet sind, um zu tun, bestimmen die Folge eines mehrerer monomers gebildeten Polymers.

In der molekularen Biologie und Genetik wird derselbe Prozess einfach "sequencing" genannt.

Im Marketing wird Folge-Analyse häufig in analytischen Kundenbeziehungsverwaltungsanwendungen, wie NPTB-Modelle (Folgendes Produkt verwendet, um Zu kaufen).

Geschichte

Seit den allerersten Folgen des Insulin-Proteins wurde von Fred Sanger 1951 charakterisiert Biologen haben versucht, diese Kenntnisse zu verwenden, um die Funktion von Molekülen zu verstehen.

Folge-Anordnung

Es gibt Millionen des Proteins und der nucleotide bekannten Folgen. Diese Folgen fallen in viele Gruppen von zusammenhängenden Folgen, die als Protein-Familien oder Genfamilien bekannt sind. Beziehungen zwischen diesen Folgen werden gewöhnlich durch das Übereinstimmen von ihnen zusammen und das Zuweisen dieser Anordnung eine Kerbe entdeckt. Es gibt zwei Haupttypen der Folge-Anordnung. Mit dem Paar kluge Folge-Anordnung vergleicht nur zwei Folgen auf einmal, und vielfache Folge-Anordnung vergleicht viele Folgen darin man geht. Zwei wichtige Algorithmen, um Paare von Folgen auszurichten, sind der Needleman-Wunsch Algorithmus und der Algorithmus des Schmieds-Fährmannes. Populäre Werkzeuge für die Folge-Anordnung schließen ein:

  • Mit dem Paar kluge Anordnung - SPRENGT
  • Vielfache Anordnung - ClustalW, PROBCONS, MUSKEL, MAFFT und T-Kaffee.

Eine übliche Anwendung für die pairwise Folge-Anordnung soll eine Folge von Interesse nehmen und sie mit allen bekannten Folgen in einer Datenbank vergleichen, um homologe Folgen zu identifizieren. Im Allgemeinen werden die Matchs in der Datenbank befohlen, die am nächsten zusammenhängenden Folgen zu zeigen, die zuerst von Folgen mit der sich vermindernden Ähnlichkeit gefolgt sind. Diese Matchs werden gewöhnlich mit einem Maß der statistischen Bedeutung wie ein Erwartungswert berichtet.

Profil-Vergleich

1987 haben Michael Gribskov, Andrew McLachlan und David Eisenberg die Methode des Profil-Vergleichs eingeführt, um entfernte Ähnlichkeiten zwischen Proteinen zu identifizieren. Anstatt eine einzelne Folge zu verwenden, verwenden Profil-Methoden eine vielfache Folge-Anordnung, um ein Profil zu verschlüsseln, das Information über das Bewahrungsniveau jedes Rückstands enthält. Diese Profile können dann verwendet werden, um Sammlungen von Folgen zu suchen, um Folgen zu finden, die verbunden sind. Profile sind auch bekannt als Position das Spezifische Zählen Matrices (PSSMs). 1993 wurde eine probabilistic Interpretation von Profilen von David Haussler und Kollegen eingeführt, die verborgene Modelle von Markov verwenden. Diese Modelle sind bekannt als Profil-HMMs geworden.

In den letzten Jahren sind Methoden entwickelt worden, die den Vergleich von Profilen direkt zu einander erlauben. Diese sind als Vergleich-Methoden des Profil-Profils bekannt.

Folge-Zusammenbau

Folge-Zusammenbau bezieht sich auf die Rekonstruktion einer DNA-Folge durch das Übereinstimmen und das Mischen kleiner DNA-Bruchstücke. Es ist ein integraler Bestandteil der modernen DNA sequencing. Seit der jetzt verfügbaren DNA sequencing Technologien sind ungeeignet, um lange Folgen zu lesen, große Stücke der DNA (wie Genome) sind häufig sequenced durch (1) Ausschnitt der DNA in kleine Stücke, (2) das Lesen der kleinen Bruchstücke, und (3) Rekonstruktion der ursprünglichen DNA durch das Mischen der Information über das verschiedene Bruchstück.

Genvorhersage

Genvorhersage oder Gen, das findet, beziehen sich auf den Prozess, die Gebiete der genomic DNA zu identifizieren, die Gene verschlüsseln. Das schließt Protein codierende Gene sowie RNS-Gene ein, aber kann auch Vorhersage anderer funktioneller Elemente wie Durchführungsgebiete einschließen. Gen, das findet, ist einer der ersten und wichtigsten Schritte im Verstehen des Genoms einer Art, sobald es sequenced gewesen ist. Im Allgemeinen ist die Vorhersage von Bakteriengenen bedeutsam einfacher und genauer als die Vorhersage von Genen in eukaryotic Arten, die gewöhnlich Komplex intron/exon Muster haben.

Protein-Struktur-Vorhersage

Die 3D-Strukturen von Molekülen sind zu ihren Funktionen in der Natur von großer Bedeutung. Da die Strukturvorhersage von großen Molekülen an einem Atomniveau größtenteils unnachgiebiges Problem ist, haben einige Biologen Weisen eingeführt, 3D-Struktur an einem primären Folge-Niveau vorauszusagen. Das schließt biochemische oder statistische Analyse von Aminosäure-Rückständen in lokalen Gebieten und Strukturschlussfolgerung von homologs (oder andere potenziell zusammenhängende Proteine) mit bekannten 3D-Strukturen ein.

Es hat eine Vielzahl von verschiedenen Annäherungen gegeben, um das Struktur-Vorhersageproblem zu beheben. Um zu bestimmen, welche Methoden am wirksamsten waren, wurde eine Struktur-Vorhersagekonkurrenz genannt CASP (Kritische Bewertung der Struktur-Vorhersage) gegründet.

Methodik

Die Aufgaben, die im Raum von der Folge-Analyse liegen, sind häufig nichttrivial, um den Gebrauch von relativ komplizierten Annäherungen aufzulösen und zu verlangen. Der vielen Typen von Methoden verwendet in der Praxis schließen die populärsten ein:

Siehe auch

  • Liste der Folge-Anordnungssoftware
  • Liste der Anordnungsvergegenwärtigungssoftware
  • Liste der phylogenetics Software
  • Liste der phylogenetic Baumvergegenwärtigungssoftware
  • Liste der Protein-Struktur-Vorhersagesoftware
  • Liste der RNS-Struktur-Vorhersagesoftware

Appetit / Die Netz-Kraft von Tom Clancy
Impressum & Datenschutz