Schrotflinte sequencing

In der Genetik sind Schrotflinte sequencing, auch bekannt als Schrotflinte-Klonen, eine Methode, die für sequencing lange DNA-Ufer verwendet ist. Es wird analog mit dem sich schnell ausbreitenden, quasizufälligen schießenden Muster einer Schrotflinte genannt.

Seit der Kettenbeendigungsmethode der DNA kann sequencing nur für ziemlich kurze Ufer verwendet werden (100 bis 1000 basepairs), längere Folgen müssen in kleinere Bruchstücke unterteilt, und nachher wieder versammelt werden, um die gesamte Folge zu geben. Zwei Hauptmethoden werden dafür verwendet: Das Chromosom-Wandern, das durch das komplette Ufer, stückweise, und die Schrotflinte sequencing fortschreitet, der ein schnellerer, aber komplizierterer Prozess ist, und verwendet zufällige Bruchstücke.

In der Schrotflinte sequencing,

DNA wird zufällig in zahlreiche kleine Segmente zerbrochen, die sequenced sind, den das Verwenden der Kettenbeendigungsmethode vorzuherrschen liest. Vielfache Überschneidung liest für die Ziel-DNA werden durch das Durchführen mehrerer Runden dieser Zersplitterung und sequencing erhalten. Computerprogramme verwenden dann die überlappenden Enden von verschiedenen liest, um sie in eine dauernde Folge zu versammeln.

Schrotflinte sequencing war eine der Vorgänger-Technologien, die dafür verantwortlich war, volles Genom sequencing zu ermöglichen.

Beispiel

Denken Sie zum Beispiel, dass die folgenden zwei Runden der Schrotflinte lesen:

In diesem äußerst vereinfachten Beispiel liest keiner bedecken die volle Länge der ursprünglichen Folge, aber die vier liest kann in die ursprüngliche Folge mit dem Übergreifen ihrer Enden gesammelt werden, um auszurichten und ihnen zu bestellen. In Wirklichkeit verwendet dieser Prozess enorme Beträge der Information, die mit Zweideutigkeiten und sequencing Fehlern weit verbreitet sind. Der Zusammenbau von komplizierten Genomen wird durch den großen Überfluss an der wiederholenden Folge zusätzlich kompliziert, das Bedeuten ähnlich kurz liest konnte aus völlig verschiedenen Teilen der Folge kommen.

Viele, die Überschneidung für jedes Segment der ursprünglichen DNA liest, sind notwendig, um diese Schwierigkeiten zu überwinden und genau die Folge zu sammeln. Zum Beispiel, um das Humangenomprojekt zu vollenden, war der grösste Teil des menschlichen Erbgutes sequenced an 12X oder größerer Einschluss; d. h. jede Basis in der Endfolge ist durchschnittlich da gewesen, in 12 liest. Trotzdem haben aktuelle Methoden gescheitert, zuverlässige Folge für etwa 1 % des (euchromatic) menschlichen Erbgutes zu isolieren oder zu sammeln.

Ganze Genom-Schrotflinte sequencing

Ganze Genom-Schrotflinte sequencing für den kleinen (4000 bis 7000 basepair) Genome war bereits im Gebrauch 1979. Breitere Anwendung hat aus Pairwise-Ende sequencing, bekannt umgangssprachlich als Schrotflinte des doppelten Barrels sequencing einen Nutzen gezogen. Als sequencing Projekte hat begonnen, längere und mehr komplizierte DNA zu übernehmen, vielfache Gruppen haben begonnen zu begreifen, dass nützliche Information durch sequencing beide Enden eines Bruchstücks der DNA erhalten werden konnte. Obwohl sequencing beide Enden desselben Bruchstücks und das Nachgehen der paarweise angeordneten Daten waren beschwerlicher als sequencing ein einzelnes Ende von zwei verschiedenen Bruchstücken, die Kenntnisse, dass die zwei Folgen in entgegengesetzten Richtungen orientiert wurden und über die Länge eines Bruchstücks abgesondert von einander waren, im Wiederaufbau der Folge des ursprünglichen Zielbruchstücks wertvoll war. Die erste veröffentlichte Beschreibung des Gebrauches von paarweise angeordneten Enden war 1990

als ein Teil des sequencing des menschlichen HGPRT geometrischen Orts, obwohl der Gebrauch von paarweise angeordneten Enden auf Schlusslücken nach der Anwendung einer traditionellen Schrotflinte sequencing Annäherung beschränkt wurde. Die erste theoretische Beschreibung der sequencing Strategie des Endes eines reinen pairwise, Bruchstücke der unveränderlichen Länge annehmend, war 1991. Zurzeit gab es Gemeinschaftseinigkeit, die die optimale Bruchstück-Länge für pairwise beendet, würde sequencing dreimal gelesene Länge der Folge sein. 1995 Rotauge und al.

eingeführt hat die Neuerung, Bruchstücke unterschiedlicher Größen zu verwenden, und demonstriert, dass eine reine pairwise End-Sequencing Strategie auf großen Zielen möglich sein würde. Die Strategie wurde nachher vom Institut für die Genomic Forschung (TIGR) zur Folge das Genom der Bakterie Haemophilus influenzae 1995, und dann von Celera Genomics zur Folge die Taufliege melanogaster (Taufliege) Genom 2000, angenommen

und nachher das menschliche Erbgut.

Um die Strategie anzuwenden, wird DNA des hohen Molekulargewichtes in zufällige Bruchstücke, Größe-ausgewählt (gewöhnlich 2, 10, 50, und 150 Kilobytes) geschert, und in einen passenden Vektoren geklont. Die Klone sind dann sequenced von beiden Enden mit der Kettenbeendigungsmethode, die zwei kurze Folgen nachgibt. Jede Folge wird einen endgelesenen genannt, oder lesen Sie, und zwei liest von demselben Klon werden Genosse-Paare genannt. Da die Kettenbeendigungsmethode nur gewöhnlich erzeugen kann, liest zwischen 500 und 1000 Basen lange, in allen außer den kleinsten Klonen, Genosse-Paare werden selten überlappen.

Die ursprüngliche Folge wird von wieder aufgebaut liest Verwenden-Folge-Zusammenbau-Software. Erstens liest Überschneidung werden in längere zerlegbare Folgen bekannt als contigs gesammelt. Contigs kann zusammen in Schafotte durch folgende Verbindungen zwischen Genosse-Paaren verbunden werden. Die Entfernung zwischen contigs kann aus den Genosse-Paar-Positionen abgeleitet werden, wenn die durchschnittliche Bruchstück-Länge der Bibliothek bekannt ist und ein schmales Fenster der Abweichung hat. Abhängig von der Größe der Lücke zwischen contigs können verschiedene Techniken verwendet werden, um die Folge in den Lücken zu finden. Wenn die Lücke (5-20kb) dann klein ist, ist der Gebrauch von PCR, um das Gebiet zu verstärken, erforderlich, von sequencing gefolgt. Wenn die Lücke (> 20 Kilobytes) dann groß ist, wird das große Bruchstück in speziellen Vektoren wie BAC (Künstliche Bakterienchromosomen) gefolgt von sequencing des Vektoren geklont.

Befürworter dieser Annäherung behaupten, dass es zur Folge das ganze Genom sofort mit der großen Reihe von Ablaufsteuerungen möglich ist, der den ganzen Prozess viel effizienter macht als traditionellere Annäherungen. Kritiker behaupten das, obwohl die Technik schnell Folgen große Gebiete der DNA, seine Fähigkeit, diese Gebiete richtig zu verbinden, Verdächtiger besonders für Genome mit sich wiederholenden Gebieten ist. Da Folge-Zusammenbau-Programme hoch entwickelter werden und Rechenmacht preiswerter wird, kann es möglich sein, diese Beschränkung zu überwinden.

Einschluss

Einschluss ist die durchschnittliche Zahl dessen liest das Darstellen eines gegebenen nucleotide in der wieder aufgebauten Folge. Es kann von der Länge des ursprünglichen Genoms (G) berechnet werden, die Zahl dessen liest (N) und die durchschnittliche gelesene Länge (L) als. Zum Beispiel liest ein hypothetisches Genom mit 2,000 Grundpaaren, die von 8 wieder aufgebaut sind, mit einer durchschnittlichen Länge von 500 nucleotides wird 2x Überfülle haben. Dieser Parameter ermöglicht auch einzuschätzen, dass andere Mengen, wie der Prozentsatz des Genoms, das dadurch bedeckt ist (manchmal auch genannt Einschluss) lesen. Ein hoher Einschluss in der Schrotflinte sequencing wird gewünscht, weil es Fehler im Grundbenennen und Zusammenbau überwinden kann. Das Thema der DNA sequencing Theorie richtet die Beziehungen solcher Mengen.

Manchmal wird eine Unterscheidung zwischen Folge-Einschluss und physischem Einschluss gemacht. Folge-Einschluss ist die durchschnittliche Zahl von Zeiten eine Basis wird (wie beschrieben, oben) gelesen. Physischer Einschluss ist die durchschnittliche Zahl von Zeiten eine Basis wird gelesen oder vom paarweise angeordneten Genossen abgemessen liest.

Hierarchische Schrotflinte sequencing

Obwohl Schrotflinte sequencing in der Theorie kann, auf ein Genom jeder Größe angewandt werden, wurde seine direkte Anwendung auf den sequencing von großen Genomen (zum Beispiel, das Menschliche Erbgut) bis zum Ende der 1990er Jahre beschränkt, als technologische Fortschritte praktisch das Berühren der riesengroßen Mengen von komplizierten am Prozess beteiligten Daten gemacht haben. Historisch, wie man glaubte, wurde Schrotflinte des vollen Genoms sequencing sowohl durch die bloße Größe von großen Genomen als auch durch die Kompliziertheit beschränkt, die durch den hohen Prozentsatz der wiederholenden DNA hinzugefügt ist (größer als 50 % für das menschliche Erbgut) Gegenwart in großen Genomen. Es wurde nicht weit akzeptiert, dass eine Schrotflinte-Folge des vollen Genoms eines großen Genoms zuverlässige Daten zur Verfügung stellen würde. Aus diesen Gründen mussten andere Strategien, die die rechenbetonte Last des Folge-Zusammenbaues gesenkt haben, verwertet werden vor der Schrotflinte wurde sequencing durchgeführt.

In hierarchischem sequencing, auch bekannt als verfeinerndem sequencing eine niedrige Entschlossenheit wird die physische Karte des Genoms vor wirklichem sequencing gemacht. Aus dieser Karte wird eine minimale Zahl von Bruchstücken, die das komplette Chromosom bedecken, für sequencing ausgewählt. Auf diese Weise ist der minimale Betrag des hohen Durchflusses sequencing und Zusammenbaues erforderlich.

Das verstärkte Genom wird zuerst in größere Stücke geschert, die (50-200kb) und in einen Bakteriengastgeber geklont sind, der BACs oder PACs verwendet. Weil vielfache Genom-Kopien aufs Geratewohl geschert worden sind, haben die in diesen Klonen enthaltenen Bruchstücke verschiedene Enden, und mit genug Einschluss (sieh Abteilung oben) Entdeckung eines Schafotts von BAC contigs, der das komplette Genom bedeckt, ist theoretisch möglich. Dieses Schafott wird einen mit Ziegeln deckenden Pfad genannt. Sobald ein mit Ziegeln deckender Pfad gefunden worden ist, werden die BACs, die diesen Pfad bilden, aufs Geratewohl in kleinere Bruchstücke geschert und können sequenced das Verwenden der Schrotflinte-Methode auf einer kleineren Skala sein.

Obwohl die vollen Folgen des BAC contigs nicht bekannt sind, sind ihre Orientierungen hinsichtlich einander bekannt. Es gibt mehrere Methoden, um diese Ordnung abzuleiten und die BACs auszuwählen, die einen mit Ziegeln deckenden Pfad zusammensetzen. Die allgemeine Strategie schließt das Identifizieren der Positionen der Klone hinsichtlich einander und dann des Auswählens kleinster Zahl von Klonen ein, die erforderlich sind, ein aneinander grenzendes Schafott zu bilden, das das komplette Gebiet von Interesse bedeckt. Die Ordnung der Klone wird durch die Bestimmung des Weges abgeleitet, auf den sie überlappen. Überlappende Klone können auf mehrere Weisen erkannt werden. Ein kleiner radioaktiv - oder chemisch etikettierte Untersuchung, die eine Folge-markierte Seite (STS) enthält, kann auf eine Mikroreihe gekreuzt werden, auf die die Klone gedruckt werden. Auf diese Weise werden alle Klone, die eine besondere Folge im Genom enthalten, erkannt. Das Ende von einem dieser Klone kann dann sequenced sein, um eine neue Untersuchung und den Prozess nachzugeben, der in einer Methode wiederholt ist, genannt das Chromosom-Wandern. Wechselweise kann die BAC Bibliothek Beschränkungsverdaut werden. Zwei Klone, die mehrere Bruchstück-Größen gemeinsam haben, werden abgeleitet, um zu überlappen, weil sie vielfache ähnlich Beschränkungsseiten unter Drogeneinfluss gemeinsam enthalten. Diese Methode von kartografisch darstellendem genomic wird Beschränkungsfingerabdruck genannt, weil es eine Reihe von in jedem Klon enthaltenen Beschränkungsseiten identifiziert. Sobald das Übergreifen zwischen den Klonen gefunden hat und ihre Ordnung hinsichtlich des bekannten Genoms, ist ein Schafott einer minimalen Teilmenge dieser contigs, die das komplette Genom bedeckt, Schrotflinte-sequenced.

Weil es zuerst das Schaffen einer Karte der niedrigen Entschlossenheit des Genoms einschließt, ist hierarchische Schrotflinte sequencing langsamer als Schrotflinte des ganzen Genoms sequencing, aber verlässt sich weniger schwer auf Computeralgorithmen für den Genom-Zusammenbau als Schrotflinte des ganzen Genoms sequencing. Der Prozess der umfassenden BAC Bibliotheksentwicklung und mit Ziegeln deckenden Pfad-Auswahl macht jedoch hierarchische Schrotflinte sequencing langsam und intensive Arbeit. Jetzt wo die Technologie verfügbar ist und die Zuverlässigkeit der demonstrierten Daten, hat Geschwindigkeits- und Kostenleistungsfähigkeit der Schrotflinte des ganzen Genoms sequencing es die primäre Methode für das Genom sequencing gemacht.

Folgende Generation sequencing

Obwohl Schrotflinte sequencing die fortgeschrittenste Technik für sequencing Genome von ungefähr 1995-2005 war, haben andere Technologien geglättet, folgende Generation sequencing genannt. Diese Technologien erzeugen kürzer liest (überall vom 25-500bp), aber viele Hunderttausende oder Millionen dessen lesen in einer relativ kurzen Zeit (auf der Ordnung eines Tages).

Das läuft auf hohen Einschluss hinaus, aber der Zusammenbau-Prozess ist viel mehr rechenbetont teuer. Diese Technologien sind als Schrotflinte sequencing wegen der Großserie von Daten und die relativ kurze Zeit gewaltig höher es bringt in die Folge ein ganzes Genom. Der Hauptnachteil ist, dass die Genauigkeiten gewöhnlich niedriger sind (obwohl das für durch den hohen Einschluss ersetzt wird).

Siehe auch

  • DNA sequencing Theorie

Links


Sequencing / Freiheitsstatue
Impressum & Datenschutz