Bioinformatics

Bioinformatics ist die Anwendung der Informatik und Informationstechnologie zum Feld der Biologie und Medizin. Bioinformatics befasst sich mit Algorithmen, Datenbanken und Informationssystemen, Webtechnologien, künstlicher Intelligenz und weicher Computerwissenschaft, Information und Berechnungstheorie, Softwaretechnik, Datenbergwerk, Bildverarbeitung, dem Modellieren und der Simulation, der Signalverarbeitung, der getrennten Mathematik, der Kontrolle und der Systemtheorie, der Stromkreis-Theorie und der Statistik. Bioinformatics erzeugt neue Kenntnisse von Biologie und Medizin, und Besserung & Entdecken neuer Modelle der Berechnung (z.B, DNA-Computerwissenschaft, Nervencomputerwissenschaft, Entwicklungscomputerwissenschaft, Immuno-Computerwissenschaft, Schwarm-Computerwissenschaft, Zellcomputerwissenschaft).

Allgemein verwendete Softwarewerkzeuge und Technologien in diesem Feld schließen Java, XML, Perl, C, C ++, Pythonschlange, R, MySQL, SQL, CUDA, MATLAB und Microsoft Excel ein.

Einführung

Bioinformatics wurde in der Entwicklung und Wartung einer Datenbank angewandt, um biologische Information am Anfang "genomic Revolution", wie Nucleotide-Folgen und Aminosäure-Folgen zu versorgen. Die Entwicklung dieses Typs der Datenbank ist nicht verbunden gewesen nur Design kommt heraus, aber die Entwicklung von komplizierten Schnittstellen, wodurch Forscher auf vorhandene Daten zugreifen sowie neue oder revidierte Daten vorlegen konnten.

Um zu studieren, wie normale Zelltätigkeiten in verschiedenen Krankheitsstaaten verändert werden, müssen die biologischen Daten verbunden werden, um ein umfassendes Bild dieser Tätigkeiten zu bilden. Deshalb hat sich das Feld von bioinformatics solch entwickelt, dass die drückendste Aufgabe jetzt die Analyse und Interpretation von verschiedenen Typen von Daten einschließt. Das schließt nucleotide und Aminosäure-Folgen, Protein-Gebiete und Protein-Strukturen ein. Der wirkliche Prozess des Analysierens und der Interpretation von Daten wird rechenbetonte Biologie genannt. Wichtige Subdisziplinen innerhalb von bioinformatics und rechenbetonter Biologie schließen ein:

  • die Entwicklung und Durchführung von Werkzeugen, die effizienten Zugang zu, und Gebrauch und Management, verschiedene Typen der Information ermöglichen.
  • die Entwicklung von neuen Algorithmen (mathematische Formeln) und Statistik, mit der man Beziehungen unter Mitgliedern von großen Dateien bewertet. Zum Beispiel, Methoden, ein Gen innerhalb einer Folge ausfindig zu machen, sagen Sie Protein-Struktur und/oder Funktion und Traube-Protein-Folgen in Familien von zusammenhängenden Folgen voraus.

Die primäre Absicht von bioinformatics ist, das Verstehen von biologischen Prozessen zu vergrößern. Was untergeht, ist es abgesondert von anderen Annäherungen jedoch sein Fokus auf dem Entwickeln und der Verwendung rechenbetont intensiver Techniken, um dieses Ziel zu erreichen. Beispiele schließen ein: Muster-Anerkennung, Datenbergwerk, Maschinenlernalgorithmen und Vergegenwärtigung. Hauptforschungsanstrengungen im Feld schließen Folge-Anordnung, Genentdeckung, Genom-Zusammenbau, Rauschgift-Design, Rauschgift-Entdeckung, Protein-Struktur-Anordnung, Protein-Struktur-Vorhersage, Vorhersage des Genausdrucks und der Wechselwirkungen des Protein-Proteins, der weiten Genoms Vereinigungsstudien und des Modellierens der Evolution ein.

Interessanterweise wurde der Begriff bioinformatics vor "genomic Revolution" ins Leben gerufen. Paulien Hogeweg und Ben Hesper haben den Begriff 1978 eingeführt, um sich auf "die Studie von Informationsprozessen in biotic Systemen" zu beziehen. Diese Definition hat bioinformatics als eine Feldparallele zur Biophysik gelegt, oder Biochemie (ist Biochemie die Studie von chemischen Prozessen in biologischen Systemen). Jedoch hat sein primärer Gebrauch seitdem mindestens das Ende der 1980er Jahre die Anwendung der Informatik und Informationswissenschaften zur Analyse von biologischen Daten, besonders in jenen Gebieten von genomics das Beteiligen groß angelegter DNA sequencing beschreiben sollen.

Bioinformatics hat jetzt die Entwicklung und Förderung von Datenbanken, Algorithmen, rechenbetonten und statistischen Techniken und Theorie zur Folge, formelle und praktische Probleme zu beheben, die aus dem Management und der Analyse von biologischen Daten entstehen.

Im Laufe der letzten wenigen Jahrzehnte haben sich schnelle Entwicklungen in genomic und anderen molekularen Forschungstechnologien und Entwicklungen in Informationstechnologien verbunden, um einen enormen Betrag der mit der molekularen Biologie verbundenen Information zu erzeugen. Bioinformatics ist der Name, der diesen mathematischen und rechnenden Annäherungen gegeben ist, die verwendet sind, um das Verstehen von biologischen Prozessen nachzulesen.

Allgemeine Tätigkeiten in bioinformatics schließen ein kartografisch darzustellen, und das Analysieren der DNA und Protein-Folgen, das Übereinstimmen verschiedener DNA und Protein-Folgen, um sie, und das Schaffen und die Betrachtung von 3. Modellen von Protein-Strukturen zu vergleichen.

Es gibt zwei grundsätzliche Weisen, ein Biologisches System (z.B, lebende Zelle) beide Ankunft unter Annäherungen von Bioinformatic zu modellieren.

  • Statischer
  • Folgen - Proteine, Nucleic acids und Peptides
  • Strukturen - Proteine, Nukleinsäuren, Ligands (einschließlich metabolites und Rauschgifte) und Peptides
  • Wechselwirkungsdaten unter den obengenannten Entitäten einschließlich Mikroreihe-Daten und Netze von Proteinen, metabolites
  • Dynamischer
  • Systembiologie kommt unter dieser Kategorie einschließlich Reaktionsflüsse und variabler Konzentrationen von metabolites
  • Mehrreagenz Basierte modellierende Annäherungen, Zellereignisse wie Nachrichtenübermittlung, Abschrift und Reaktionsdynamik gewinnend

Eine breite Unterkategorie unter bioinformatics ist struktureller bioinformatics.

Hauptforschungsgebiete

Folge-Analyse

Seitdem Phage Φ-X174 sequenced 1977 war, sind die DNA-Folgen von Tausenden von Organismen decodiert und in Datenbanken versorgt worden. Diese Folge-Information wird analysiert, um Gene zu bestimmen, die polypeptides (Proteine), RNS-Gene, Durchführungsfolgen, Strukturmotive und wiederholende Folgen verschlüsseln. Ein Vergleich von Genen innerhalb einer Art oder zwischen verschiedenen Arten kann Ähnlichkeiten zwischen Protein-Funktionen oder Beziehungen zwischen Arten (der Gebrauch der molekularen Systematik zeigen, um phylogenetic Bäume zu bauen). Mit der wachsenden Datenmenge ist es vor langer Zeit unpraktisch geworden, um DNA-Folgen manuell zu analysieren. Heute werden Computerprogramme wie DRUCKWELLE täglich verwendet, um Folgen von mehr als 260 000 Organismen zu suchen, mehr als 190 Milliarden nucleotides enthaltend. Diese Programme können Veränderungen (ausgetauschte, gelöschte oder eingefügte Basen) in der DNA-Folge ersetzen, um Folgen zu identifizieren, die verbunden sind, aber nicht identisch. Eine Variante dieser Folge-Anordnung wird im Sequencing-Prozess selbst verwendet. Die so genannte Schrotflinte sequencing Technik (der, zum Beispiel, vom Institut für die Genomic Forschung zur Folge das erste Bakteriengenom, Haemophilus influenzae verwendet wurde) erzeugt komplette Chromosomen nicht. Stattdessen erzeugt es die Folgen von vielen tausend von kleinen DNA-Bruchstücken (im Intervall von 35 bis 900 nucleotides lange, abhängig von der sequencing Technologie). Die Enden dieser Bruchstücke Übergreifen und, wenn ausgerichtet, richtig durch ein Genom-Zusammenbau-Programm, können verwendet werden, um das ganze Genom wieder aufzubauen. Schrotflinte sequencing Ertrag-Folge-Daten schnell, aber die Aufgabe, die Bruchstücke zu sammeln, kann für größere Genome ganz kompliziert werden. Für ein Genom so groß wie das menschliche Erbgut kann man viele Tage der Zentraleinheitszeit auf dem großen Gedächtnis, Mehrverarbeiter-Computer brauchen, um die Bruchstücke zu sammeln, und der resultierende Zusammenbau wird gewöhnlich zahlreiche Lücken enthalten, die später ausgefüllt werden müssen. Schrotflinte sequencing ist die Methode der Wahl für eigentlich alle Genome sequenced heute, und Genom-Zusammenbau-Algorithmen sind ein kritisches Gebiet der bioinformatics Forschung.

Ein anderer Aspekt von bioinformatics in der Folge-Analyse ist Anmerkung. Das schließt rechenbetonte Genentdeckung ein, um nach Protein codierenden Genen, RNS-Genen und anderen funktionellen Folgen innerhalb eines Genoms zu suchen. Nicht alle nucleotides innerhalb eines Genoms sind ein Teil von Genen. Innerhalb der Genome von höheren Organismen dienen große Teile der DNA keinem offensichtlichen Zweck. Diese so genannte Trödel-DNA kann jedoch unerkannte funktionelle Elemente enthalten. Bioinformatics hilft, die Lücke zwischen Genom und Proteome-Projekten — zum Beispiel im Gebrauch von DNA-Folgen für die Protein-Identifizierung zu überbrücken.

Genom-Anmerkung

Im Zusammenhang von genomics ist Anmerkung der Prozess, die Gene und anderen biologischen Eigenschaften in einer DNA-Folge zu kennzeichnen. Das erste Genom-Anmerkungssoftwaresystem wurde 1995 von Dr Owen White entworfen, der ein Teil der Mannschaft am Institut für die Genomic Forschung war, dass sequenced und das erste Genom eines liederlichen Organismus analysiert hat, der, die Bakterie Haemophilus influenzae zu decodieren ist. Dr White hat ein Softwaresystem gebaut, um die Gene zu finden (Plätze in der DNA-Folge, die ein Protein verschlüsseln), die Übertragungs-RNS und anderen Eigenschaften, und anfängliche Anweisungen der Funktion zu jenen Genen zu machen. Aktuellste Genom-Anmerkungssysteme arbeiten ähnlich, aber die für die Analyse der genomic DNA verfügbaren Programme ändern sich ständig und verbessern sich.

Rechenbetonte Entwicklungsbiologie

Entwicklungsbiologie ist die Studie des Ursprungs und der Abstieg der Arten, sowie ihre Änderung mit der Zeit. Informatik hat Entwicklungsbiologen bei mehrerem Schlüssel Wege geholfen; es hat Forschern ermöglicht zu:

  • verfolgen Sie die Evolution einer Vielzahl von Organismen, indem Sie Änderungen in ihrer DNA, aber nicht durch die physische Taxonomie oder physiologischen Beobachtungen allein, messen
  • vergleichen Sie mehr kürzlich komplette Genome, der die Studie von komplizierteren Entwicklungsereignissen, wie Genverdoppelung, horizontale Genübertragung und die Vorhersage von Faktoren erlaubt, die in der Bakterienartbildung, wichtig
sind
  • bauen Sie komplizierte rechenbetonte Modelle von Bevölkerungen, um das Ergebnis des Systems mit der Zeit vorauszusagen
  • verfolgen Sie und teilen Sie Information über eine zunehmend Vielzahl der Arten und Organismen

Zukünftige Arbeit ist bestrebt, den jetzt komplizierteren Baum des Lebens wieder aufzubauen.

Das Gebiet der Forschung innerhalb der Informatik, die genetische Algorithmen verwendet, ist manchmal mit der rechenbetonten Entwicklungsbiologie verwirrt, aber die zwei Gebiete sind nicht notwendigerweise verbunden.

Literaturanalyse

Das Wachstum in der Zahl der veröffentlichten Literatur macht es eigentlich unmöglich, jedes Papier zu lesen, auf zusammenhanglose Teilfelder der Forschung hinauslaufend. Literaturanalyse hat zum Ziel, rechenbetonte und statistische Linguistik zu verwenden, um diese wachsende Bibliothek von Textmitteln zu verminen. Zum Beispiel:

  • Abkürzungsanerkennung - identifiziert die lange Form und Abkürzung von biologischen Begriffen,
  • genannte Entitätsanerkennung - das Erkennen biologischer Begriffe wie Gen nennt
  • Wechselwirkung des Protein-Proteins - identifiziert sich, mit dem Proteine der Proteine aus dem Text aufeinander wirken

Das Gebiet der Forschung zieht von der Statistik und linguistischen Datenverarbeitung.

Analyse des Genausdrucks

Der Ausdruck von vielen Genen kann durch das Messen mRNA von Niveaus mit vielfachen Techniken einschließlich der Mikroreihe bestimmt werden, hat cDNA Folge-Anhängsel (EST) sequencing, Serienanalyse des Genausdrucks (WEISER) Anhängsel sequencing, passen Sie massiv Unterschrift sequencing an (MPSS), RNS-Seq, auch bekannt als "Ganze Transcriptome Schrotflinte Sequencing" (WTSS) oder verschiedene Anwendungen von gleichzeitig gesandten in - situ Kreuzung ausgedrückt. Alle diese Techniken sind äußerst geräuschanfällig und/oder unterworfen, um im biologischen Maß zu beeinflussen, und ein Hauptforschungsgebiet in der rechenbetonten Biologie schließt sich entwickelnde statistische Werkzeuge ein, um Signal vom Geräusch in Genausdruck-Studien des hohen Durchflusses zu trennen. Solche Studien werden häufig verwendet, um die in eine Unordnung hineingezogenen Gene zu bestimmen: Man könnte Mikroreihe-Daten von krebsbefallenen epithelischen Zellen bis Daten von nichtkrebsbefallenen Zellen vergleichen, um die Abschriften zu bestimmen, die geregelt und in einer besonderen Bevölkerung von Krebs-Zellen unten geregelt werden.

Analyse der Regulierung

Regulierung ist die komplizierte Orchesterbearbeitung von Ereignissen, die mit einem Extracellular-Signal wie ein Hormon anfangen und zu einer Zunahme oder Abnahme in der Tätigkeit von einem oder mehr Proteinen führen. Techniken von Bioinformatics sind angewandt worden, um verschiedene Schritte in diesem Prozess zu erforschen. Zum Beispiel ist Befürworter-Analyse mit der Identifizierung und Studie von Folge-Motiven in der DNA verbunden, die das Codiergebiet eines Gens umgibt. Diese Motive beeinflussen das Ausmaß, in dem dieses Gebiet in mRNA abgeschrieben wird. Ausdruck-Daten können verwendet werden, um Genregulierung abzuleiten: Man könnte Mikroreihe-Daten von einem großen Angebot an Staaten eines Organismus vergleichen, um Hypothesen über die an jedem Staat beteiligten Gene zu bilden. In einem einzelligen Organismus könnte man Stufen des Zellzyklus, zusammen mit verschiedenen Betonungsbedingungen (Hitzestoß, Verhungern, usw.) vergleichen . Man kann dann sich sammelnde Algorithmen auf diesen Ausdruck Daten anwenden, um zu bestimmen, welche Gene co-expressed sind. Zum Beispiel stromaufwärts können Gebiete (Befürworter) von co-expressed Genen nach übervertretenen Durchführungselementen gesucht werden.

Analyse des Protein-Ausdrucks

Protein-Mikroreihe und Massenspektrometrie (MS) des hohen Durchflusses (HT) können einen Schnellschuss der Protein-Gegenwart in einer biologischen Probe zur Verfügung stellen. Bioinformatics wird sehr am Verstehen der Protein-Mikroreihe und HT FRAU-Daten beteiligt; die ehemalige Annäherung steht ähnlichen Problemen als mit der an mRNA ins Visier genommenen Mikroreihe gegenüber, der Letztere schließt das Problem ein, große Beträge von Massendaten gegen vorausgesagte Massen von Protein-Folge-Datenbanken und die komplizierte statistische Analyse von Proben, wo vielfach, zu vergleichen, aber unvollständige peptides von jedem Protein werden entdeckt.

Analyse von Veränderungen in Krebs

In Krebs werden die Genome von betroffenen Zellen im Komplex oder den sogar unvorhersehbaren Wegen umgeordnet. Massive sequencing Anstrengungen werden verwendet, um vorher unbekannte Punkt-Veränderungen in einer Vielfalt von Genen in Krebs zu identifizieren. Bioinformaticians setzen fort, spezialisierte automatisierte Systeme zu erzeugen, um das bloße Volumen von Folge-Daten erzeugt zu führen, und sie schaffen neue Algorithmen und Software, um die Sequencing-Ergebnisse mit der wachsenden Sammlung von Folgen des menschlichen Erbgutes und germline polymorphisms zu vergleichen. Neue physische Entdeckungstechnologien werden verwendet, wie Oligonucleotide-Mikroreihe, um chromosomale Gewinne und Verluste zu identifizieren (hat vergleichende genomic Kreuzung genannt), und einzelne-nucleotide Polymorphism-Reihe, um bekannte Punkt-Veränderungen zu entdecken. Diese Entdeckungsmethoden messen gleichzeitig mehrere hunderttausend Seiten überall im Genom, und wenn verwendet, im hohen Durchfluss, Tausende von Proben zu messen, erzeugen terabytes von Daten pro Experiment. Wieder erzeugen die massiven Beträge und neuen Typen von Daten neue Gelegenheiten für bioinformaticians. Wie man häufig findet, enthalten die Daten beträchtliche Veränderlichkeit oder Geräusch, und so werden Verborgenes Modell von Markov und Änderungspunkt-Analyse-Methoden entwickelt, um echte Kopie-Zahl-Änderungen abzuleiten.

Ein anderer Typ von Daten, der neuartige Informatik-Entwicklung verlangt, ist die Analyse von Verletzungen, die gefunden sind, unter vielen Geschwülsten wiederkehrend zu sein.

Vergleichender genomics

Der Kern der vergleichenden Genom-Analyse ist die Errichtung der Ähnlichkeit zwischen Genen (orthology Analyse) oder andere Genomic-Eigenschaften in verschiedenen Organismen. Es sind diese Intergenomic-Karten, die es möglich machen, die für die Abschweifung von zwei Genomen verantwortlichen Entwicklungsprozesse zu verfolgen. Eine Menge von Entwicklungsereignissen, die an verschiedenen organisatorischen Niveaus handeln, gestaltet Genom-Evolution. Am Tiefststand betreffen Punkt-Veränderungen individuellen nucleotides. An einem höheren Niveau erleben große chromosomale Segmente Verdoppelung, seitliche Übertragung, Inversion, Umstellung, Auswischen und Einfügung. Schließlich werden ganze Genome an Prozessen der Kreuzung, polyploidization und endosymbiosis beteiligt, häufig zu schneller Artbildung führend. Die Kompliziertheit der Genom-Evolution stellt viele aufregende Herausforderungen an Entwickler von mathematischen Modellen und Algorithmen auf, die Zuflucht zu Spektren von algorithmischen, statistischen und mathematischen Techniken, im Intervall von genauem, Heuristik, befestigtem Parameter und Annäherungsalgorithmen für Probleme haben, die auf Geiz-Modellen zur Kette von Markov Algorithmen von Monte Carlo für die Analyse von Bayesian von auf probabilistic Modellen gestützten Problemen gestützt sind.

Viele dieser Studien basieren auf der Homologie-Entdeckung und Protein-Familienberechnung.

Das Modellieren biologischer Systeme

Systembiologie ist mit dem Gebrauch von Computersimulationen von Zellsubsystemen verbunden (wie die Netze von metabolites und Enzymen, die Metabolismus umfassen, transduction Pfaden und Gen Durchführungsnetze Zeichen geben), sich die komplizierten Verbindungen dieser Zellprozesse sowohl zu analysieren als auch zu vergegenwärtigen. Künstliches Leben oder virtuelle Evolution versuchen, Entwicklungsprozesse über die Computersimulation von einfachen (künstlichen) Lebensformen zu verstehen.

Bildanalyse des hohen Durchflusses

Rechenbetonte Technologien werden verwendet, um die Verarbeitung, Quantifizierung und Analyse von großen Beträgen von hohen mit der Information zufriedenen biomedizinischen Bildern zu beschleunigen oder völlig zu automatisieren. Moderne Bildanalyse-Systeme vermehren eine Fähigkeit eines Beobachters, Maße von einem großen oder komplizierten Satz von Images, durch die Besserung der Genauigkeit, Objektivität oder Geschwindigkeit zu machen. Ein völlig entwickeltes Analyse-System kann den Beobachter völlig ersetzen. Obwohl diese Systeme zu biomedizinischen Bildern nicht einzigartig sind, wird biomedizinische Bildaufbereitung wichtiger sowohl für die Diagnostik als auch für Forschung. Einige Beispiele sind:

  • hoher Durchfluss und High-Fidelityquantifizierung und Subzelllokalisierung (hoch-zufriedene Abschirmung, cytohistopathology, Informatik von Bioimage)
  • morphometrics
  • klinische Bildanalyse und Vergegenwärtigung
  • die Bestimmung der Echtzeitluftstrom-Muster im Atmen von Lungen von lebenden Tieren
  • die Quantitätsbestimmung der Verstopfungsgröße in Realtime Bilder von der Entwicklung und Wiederherstellung während arterieller Verletzung
  • das Bilden von Verhaltensbeobachtungen von verlängerten Videoaufnahmen von Labortieren
  • Infrarotmaße für den metabolischen Tätigkeitsentschluss
  • das Schließen klont Übergreifen in der kartografisch darstellenden DNA, z.B kerben Sulston ein

Strukturbioinformatic-Annäherungen

Vorhersage der Protein-Struktur

Protein-Struktur-Vorhersage ist eine andere wichtige Anwendung von bioinformatics. Die Aminosäure-Folge eines Proteins, der so genannten primären Struktur, kann von der Folge auf dem Gen dass Codes dafür leicht beschlossen werden. In der großen Mehrheit von Fällen bestimmt diese primäre Struktur einzigartig eine Struktur in seiner heimischen Umgebung. (Natürlich gibt es Ausnahmen, wie der schwerfällige spongiform encephalopathy - a.k.a. Krankheit der BSE-kranken Kuh - prion.) Kenntnisse dieser Struktur sind im Verstehen der Funktion des Proteins lebenswichtig. Aus Mangel an besseren Begriffen wird Strukturinformation gewöhnlich als einer von sekundären, tertiären und Vierergruppe-Struktur klassifiziert. Eine lebensfähige allgemeine Lösung solcher Vorhersagen bleibt ein offenes Problem. Bezüglich jetzt sind die meisten Anstrengungen zur Heuristik diese Arbeit den größten Teil der Zeit geleitet worden.

Eine der Schlüsselideen in bioinformatics ist der Begriff der Homologie. Im genomic Zweig von bioinformatics wird Homologie verwendet, um die Funktion eines Gens vorauszusagen: Wenn die Folge des Gens A, dessen Funktion bekannt ist, zur Folge des Gens B homolog ist, dessen Funktion unbekannt ist, konnte man ableiten, dass B die Funktion von A teilen kann. Im Strukturzweig von bioinformatics wird Homologie verwendet, um zu bestimmen, welche Teile eines Proteins in der Struktur-Bildung und Wechselwirkung mit anderen Proteinen wichtig sind. Im genannten Homologie-Modellieren einer Technik wird diese Information verwendet, um die Struktur eines Proteins vorauszusagen, sobald die Struktur eines homologen Proteins bekannt ist. Das bleibt zurzeit die einzige Weise, Protein-Strukturen zuverlässig vorauszusagen.

Ein Beispiel davon ist die ähnliche Protein-Homologie zwischen dem Hämoglobin in Menschen und dem Hämoglobin in Hülsenfrüchten (leghemoglobin). Beider dienen demselben Zweck, Sauerstoff im Organismus zu transportieren. Obwohl beide dieser Proteine völlig verschiedene Aminosäure-Folgen haben, sind ihre Protein-Strukturen eigentlich identisch, der ihre fast identischen Zwecke widerspiegelt.

Andere Techniken, um Protein-Struktur vorauszusagen, schließen Protein einfädelnd und de novo (von Kratzer) das Physik-basierte Modellieren ein.

Siehe auch: Strukturmotiv und Strukturgebiet.

Molekulare Wechselwirkung

Effiziente Software ist heute verfügbar, um Wechselwirkungen unter Proteinen, ligands und peptides zu studieren. Typen von im Feld meistenteils gestoßenen Wechselwirkungen schließen - Protein-ligand (einschließlich des Rauschgifts), Protein-Protein und Protein-peptide ein.

Die molekulare dynamische Simulation der Bewegung von Atomen über drehbare Obligationen ist der grundsätzliche Grundsatz hinter rechenbetonten Algorithmen, genannten dockenden Algorithmen, um molekulare Wechselwirkungen zu studieren.

Siehe auch: Wechselwirkungsvorhersage des Protein-Proteins.

Docken von Algorithmen

In den letzten zwei Jahrzehnten, Zehntausenden des Proteins sind dreidimensionale Strukturen durch die Röntgenstrahl-Kristallographie und das Protein Kernkernspinresonanz-Spektroskopie (Protein NMR) bestimmt worden. Eine Hauptfrage für den biologischen Wissenschaftler besteht darin, ob es praktisch ist, um mögliche Wechselwirkungen des Protein-Proteins vorauszusagen, die nur auf diesen 3D-Gestalten gestützt sind, ohne Wechselwirkungsversuche des Protein-Proteins anzustellen. Eine Vielfalt von Methoden ist entwickelt worden, um das Docken-Problem des Protein-Proteins anzupacken, obwohl es scheint, dass es noch viel in diesem Feld zu tuende Arbeit gibt.

Software und Werkzeuge

Softwarewerkzeuge für bioinformatics erstrecken sich von einfachen Werkzeugen der Befehl-Linie, zu komplizierteren grafischen Programmen und eigenständigen Webdiensten, die von verschiedenen bioinformatics Gesellschaften oder öffentlichen Einrichtungen verfügbar sind.

Offene Quelle bioinformatics Software

Viele freie und offene Quellsoftwarewerkzeuge haben bestanden und fortgesetzt, seit den 1980er Jahren zu wachsen. Die Kombination eines fortlaufenden Bedürfnisses nach neuen Algorithmen für die Analyse von erscheinenden Typen von biologischen Ausgaben, dem Potenzial für den innovativen in Silico-Experimenten und den frei verfügbaren offenen Codebasen hat geholfen, Gelegenheiten für alle Forschungsgruppen zu schaffen, sowohl zu bioinformatics als auch zur Reihe der offenen Quellsoftware verfügbar unabhängig von ihren Finanzierungsmaßnahmen beizutragen. Die offenen Quellwerkzeuge handeln häufig als Brutkasten von Ideen oder gemeinschaftsunterstützte Einfügefunktionen in kommerziellen Anwendungen. Sie können auch De-Facto-Standards und geteilte Gegenstand-Modelle zur Verfügung stellen, um mit der Herausforderung der bioinformation Integration zu helfen.

Die Reihe von offenen Quellsoftwarepaketen schließt Titel wie Bioconductor, BioPerl, Biopython, BioJava ein, BioRuby, Bioclipse, PRÄGEN Arbeitstisch von Taverna und UGENE. Um diese Tradition aufrechtzuerhalten und weitere Gelegenheiten zu schaffen, das gemeinnützige Offene Bioinformatics Fundament haben jährliche Bioinformatics Open Source Conference (BOSC) seit 2000 unterstützt.

Webdienste in bioinformatics

SEIFE und Rest-basierte Schnittstellen sind für ein großes Angebot an bioinformatics Anwendungen entwickelt worden, die eine Anwendung erlauben, die auf einem Computer in einem Teil der Welt läuft, Algorithmen, Daten und Rechenmittel auf Servern in anderen Teilen der Welt zu verwenden. Die Hauptvorteile sind auf die Tatsache zurückzuführen, dass sich Endbenutzer mit Software und allgemeinen Datenbankverwaltungskosten nicht befassen müssen.

Grundlegende bioinformatics Dienstleistungen werden durch den EBI in drei Kategorien klassifiziert: SSS (Sequence Search Services), MSA (Vielfache Folge-Anordnung) und BSA (Biologische Folge-Analyse). Die Verfügbarkeit von diesen dienstorientierte bioinformatics Mittel demonstrieren die Anwendbarkeit des Webs, hat bioinformatics Lösungen und Reihe von einer Sammlung von eigenständigen Werkzeugen mit einem allgemeinen Datenformat unter einer einzelnen, eigenständigen oder webbasierten Schnittstelle zu einheitlichen, verteilten und ausziehbaren bioinformatics Arbeitsablauf-Verwaltungssystemen gestützt.

Arbeitsablauf-Verwaltungssysteme von Bioinformatics

Ein Bioinformatics Arbeitsablauf-Verwaltungssystem ist eine Spezialform eines Arbeitsablauf-Verwaltungssystems entworfen spezifisch, um eine Reihe von rechenbetonten oder Datenmanipulationsschritten oder einem Arbeitsablauf in einer Anwendung von Bioinformatics zusammenzusetzen und durchzuführen. Solche Systeme werden zu entworfen

  • stellen Sie eine gebrauchsfreundliche Umgebung für individuelle Anwendungswissenschaftler selbst zur Verfügung, um ihre eigenen Arbeitsabläufe zu schaffen
  • stellen Sie interaktive Werkzeuge für die Wissenschaftler zur Verfügung, die ihnen ermöglichen, ihre Arbeitsabläufe durchzuführen und ihre Ergebnisse in Realtime anzusehen
  • vereinfachen Sie den Prozess des Teilens und Wiederverwendens von Arbeitsabläufen zwischen den Wissenschaftlern.
  • ermöglichen Sie Wissenschaftlern, die Herkunft der Arbeitsablauf-Ausführungsergebnisse und der Arbeitsablauf-Entwicklungsschritte zu verfolgen.

Zurzeit gibt es zwei Plattformen, die diesen Dienst geben: Milchstraße-Projekt und Projekt von Taverna.

Siehe auch

Weiterführende Literatur

  • Achuthsankar S Nair Computational Biology & Bioinformatics - Eine sanfte Übersicht, Kommunikationen der Computergesellschaft Indiens, Januar 2007
  • Aluru, Srinivas, Hrsg.-Handbuch der Rechenbetonten Molekularen Biologie. Chapman & Hall/Crc, 2006. Internationale Standardbuchnummer 1584884061 (Chapman & Hall/Crc Computer und Informationswissenschaftsreihe)
  • Baldi, P und Brunak, S, Bioinformatics: Die Maschinenlernannäherung, 2. Ausgabe. MIT Presse, 2001. Internationale Standardbuchnummer 0 262 02506 X
  • Barnes, M.R. und Grau, I.C. Hrsg., Bioinformatics für Genetiker, Erstausgabe. Wiley, 2003. Internationale Standardbuchnummer 0-470-84394-2
  • Baxevanis, A.D und Ouellette, B.F.F. Hrsg., Bioinformatics: Ein Praktisches Handbuch zur Analyse von Genen und Proteinen, der dritten Ausgabe. Wiley, 2005. Internationale Standardbuchnummer 0-471-47878-4
  • Baxevanis, n. Chr., Petsko, G.A. Bierkrug, L.D. und Stormo, G.D. Hrsg., Aktuelle Protokolle in Bioinformatics. Wiley, 2007. Internationale Standardbuchnummer 0-471-25093-7
  • Claverie, J.M. und C. Notredame, Bioinformatics für Modepuppen. Wiley, 2003. Internationale Standardbuchnummer 0-7645-1696-5
  • Cristianini, N. und Hahn, M Einführung in Rechenbetonten Genomics, Universität von Cambridge Presse, 2006. (Internationale Standardbuchnummer 9780521671910 internationale Standardbuchnummer 0521671914)
  • Durbin, R., S. Eddy, A. Krogh und G. Mitchison, Biologische Folge-Analyse. Universität von Cambridge Presse, 1998. Internationale Standardbuchnummer 0-521-62971-3
  • Gilbert, Softwaremittel von D. Bioinformatics. Anweisungen in Bioinformatics, Anweisungen in Bioinformatics, 2004 5 (3):300-304.
  • Keedwell, E., Intelligenter Bioinformatics: Die Anwendung von Techniken der Künstlichen Intelligenz zu Bioinformatics Problemen. Wiley, 2005. Internationale Standardbuchnummer 0-470-02175-6
  • Kohane, u. a. Mikroreihe für einen Einheitlichen Genomics. Die MIT-Presse, 2002. Internationale Standardbuchnummer 0 262 11271 X
  • Lund, O. u. a. Immunologischer Bioinformatics. Die MIT-Presse, 2005. Internationale Standardbuchnummer 0-262-12280-4
  • Michael S. Waterman, Einführung in die Rechenbetonte Biologie: Folgen, Karten und Genome. CRC Presse, 1995. Internationale Standardbuchnummer 0-412-99391-0
  • Gestell, David W. Bioinformatics: Folge und Genom-Analyse-Frühlingshafen-Presse, Mai 2002. Internationale Standardbuchnummer 0-87969-608-7
  • Pachter, Lior und Sturmfels, Bernd. "Algebraische Statistik für die Rechenbetonte Biologie" Universität von Cambridge Presse, 2005. Internationale Standardbuchnummer 0-521-85700-7
  • Pevzner, Pavel A. Computational Molecular Biology: Eine Algorithmische Annäherung Die MIT-Presse, 2000. Internationale Standardbuchnummer 0-262-16197-4
  • Soinov, L. Bioinformatics und Muster-Anerkennung Kommen Zusammen Zeitschrift der Muster-Anerkennungsforschung (JPRR), Vol 1 (1) 2006 p. 37-41
  • Tisdall, James. "Perl für Bioinformatics" O'Reilly, 2001 beginnend. Internationale Standardbuchnummer 0-596-00080-4
  • Hingebungsvolles Problem von Philosophischen Transaktionen B auf Bioinformatics frei verfügbarer
Wenn sie

Links


Baltische Sprachen / Brian De Palma
Impressum & Datenschutz