Vereinfachtes Linienzugang-System des molekularen Eingangs

Das vereinfachte Linienzugang-System des molekularen Eingangs oder LÄCHELN sind eine Spezifizierung in der Form einer Liniennotation, für die Struktur von chemischen Molekülen mit kurzen ASCII-Schnuren zu beschreiben. LÄCHELN-Schnuren können von den meisten Molekül-Redakteuren für die Konvertierung zurück in zweidimensionale Zeichnungen oder dreidimensionale Modelle der Moleküle importiert werden.

Die ursprüngliche LÄCHELN-Spezifizierung wurde von Arthur Weininger und David Weininger gegen Ende der 1980er Jahre entwickelt. Es ist seitdem modifiziert und durch andere am meisten namentlich von Daylight Chemical Information Systems Inc erweitert worden. 2007 wurde ein offener Standard genannt "OpenSMILES" von der Blauen Obelisk-Chemie-Gemeinschaft der offenen Quelle entwickelt. Andere 'geradlinige' Notationen schließen Wiswesser Line Notation (WLN), ROSDAL und SLN (Tripos Inc) ein.

Im Juli 2006 hat der IUPAC InChI als ein Standard für die Formel-Darstellung eingeführt. Wie man allgemein betrachtet, ist LÄCHELN im Vorteil, ein bisschen menschlich-lesbarer zu sein, als InChI; es hat auch eine breite Basis der Softwareunterstützung mit dem umfassenden theoretisch (z.B, Graph-Theorie) Unterstützung.

Fachsprache

Der Begriff LÄCHELN bezieht sich auf eine Liniennotation, um molekulare Strukturen zu verschlüsseln, und spezifische Beispiele sollten LÄCHELN-Schnuren ausschließlich genannt werden. Jedoch LÄCHELT der Begriff wird auch allgemein verwendet, um sich sowohl auf eine einzelne LÄCHELN-Schnur als auch auf mehrere LÄCHELN-Schnuren zu beziehen; die genaue Bedeutung ist gewöhnlich aus dem Zusammenhang offenbar. Die Begriffe Kanonisch und Isomer können zu etwas Verwirrung, wenn angewandt, auf das LÄCHELN führen. Die Begriffe beschreiben verschiedene Attribute von LÄCHELN-Schnuren und sind nicht gegenseitig exklusiv.

Gewöhnlich kann mehreres ebenso gültiges LÄCHELN für ein Molekül geschrieben werden. Zum Beispiel geben CCO, OCC und C (O) C alle die Struktur von Vinylalkohol an. Algorithmen sind entwickelt worden, um sicherzustellen, dass dasselbe LÄCHELN für ein Molekül unabhängig von der Ordnung von Atomen in der Struktur erzeugt wird. Das LÄCHELT ist für jede Struktur einzigartig, obwohl der Abhängige auf dem canonicalization Algorithmus, der verwendet ist, um sie zu erzeugen, und das Kanonische LÄCHELN genannt wird. Diese Algorithmen wandeln zuerst das LÄCHELN zu einer inneren Darstellung der molekularen Struktur um und manipulieren Schnuren nicht einfach, wie manchmal gedacht wird. Verschiedene Algorithmen, um Kanonisches LÄCHELN zu erzeugen, sind einschließlich derjenigen durch das Tageslicht Chemische Informationssysteme, OpenEye Wissenschaftliche Software, MEDIT, Chemical Computing Group, MolSoft LLC und der Chemie-Entwicklungsbastelsatz entwickelt worden. Eine allgemeine Anwendung des Kanonischen LÄCHELNS versieht mit einem Inhaltsverzeichnis und sichert Einzigartigkeit von Molekülen in einer Datenbank.

LÄCHELN-Notation erlaubt die Spezifizierung der Konfiguration an vierflächigen Zentren und Doppelbindungsgeometrie. Das sind Struktureigenschaften, die durch die Konnektivität allein und LÄCHELN nicht angegeben werden können, das diese Information verschlüsselt, werden Isomeres LÄCHELN genannt. Eine bemerkenswerte Eigenschaft dieser Regeln ist, dass sie strenge teilweise Spezifizierung von chirality erlauben. Isomeres LÄCHELN des Begriffes wird auch auf das LÄCHELN angewandt, in dem Isotope angegeben werden.

Graph-basierte Definition

In Bezug auf ein Graph-basiertes rechenbetontes Verfahren ist LÄCHELN eine erhaltene Schnur durch den Druck der Symbol-Knoten, die in einer Tiefe das erste Baumtraversal eines chemischen Graphen gestoßen sind. Der chemische Graph wird zuerst zurechtgemacht, um Wasserstoffatome zu entfernen, und Zyklen werden gebrochen, um ihn in einen Überspannen-Baum zu verwandeln. Wo Zyklen gebrochen worden sind, werden numerische Nachsilbe-Etiketten eingeschlossen, um die verbundenen Knoten anzuzeigen. Parenthesen werden verwendet, um Punkte des Ausbreitens auf dem Baum anzuzeigen.

Beispiele

Atome

Atome werden durch die Standardabkürzung der chemischen Elemente in eckigen Klammern wie [Au] für Gold vertreten. Klammern können für die "organische Teilmenge" von B, C, N, O, P, S, F, Colorado, Br und mir weggelassen werden. Alle anderen Elemente müssen in Klammern eingeschlossen werden. Wenn die Klammern weggelassen werden, wird die richtige Zahl von impliziten Wasserstoffatomen angenommen; zum Beispiel ist das LÄCHELN für Wasser einfach O.

Ein Atom, das eine oder mehr elektrische Anklagen hält, wird in Klammern, gefolgt vom Symbol H eingeschlossen, wenn es zu einem oder mehr Atomen von Wasserstoff verpfändet wird, der von der Zahl von Wasserstoffatomen gefolgt ist (weil üblicher weggelassenes Beispiel ist: NH4 für Ammonium), dann durch das Zeichen '+' für eine positive Anklage oder durch '-' für eine negative Anklage. Die Zahl von Anklagen wird nach dem Zeichen angegeben (außer wenn es einen einzigen gibt); jedoch ist es auch möglich schreiben das Zeichen so oft, wie das Ion Anklagen hat: Statt "Ti+4" kann man auch "Ti ++++" (Titan IV, Ti) schreiben. So wird das Hydroxyd-Anion durch [OH-] vertreten, der oxonium cation ist [OH3 +] und das Kobalt, das III cation (Co) entweder [Co+3] oder [Co +++] sind.

Obligationen

Wie man

annimmt, sind Obligationen zwischen aliphatic Atomen, wenn nicht angegeben, sonst einzeln und werden durch das Angrenzen in der LÄCHELN-Schnur einbezogen. Zum Beispiel kann das LÄCHELN für Vinylalkohol als CCO geschrieben werden. Ringverschluss-Etiketten werden verwendet, um Konnektivität zwischen nichtangrenzenden Atomen in der LÄCHELN-Schnur anzuzeigen, die für cyclohexane und dioxane als C1CCCCC1 und O1CCOCC1 beziehungsweise geschrieben werden kann. Für einen zweiten Ring wird das Etikett 2 sein (Naphthalin: C1cccc2c1cccc2 (bemerken die untere Umschaltung für aromatische Zusammensetzungen)), und so weiter. Nach dem Erreichen 9 muss dem Etikett durch einen '%' vorangegangen werden, um zu differenzieren, es von zwei verschiedenen Etiketten, die zu demselben Atom (~C12 verpfändet sind, wird ~ bedeuten, dass das Atom von Kohlenstoff meint, dass der Ringverschluss 1 und 2 etikettiert, wohingegen ~C%12 ~ ein Etikett nur, 12 anzeigen wird). Doppelte, dreifache und vierfache Obligationen werden durch die Symbole '=', '#', und '$', beziehungsweise wie illustriert, durch das LÄCHELN O=C=O (Kohlendioxyd,) C#N (Wasserstoffzyanid,) und [Ga-] $ [Als +] (Gallium arsenide) vertreten.

Aromaticity

Aromatischer C, O, S und N Atome werden in ihrer unteren Umschaltung 'c', 'o', 's' und 'n' beziehungsweise gezeigt. Benzol, Pyridin und furan können beziehungsweise durch das LÄCHELN c1ccccc1, n1ccccc1 und o1cccc1 vertreten werden. Obligationen zwischen aromatischen Atomen sind standardmäßig, aromatisch, obwohl diese ausführlich mit angegeben werden können ':' Symbol. Aromatische Atome können zu einander einzeln verpfändet werden, und biphenyl kann durch c1ccccc1-c2ccccc2 vertreten werden. Aromatischer Stickstoff, der zu Wasserstoff so verpfändet ist, der in pyrrole gefunden ist, muss vertreten werden wie [nH], und imidazole wird in der LÄCHELN-Notation als n1c [nH] cc1 geschrieben.

Die Algorithmen von Tageslicht und OpenEye, um kanonisches LÄCHELN zu erzeugen, unterscheiden sich in ihrer Behandlung von aromaticity.

Das Ausbreiten

Zweige werden mit Parenthesen, als in CCC (=O) O für propionic Säure und C (F) (F) F für fluoroform beschrieben. Eingesetzte Ringe können mit dem sich verzweigenden Punkt im Ring, wie illustriert, durch das LÄCHELN COc (c1) cccc1C#N geschrieben werden (sieh Bild), und COc (cc1) ccc1C#N (sieh Bild), die die 3 und 4-cyanoanisole isomers verschlüsseln. Das Schreiben des LÄCHELNS für eingesetzte Ringe kann sie auf diese Weise menschlich-lesbarer machen.

Stereochemistry

Die Konfiguration um Doppelbindungen wird mit den Charakteren "/" und "\" angegeben. Zum Beispiel, F/C=C/F (sieh Bild), ist eine Darstellung von trans-difluoroethene, in dem die Fluor-Atome auf Gegenseiten der Doppelbindung, wohingegen F/C=C\F sind (sieh Bild) ist eine mögliche Darstellung von cis-difluoroethene, in dem Fs auf derselben Seite der Doppelbindung, wie gezeigt, in der Zahl sind.

Die Konfiguration an vierflächigem Kohlenstoff wird durch oder @@ angegeben. L-Alanine, der allgemeinere enantiomer der Aminosäure alanine kann als N [C @@ H] (C) C (=O) O geschrieben werden (sieh Bild). @@ zeigt specifier an, dass, wenn angesehen, vom Stickstoff entlang dem Band zum chiral Zentrum, der Folge von substituents Wasserstoff (H), Methyl (C) und carboxylate (C (=O) erscheinen O) im Uhrzeigersinn. D-Alanine kann als N [C@H] (C) C (=O) O geschrieben werden (sieh Bild). Die Ordnung des substituents in der LÄCHELN-Schnur ist sehr wichtig, und D-alanine kann auch als N [C @@ H] verschlüsselt werden (C (=O) O) C (sieh Bild).

Isotope

Isotope werden mit einer Zahl angegeben, die der ganzen Zahl isotopic Masse gleich ist, die dem Atomsymbol vorangeht. Benzol, in dem ein Atom Kohlenstoff 14 ist, wird als [14c] 1ccccc1 geschrieben, und deuterochloroform ist [2H] C (Colorado) (Kl.) Kl.

Anwendung auf einigen Molekülen

Illustration mit einem Molekül mit mehr als 9 Ringen, Cephalostatin-1 (ein steroidic trisdecacyclic pyrazine mit der empirischen Formel CHNO, der vom Indischen Ozean hemichordate Cephalodiscus gilchristi isoliert ist):

Das Starten mit ganz links Methyl-Gruppe in der Zahl:

Bemerken Sie, dass '%' vor dem Index von Ringverschluss-Etiketten oben 9 erscheint; sieh Abteilungsobligationen oben.

Andere Beispiele des LÄCHELNS

Die LÄCHELN-Notation wird umfassend im durch das Tageslicht zur Verfügung gestellten LÄCHELN-Theorie-Handbuch beschrieben Chemische Informationssysteme und mehrere veranschaulichende Beispiele werden präsentiert. Tageslicht zeichnet Dienstprogramm versorgt Benutzer mit den Mitteln, ihre eigenen Beispiele des LÄCHELNS zu überprüfen, und ist ein wertvolles Bildungswerkzeug.

Erweiterungen

SMARTS ist eine Liniennotation für die Spezifizierung von Substrukturmustern in Molekülen. Während es viele derselben Symbole wie LÄCHELN verwendet, erlaubt es auch Spezifizierung von Wildcard-Atomen und Obligationen, die verwendet werden können, um Substrukturabfragen für die chemische Datenbanksuche zu definieren. Ein häufiger Irrtum ist das hat Substruktursuche SMARTS-basiert schließt das Zusammenbringen des LÄCHELNS und der SMARTS-Schnuren ein. Tatsächlich werden beides LÄCHELN und SMARTS-Schnuren zuerst zu inneren Graph-Darstellungen umgewandelt, die nach dem Subgraph-Isomorphismus gesucht werden. GRINSEN ist eine Liniennotation, um anzugeben, dass sich Reaktion verwandelt.

Konvertierung

LÄCHELN kann zurück zu 2-dimensionalen Darstellungen mit Struktur-Diagramm-Generationsalgorithmen (Helson, 1999) umgewandelt werden. Diese Konvertierung ist nicht immer eindeutig. Die Konvertierung zur 3-dimensionalen Darstellung wird durch Energieminimierungsannäherungen erreicht. Es gibt viele herunterladbare und webbasierte Umwandlungsdienstprogramme.

Siehe auch

  • LÄCHELT willkürliche Zielspezifizierung SMARTS Sprache für die Spezifizierung von Substrukturabfragen.
  • SYBYL Liniennotation (eine andere Liniennotation)
  • Molekulare Anfragensprache - fragt Sprache, die auch numerische Eigenschaften, z.B physikochemische Werte oder Entfernungen erlaubt
  • Chemie-Entwicklungsbastelsatz (2. Lay-Out und Konvertierung)
  • Internationaler Chemischer Bezeichner (InChI), die freie und offene Alternative zum LÄCHELN durch den IUPAC.
  • OpenBabel, JOELib, OELib (Konvertierung)

Links

Spezifizierungen

LÄCHELN hat Softwaredienstprogramme verbunden

  • smi23d - 3D-Koordinatengeneration
  • Tageslicht Zeichnet - Übersetzen eine LÄCHELN-Formel in die Grafik
  • GIF/PNG-Creator für 2. Anschläge von Chemischen Strukturen
  • JME Molekül-Redakteur
  • ACD/ChemSketch
  • Marvin durch ChemAxon - online der chemische Redakteur/Zuschauer und LÄCHELN-Generator/Konverter
  • Sofortiger JChem durch ChemAxon - Tischanwendung für storing/generating/converting/visualizing/searching LÄCHELN-Strukturen, besonders Gruppe-Verarbeitung; persönliche Ausgabe freier
  • JChem für Excel durch ChemAxon - Zusatzfunktion von FRAU Excel für storing/generating/converting/visualizing/searching LÄCHELN-Strukturen
  • Smormo-Hrsg. - ein Molekül-Redakteur für Linux, der lesen und LÄCHELN schreiben kann
  • InChI.info - eine inoffizielle Website von InChI, die Online-Konverter von InChI und LÄCHELN zu molekularen Zeichnungen zeigt
  • Ballon - Ein kostenloses Programm für die 3D-Koordinatengeneration und conformational Analyse.
  • Indigo - eine Quer-Plattform der offenen Quelle cheminformatics Bibliothek mit einem Steck-für das IUPAC-entgegenkommende Molekül und die Reaktion 2. Strukturformel-Übergabe.
  • Offenes Babel - eine offene Quelle chemischer Werkzeugkasten, der jedem erlaubt zu suchen, wandeln Sie um, analysieren Sie, oder versorgen Sie biochemische Daten.
  • Bioclipse - ein freier und offener Quellarbeitstisch für die Lebenswissenschaften
  • MolEngine - Ein.NET cheminformatics Werkzeug zum Lesen/Schreiben-LÄCHELN, erzeugen Sie 2. Koordinate vom LÄCHELN und Bekehrter-LÄCHELN von/in anderen Chemischen Dateiformaten.
  • JSDraw - Eine Quer-Plattform javascript der chemische Struktur-Redakteur, um LÄCHELN und SMARTS zu erzeugen.

Doktrin von Sinatra / Soweto
Impressum & Datenschutz