Chemometrics

Chemometrics ist die Wissenschaft, Information aus chemischen Systemen durch datengesteuerte Mittel herauszuziehen. Es ist eine hoch Zwischengesichtsdisziplin mit Methoden, die oft in datenanalytischen Kerndisziplinen wie Multivariate-Statistik, angewandte Mathematik und Informatik verwendet sind, um Probleme in Chemie, Biochemie, Medizin, Biologie und chemischer Technik zu richten. Auf diese Weise spiegelt es mehrere andere Zwischengesichts'-Metrik 'wie psychometrics und econometrics wider.

Einführung

Chemometrics wird angewandt, um sowohl beschreibende als auch prophetische Probleme in experimentellen Lebenswissenschaften besonders in der Chemie zu beheben. In beschreibenden Anwendungen werden Eigenschaften von chemischen Systemen mit der Absicht modelliert, die zu Grunde liegenden Beziehungen und Struktur des Systems (d. h., das Musterverstehen und die Identifizierung) zu erfahren. In prophetischen Anwendungen werden Eigenschaften von chemischen Systemen mit der Absicht modelliert, neue Eigenschaften oder Verhalten von Interesse vorauszusagen. In beiden Fällen können die datasets klein sein, aber sind häufig sehr groß und hoch kompliziert, Hunderte zu Tausenden von Variablen und Hunderte zu Tausenden von Fällen oder Beobachtungen einschließend.

Techniken von Chemometric werden besonders in der analytischen Chemie und metabolomics schwer verwendet, und die Entwicklung von verbesserten chemometric Methoden der Analyse setzt auch fort, den Stand der Technik in der analytischen Instrumentierung und Methodik vorzubringen. Es ist eine Anwendung gesteuerte Disziplin, und so, während der Standard chemometric Methodiken industriell sehr weit verwendet wird, werden akademische Gruppen der fortlaufenden Entwicklung der chemometric Theorie, Methode und Anwendungsentwicklung gewidmet.

Ursprünge

Obwohl man behaupten konnte, dass sogar die frühsten analytischen Experimente in der Chemie mit einer Form von chemometrics verbunden gewesen sind, wie man allgemein anerkennt, ist das Feld in den 1970er Jahren erschienen, als Computer zunehmend ausgenutzt für die wissenschaftliche Untersuchung geworden sind. Der Begriff 'chemometrics' wurde von Svante Wold in einer Bewilligungsanwendung 1971 ins Leben gerufen, und die Internationale Chemometrics Gesellschaft wurde kurz danach von Svante Wold und Bruce Kowalski, zwei Pionieren im Feld gebildet. Wold war ein Professor der organischen Chemie an der Umeå Universität, Schweden, und Kowalski war ein Professor der analytischen Chemie an der Universität Washingtons, Seattles.

Viele frühe Anwendungen haben multivariate Klassifikation, zahlreiche quantitative prophetische Anwendungen gefolgt, und bis zum Ende der 1970er Jahre eingeschlossen, und Anfang der 1980er Jahre kam ein großes Angebot an Daten - und computergesteuerte chemische Analysen vor.

Analyse von Multivariate war eine kritische Seite sogar in den frühsten Anwendungen von chemometrics. Die Daten, die sich aus infraroter und UV/visible Spektroskopie ergeben, numerieren häufig in den Tausenden von Maßen pro Probe leicht. Massenspektrometrie, Kernkernspinresonanz, atomare Emission/Absorption und Chromatographie-Experimente sind auch alle durch die Natur hoch multivariate. Wie man fand, war die Struktur dieser Daten dem Verwenden von Techniken wie Hauptteilanalyse (PCA) und teilweise Am-Wenigsten-Quadrate (PLS) förderlich. Das ist in erster Linie, weil, während der datasets hoch multivariate sein kann, dort stark ist und häufig geradlinige Struktur-Gegenwart der niedrigen Reihe. PCA und PLS sind mit der Zeit sehr wirksam beim empirischen Modellieren der chemischer interessanten Struktur der niedrigen Reihe, der Ausnutzung der Wechselbeziehungen oder 'latenten Variablen' in den Daten und der Versorgung alternativer Kompaktkoordinatensysteme für die weitere numerische Analyse wie rückwärts Gehen, das Sammeln und die Muster-Anerkennung gezeigt worden. Teilweise wurden kleinste Quadrate insbesondere in chemometric Anwendungen viele Jahre lang schwer verwendet, bevor es begonnen hat, regelmäßigen Gebrauch in anderen Feldern zu finden.

Im Laufe der 1980er Jahre sind drei hingebungsvolle Zeitschriften im Feld erschienen: Zeitschrift von Chemometrics (von John Wiley & Sons),

Chemometrics und Intelligent Laboratory Systems (von Elsevier http://www.elsevier.com/wps/find/journaldescription.cws_home/502682/description#description), und Zeitschrift der chemischen Information und (von der amerikanischen chemischen Gesellschaft) modellierend.

Diese Zeitschriften setzen fort, sowohl grundsätzliche als auch methodologische Forschung in chemometrics zu bedecken. Zurzeit werden die meisten alltäglichen Anwendungen vorhandener chemometric Methoden in anwendungsbezogenen Zeitschriften allgemein veröffentlicht (z.B, Angewandte Spektroskopie, Analytische Chemie, Anal. Chim. Acta. Talanta).

Mehrere wichtige Bücher/Monografien auf chemometrics wurden auch zuerst in den 1980er Jahren, einschließlich der Erstausgabe der "Faktorenanalyse von Malinowski in der Chemie", Sharaf, Illmans "Chemometrics" und Kowalskis, Massart veröffentlicht u. a. "Chemometrics: ein Lehrbuch", und "Multivariate Kalibrierung" durch Martens und Naes.

Einige große chemometric Anwendungsgebiete haben fortgesetzt, neue Gebiete, wie das molekulare Modellieren und QSAR, cheminformatics, die 'Felder der '-omic von genomics, proteomics, metabonomics und metabolomics, dem Prozess-Modellieren zu vertreten und analytische Technologie zu bearbeiten.

Eine Rechnung der frühen Geschichte von chemometrics wurde als eine Reihe von Interviews von Geladi und Esbensen veröffentlicht.

Techniken

Kalibrierung von Multivariate

Viele chemische Probleme und Anwendungen von chemometrics schließen Kalibrierung ein. Das Ziel ist entwickeln Modelle, die verwendet werden können, um Eigenschaften von Interesse vorauszusagen, die auf gemessenen Eigenschaften des chemischen Systems, wie Druck, Fluss, Temperatur gestützt sind, infrarot, Raman, NMR Spektren und Massenspektren. Beispiele schließen die Entwicklung von multivariate Modellen ein, die 1) Mehrwellenlänge geisterhafte Antwort auf die analyte Konzentration, 2) molekulare Deskriptoren zur biologischen Tätigkeit, 3) multivariate Prozess-Bedingungen/Staaten zu Endprodukt-Attributen verbinden. Der Prozess verlangt eine Kalibrierung oder Lehrdatei, die Bezugswerte für die Eigenschaften von Interesse für die Vorhersage und die gemessenen Attribute einschließt, die geglaubt sind, diesen Eigenschaften zu entsprechen. Für den Fall 1), zum Beispiel, kann man Daten von mehreren Proben, einschließlich Konzentrationen für einen analyte von Interesse für jede Probe (die Verweisung) und das entsprechende Infrarotspektrum dieser Probe sammeln. Kalibrierungstechniken von Multivariate wie teilweises am wenigsten Quadratrückwärts Gehen oder Hauptteilrückwärts Gehen (und fast unzählige andere Methoden) werden dann verwendet, um ein mathematisches Modell zu bauen, das die multivariate Antwort (Spektrum) mit der Konzentration des analyte von Interesse verbindet, und solch ein Modell verwendet werden kann, um die Konzentrationen von neuen Proben effizient vorauszusagen.

Techniken in der multivariate Kalibrierung werden häufig als klassische oder umgekehrte Methoden weit gehend kategorisiert. Der Hauptunterschied zwischen diesen Annäherungen ist, dass in der klassischen Kalibrierung die Modelle solch gelöst werden, dass sie im Beschreiben der gemessenen analytischen Antworten (z.B, Spektren) optimal sind und deshalb als optimale Deskriptoren betrachtet werden können, wohingegen in umgekehrten Methoden die Modelle gelöst werden, um im Voraussagen der Eigenschaften von Interesse (z.B, Konzentrationen, optimale Propheten) optimal zu sein. Umgekehrte Methoden verlangen gewöhnlich, dass weniger physische Kenntnisse des chemischen Systems, und mindestens in der Theorie höhere Vorhersagen im mittel Fehlersinn zur Verfügung stellen, und folglich umgekehrte Annäherungen dazu neigen, öfter in der zeitgenössischen multivariate Kalibrierung angewandt zu werden.

Die Hauptvorteile des Gebrauches von multivariate Kalibrierungstechniken bestehen darin, dass schnelle, preiswerte oder nichtzerstörende analytische Maße (wie optische Spektroskopie) verwendet werden können, um Beispieleigenschaften zu schätzen, die zeitraubende, teure oder zerstörende Prüfung (wie HPLC) sonst verlangen würden. Ebenso wichtig ist, dass multivariate Kalibrierung genaue quantitative Analyse in Gegenwart von der schweren Einmischung durch anderen analytes berücksichtigt. Die Selektivität der analytischen Methode wird so viel durch die mathematische Kalibrierung zur Verfügung gestellt, wie die analytischen Maß-Modalitäten. Zum Beispiel können Nah-Infrarotspektren, die äußerst breit und im Vergleich zu anderen analytischen Techniken (solcher als infrarot oder Spektren von Raman) nichtauswählend sind, häufig erfolgreich in Verbindung mit sorgfältig entwickelten multivariate Kalibrierungsmethoden verwendet werden, Konzentrationen von analytes in sehr kompliziertem matrices vorauszusagen.

Klassifikation, Muster-Anerkennung, sich sammelnd

Beaufsichtigte multivariate Klassifikationstechniken sind nah mit multivariate Kalibrierungstechniken darin verbunden eine Kalibrierung oder Lehrsatz werden verwendet, um ein mathematisches Modell zu entwickeln, das dazu fähig ist, zukünftige Proben zu klassifizieren. Die in chemometrics verwendeten Techniken sind denjenigen ähnlich, die in anderen Feldern - multivariate Diskriminanten-Analyse, logistisches rückwärts Gehen, Nervennetze, Bäume des rückwärts Gehens/Klassifikation verwendet sind. Der Gebrauch von Reihe-Verminderungstechniken in Verbindung mit diesen herkömmlichen Klassifikationsmethoden ist in chemometrics, zum Beispiel Diskriminanten-Analyse auf Hauptbestandteilen alltäglich oder kleinste Quadrathunderte teilweise.

Unbeaufsichtigte Klassifikation (auch genannte Traube-Analyse) wird auch allgemein verwendet, um Muster in komplizierten Dateien zu entdecken, und wieder sind viele der in chemometrics verwendeten Kerntechniken für andere Felder wie das Maschinenlernen und statistische Lernen üblich.

Multivariate biegen Entschlossenheit

Im chemometric Sprachgebrauch, multivariate Kurve-Entschlossenheit bemüht sich, Dateien mit der beschränkten oder abwesenden Bezugsinformation und den Systemkenntnissen zu dekonstruieren. Etwas von der frühsten Arbeit an diesen Techniken wurde von Lawton und Sylvestre am Anfang der 1970er Jahre getan. Diese Annäherungen werden auch genannt, Mischungsanalyse selbstmodellierend, blenden Trennung der Quelle/Signals und das geisterhafte Unmischen. Zum Beispiel, von einer Datei, die Fluoreszenz-Spektren von einer Reihe von Proben jeder umfasst, vielfachen fluorophores, multivariate Kurve-Entschlossenheitsmethoden enthaltend, kann verwendet werden, um die Fluoreszenz-Spektren des individuellen fluorophores zusammen mit ihren Verhältniskonzentrationen in jeder der Proben herauszuziehen, im Wesentlichen das Gesamtfluoreszenz-Spektrum in die Beiträge von den individuellen Bestandteilen unmischend. Das Problem wird gewöhnlich wegen der Rotationszweideutigkeit schlecht-bestimmt (viele mögliche Lösungen können die Messwerte gleichwertig vertreten), so ist die Anwendung von zusätzlichen Einschränkungen, solcher als nichtnegativ, Unmodalität oder bekannte Wechselbeziehungen zwischen den individuellen Bestandteilen (z.B, kinetisch oder Massengleichgewicht-Einschränkungen) üblich.

Andere Techniken

Versuchsplan bleibt ein Kerngebiet der Studie in chemometrics und mehreren Monografien wird dem Versuchsplan in chemischen Anwendungen spezifisch gewidmet. Gesunde Grundsätze des Versuchsplanes sind innerhalb der chemometrics Gemeinschaft weit angenommen worden, obwohl viele komplizierte Experimente rein Beobachtungs-sind, und es wenig Kontrolle über die Eigenschaften und Wechselbeziehungen der Proben und Beispieleigenschaften geben kann.

Signalverarbeitung ist auch ein kritischer Bestandteil fast aller chemometric Anwendungen, besonders der Gebrauch von Signalvorbehandlungen, um Daten vor der Kalibrierung oder Klassifikation zu bedingen. Die Techniken verwendet allgemein in chemometrics sind häufig nah mit denjenigen verbunden, die in zusammenhängenden Feldern verwendet sind.

Leistungscharakterisierung und Zahlen des Verdiensts Wie die meisten Arenen in den physischen Wissenschaften, chemometrics werden quantitativ orientiert, so wird beträchtlicher Wert auf Leistungscharakterisierung, Musterauswahl, Überprüfung & Gültigkeitserklärung und Zahlen des Verdiensts gelegt. Die Leistung von quantitativen Modellen wird gewöhnlich durch die Wurzel quadratisch gemachter Mittelfehler im Voraussagen des Attributes von Interesse, und die Leistung von classifiers als eine wahr-positive rate/false-positive Rate Paare (oder eine volle ROC-Kurve) angegeben. Ein neuer Bericht durch Olivieri. stellt eine umfassende Übersicht von Zahlen des Verdiensts und der Unklarheitsbewertung in der multivariate Kalibrierung, einschließlich multivariate Definitionen von Selektivität, Empfindlichkeit, Störabstand und Vorhersagezwischenraum-Bewertung zur Verfügung. Musterauswahl von Chemometric ist gewöhnlich mit dem Gebrauch von Werkzeugen wie Wiederstichprobenerhebung (einschließlich der Stiefelstrippe, Versetzung, Quer-Gültigkeitserklärung) verbunden.

Multivariate statistische Prozesssteuerung (MSPC), das Modellieren und die Optimierung sind für einen wesentlichen Betrag der historischen chemometric Entwicklung verantwortlich. Spektroskopie ist erfolgreich für die Online-Überwachung von Fertigungsverfahren seit 30-40 Jahren und diesem Prozess verwendet worden Daten sind dem Chemometric-Modellieren hoch zugänglich. Spezifisch in Bezug auf MSPC sind das mehrwegige Modellieren der Gruppe und die dauernden Prozesse in der Industrie immer üblicher und bleiben ein aktives Gebiet von der Forschung in chemometrics und chemischen Technik. Bearbeiten Sie analytische Chemie, weil sie ursprünglich genannt wurde, oder der neuere Begriff in einer Prozession geht, setzt analytische Technologie fort, schwer chemometric Methoden und MSPC anzuziehen.

Mehrwegige Methoden werden in chemometric Anwendungen schwer verwendet. Das sind höherwertige Erweiterungen weiter verwendeter Methoden. Zum Beispiel, während die Analyse eines Tisches (Matrix oder zweite Ordnung arry) Daten in mehreren Feldern alltäglich ist, werden mehrwegige Methoden auf Dateien angewandt, die 3., 4., oder höhere Ordnungen einschließen. Daten dieses Typs sind in der Chemie, zum Beispiel eine Flüssigchromatographie / Massenspektrometrie (LC-MS) sehr üblich System erzeugt eine große Matrix von Daten (elution Zeit gegen m/z) für jede analysierte Probe. Die Daten über vielfache Proben umfassen so einen Datenwürfel. Das Gruppe-Prozess-Modellieren ist mit Dateien verbunden, die Zeit gegen Prozessvariablen gegen die Gruppe-Zahl haben. Die mehrwegigen mathematischen auf diese Sorten von Problemen angewandten Methoden schließen PARAFAC, trilinear Zergliederung, und mehrwegiger PLS und PCA ein.

Software

Mehrere chemometric Praktiker verwenden auch statistische Pakete wie SAS-JMP und Minietikett für einige Seiten der Analyse. Das Programmieren direkt in Matlab, R, und anderen Sprachen ist auch, und eine Reihe frei verfügbaren üblich, oder Werkzeugkästen der Offenen Quelle sind im Internet verfügbar.

Frei verfügbar und Offene Quelle

Weiterführende Literatur

  • Chemometrics und intelligente Laborsysteme, eine internationale von der chemometrics Gesellschaft gesponserte Zeitschrift haben seit 1987 durch Elsevier veröffentlicht
  • H. Marder, T. Naes, Kalibrierung von Multivariate, Wiley 1989
  • K.R. Beebe, R.J. Pell, M.B. Seasholtz, Chemometrics: ein praktischer Führer, Wiley 1998
  • D.L. Massart, B.G.M. Vandeginste, S.M. Deming, Y. Michotte, L. Kaufman, Chemometrics: ein Lehrbuch, Elsevier 1988
  • B.G.M. Vandeginste, D.L. Massart, L.M.C. Buydens, S. De Jong, P.J. Lewi, J. Smeyers-Verbeke, Handbuch von Chemometrics und Qualimetrics: Part A & Part B, Elsevier 1998
  • S.D. Brown, R. Tauler, B. Walczak (Hrsg.), Umfassender Chemometrics: chemische und biochemische Datenanalyse (4 Volumen-Satz), Elsevier, 2009
  • R.G. Brereton, Gewandter chemometrics für Wissenschaftler, Wiley 2007
  • M. Otto, Chemometrics: Statistik und Computeranwendung in der analytischen Chemie, 2. Ausgabe, Wiley-VCH 2007
  • R. Kramer, Techniken von Chemometric für die quantitative Analyse, CRC Presse, 1998
  • P.J. Gemperline (Hrsg.), Praktisches Handbuch zu chemometrics, 2. Ausgabe, CRC Presse 2006
  • H. Zeichen, J. Arbeiter, Chemometrics in der Spektroskopie, Akademischem Presse-Elsevier, den 2007
  • M. Maeder, Y.-M. Neuhold, Praktische Datenanalyse in der Chemie, Elsevier 2007

Links


Rotes Kaninchen / Polynomische lange Abteilung
Impressum & Datenschutz