Analyse der Abweichung

In der Statistik ist die Analyse der Abweichung (ANOVA) eine Sammlung von statistischen Modellen und ihre verbundenen Verfahren, in denen die beobachtete Abweichung in einer besonderen Variable in verschiedenen Quellen der Schwankung zuzuschreibende Bestandteile verteilt wird. In seiner einfachsten Form stellt ANOVA einen statistischen Test dessen zur Verfügung, ob die Mittel von mehreren Gruppen alle gleich sind, und deshalb T-Test zu mehr als zwei Gruppen verallgemeinert. Das Tun vielfacher Zwei-Proben-T-Tests würde auf eine vergrößerte Chance hinauslaufen, einen Fehler des Typs I zu begehen. Deshalb sind ANOVAs im Vergleichen zwei, drei, oder mehr Mittel nützlich.

Modelle

Es gibt drei Klassen von Modellen, die in der Analyse der Abweichung verwendet sind, und diese werden hier entworfen.

Modelle der festen Effekten (Modell 1)

Das Modell der festen Effekten der Analyse der Abweichung gilt für Situationen, in denen der Experimentator eine oder mehr Behandlungen auf die Themen des Experimentes anwendet, um zu sehen, ob die Ansprechvariable Änderung schätzt. Das erlaubt dem Experimentator, die Reihen von Ansprechvariable-Werten zu schätzen, die die Behandlung in der Bevölkerung als Ganzes erzeugen würde.

Modelle der zufälligen Effekten (Modell 2)

Zufällige Effekten-Modelle werden verwendet, wenn die Behandlungen nicht befestigt werden. Das kommt vor, wenn die verschiedenen Faktor-Niveaus von einer größeren Bevölkerung probiert werden. Weil die Niveaus selbst zufällige Variablen sind, unterscheiden sich einige Annahmen und die Methode, den Behandlungen gegenüberzustellen, vom Modell 1 von ANOVA.

Mischeffekten-Modelle (Modell 3)

Ein Mischeffekten-Modell enthält experimentelle Faktoren sowohl von befestigten Typen als auch von Typen der zufälligen Effekten, mit passend verschiedenen Interpretationen und Analyse für die zwei Typen.

Annahmen von ANOVA

Die Analyse der Abweichung ist von mehreren Annäherungen studiert, am üblichsten worden, von denen ein geradliniges Modell verwendet, das die Antwort auf die Behandlungen und Blöcke verbindet. Selbst wenn das statistische Modell nichtlinear ist, kann ihm durch ein geradliniges Modell näher gekommen werden, für das eine Analyse der Abweichung passend sein kann.

Lehrbuch-Analyse mit einer Normalverteilung

Die Analyse der Abweichung kann in Bezug auf ein geradliniges Modell präsentiert werden, das die folgenden Annahmen über den Wahrscheinlichkeitsvertrieb der Antworten macht:

  • Unabhängigkeit von Fällen - das ist eine Annahme des Modells, das die statistische Analyse vereinfacht.
  • Normalität - der Vertrieb des residuals ist normal.
  • Gleichheit (oder "Gleichartigkeit") Abweichungen, genannt homoscedasticity - die Abweichung von Daten in Gruppen sollte dasselbe sein. Musterbasierte Annäherungen nehmen gewöhnlich an, dass die Abweichung unveränderlich ist. Das Eigentum der unveränderlichen Abweichung erscheint auch im randomization (designbasierte) Analyse von Randomized-Experimenten, wo es eine notwendige Folge des randomized Designs und die Annahme der Einheitsbehandlungsadditivität ist. Wenn die Antworten eines randomized erwogenes Experiment scheitert, unveränderliche Abweichung zu haben, dann wird die Annahme der Einheitsbehandlungsadditivität notwendigerweise verletzt.

Um die Hypothese zu prüfen, dass alle Behandlungen genau dieselbe Wirkung haben, kommen die P-Werte des F-Tests nah den VersetzungstestP-Werten näher: Die Annäherung ist besonders nah, wenn das Design erwogen wird. Solche Versetzungstests charakterisieren Tests mit der maximalen Macht gegen alle alternativen Hypothesen, wie beobachtet, durch Rosenbaum. Der anova F-Test (der ungültigen Hypothese, dass alle Behandlungen genau dieselbe Wirkung haben) wird wie ein praktischer Test wegen seiner Robustheit gegen vielen alternativen Vertrieb empfohlen. Der Test von Kruskal-Wallis und der Test von Friedman sind nichtparametrische Tests, die sich auf eine Annahme der Normalität nicht verlassen.

Die getrennten Annahmen des Lehrbuch-Modells deuten an, dass die Fehler unabhängig, identisch, und normalerweise verteilt für feste Effekten-Modelle sind, d. h. dass die Fehler ('s) unabhängig sind und

:

Mit Sitz in Randomization Analyse

In einem randomized kontrolliertes Experiment werden die Behandlungen experimentellen Einheiten im Anschluss an das experimentelle Protokoll zufällig zugeteilt. Dieser randomization ist objektiv und offen erklärt, bevor das Experiment ausgeführt wird. Die objektive zufällige Anweisung wird verwendet, um die Bedeutung der ungültigen Hypothese, im Anschluss an die Ideen von C. S. Peirce und Ronald A. Fisher zu prüfen. Diese designbasierte Analyse wurde besprochen und von Francis J. Anscombe an der Rothamsted Experimentellen Station und von Oskar Kempthorne an der Iowa Staatlichen Universität entwickelt. Kempthorne und seine Studenten machen eine Annahme der Einheitsbehandlungsadditivität, die in den Büchern von Kempthorne und David R. Cox besprochen wird.

Einheitsbehandlungsadditivität

In seiner einfachsten Form stellt die Annahme der Einheitsbehandlungsadditivität fest, dass die beobachtete Antwort von der experimentellen Einheit, wenn man Behandlung erhält, als die Summe der Antwort der Einheit und der Behandlungswirkung geschrieben werden kann, die ist

:

Die Annahme der Einheitsbehandlung addivity deutet an, dass, für jede Behandlung, die th Behandlung genau dieselbe Wirkung auf jede Experiment-Einheit hat.

Die Annahme der Einheitsbehandlungsadditivität kann gewöhnlich, gemäß Cox und Kempthorne nicht direkt gefälscht werden. Jedoch können viele Folgen der Behandlungseinheitsadditivität gefälscht werden. Für ein Randomized-Experiment deutet die Annahme der Einheitsbehandlungsadditivität an, dass die Abweichung für alle Behandlungen unveränderlich ist. Deshalb, durch die philosophische Gegenüberstellung, besteht eine notwendige Bedingung für die Einheitsbehandlungsadditivität darin, dass die Abweichung unveränderlich ist.

Das Eigentum der Einheitsbehandlungsadditivität ist nicht invariant unter einer "Änderung der Skala", so verwenden Statistiker häufig Transformationen, um Einheitsbehandlungsadditivität zu erreichen. Wenn, wie man erwartet, die Ansprechvariable einer parametrischen Familie des Wahrscheinlichkeitsvertriebs folgt, dann kann der Statistiker angeben (im Protokoll für das Experiment oder die Beobachtungsstudie), dass die Antworten umgestaltet werden, um die Abweichung zu stabilisieren. Außerdem kann ein Statistiker angeben, dass sich logarithmisch verwandelt, auf die Antworten angewandt werden, die, wie man glaubt, einem multiplicative Modell folgen.

Gemäß dem funktionellen Gleichungslehrsatz von Cauchy ist der Logarithmus die einzige dauernde Transformation, die echte Multiplikation in die Hinzufügung umgestaltet.

Die Annahme der Einheitsbehandlungsadditivität wurde im Versuchsplan von Kempthorne und Cox behauptet. Der Gebrauch von Kempthorne der Einheitsbehandlungsadditivität und randomization ist der designbasierten Schlussfolgerung ähnlich, die in der Überblick-Stichprobenerhebung der begrenzten Bevölkerung normal ist.

Abgeleitetes geradliniges Modell

Kempthorne verwendet den Randomization-Vertrieb und die Annahme der Einheitsbehandlungsadditivität, um ein abgeleitetes geradliniges Modell zu erzeugen, das dem Lehrbuch-Modell sehr ähnlich ist, besprochen vorher.

Den Teststatistiken dieses abgeleiteten geradlinigen Modells wird durch die Teststatistik eines passenden normalen geradlinigen Modells, gemäß Annäherungslehrsätzen und Simulierungsstudien von Kempthorne und seinen Studenten (Hinkelmann und Kempthorne 2008) nah näher gekommen. Jedoch gibt es Unterschiede. Zum Beispiel läuft die mit Sitz in randomization Analyse auf eine kleine, aber (ausschließlich) negative Korrelation zwischen den Beobachtungen hinaus. In der mit Sitz in randomization Analyse gibt es keine Annahme einer Normalverteilung und sicher keine Annahme der Unabhängigkeit. Im Gegenteil sind die Beobachtungen abhängig!

Die mit Sitz in randomization Analyse hat den Nachteil, dass seine Ausstellung mit langweiliger Algebra und umfassende Zeit verbunden ist. Da die mit Sitz in randomization Analyse kompliziert wird und durch die Annäherung mit einem normalen geradlinigen Modell nah näher gekommen wird, betonen die meisten Lehrer die normale geradlinige Musterannäherung. Wenige Statistiker protestieren gegen die musterbasierte Analyse von erwogenen Randomized-Experimenten.

Statistische Modelle für Beobachtungsdaten

Jedoch, wenn angewandt, auf Daten von Non-Randomized-Experimenten oder Beobachtungsstudien, hat musterbasierte Analyse an der Befugnis von randomization Mangel. Für Beobachtungsdaten muss die Abstammung von Vertrauensintervallen subjektive Modelle, wie betont, durch Ronald A. Fisher und seine Anhänger verwenden. In der Praxis sind die Schätzungen von Behandlungseffekten von Beobachtungsstudien häufig allgemein inkonsequent. In der Praxis "sind statistische Modelle" und Beobachtungsdaten nützlich, um Hypothesen anzudeuten, die sehr vorsichtig vom Publikum behandelt werden sollten.

Logik von ANOVA

Das Verteilen der Summe von Quadraten

Die grundsätzliche Technik ist ein Verteilen der Gesamtsumme von Quadraten S in Bestandteile, die zu den im Modell verwendeten Effekten verbunden sind. Zum Beispiel, das Modell für eine vereinfachte ANOVA mit einem Typ der Behandlung an verschiedenen Niveaus.

:

Die Zahl von Graden der Freiheit f kann auf eine ähnliche Weise verteilt werden: Einer dieser Bestandteile (dass für den Fehler) gibt einen chi-karierten Vertrieb an, der die verbundene Summe von Quadraten beschreibt, während dasselbe für "Behandlungen" wahr ist, wenn es keine Behandlungswirkung gibt.

:

Siehe auch Lack-fit Summe von Quadraten.

Der F-Test

Der F-Test wird für Vergleiche der Bestandteile der Gesamtabweichung verwendet. Zum Beispiel, im Einweg-, oder einzelner Faktor ANOVA, wird statistische Bedeutung für durch das Vergleichen von statistischem des Tests des F geprüft

::wo

: Ich = Zahl von Behandlungen

und

: n = Gesamtzahl von Fällen

zum F-Vertrieb mit mir − 1, n − ich Grade der Freiheit. Das Verwenden des F-Vertriebs ist ein natürlicher Kandidat, weil der statistische Test das Verhältnis von zwei schuppigen Summen von Quadraten ist, von denen jedes einem schuppigen chi-karierten Vertrieb folgt.

Macht-Analyse

Macht-Analyse wird häufig im Zusammenhang von ANOVA angewandt, um die Wahrscheinlichkeit zu bewerten, erfolgreich die ungültige Hypothese zurückzuweisen, wenn wir ein bestimmtes Design von ANOVA, Wirkungsgröße in der Bevölkerung, Beispielgröße und Alpha-Niveau annehmen. Macht-Analyse kann beim Studiendesign durch die Bestimmung helfen, welche Beispielgröße erforderlich wäre, um eine angemessene Chance zu haben, die ungültige Hypothese zurückzuweisen, wenn die alternative Hypothese wahr ist.

Wirkungsgröße

Mehrere standardisierte Maßnahmen der Wirkung messen die Kraft der Vereinigung zwischen einem Propheten (oder Satz von Propheten) und der abhängigen Variable. Wirkungsgröße-Schätzungen erleichtern den Vergleich von Ergebnissen in Studien und über Disziplinen.

(Eta-karierter) η:

Eta-kariert beschreibt das Verhältnis der Abweichung, die in der abhängigen Variable durch einen Propheten erklärt ist, während sie für andere Propheten kontrolliert. Eta-kariert ist ein voreingenommener Vorkalkulator der Abweichung, die durch das Modell in der Bevölkerung erklärt ist (es schätzt nur die Wirkungsgröße in der Probe). Durchschnittlich überschätzt es die in der Bevölkerung erklärte Abweichung. Da die Beispielgröße größer wird, wird der Betrag der Neigung kleiner,

:

Cohen (1992) schlägt Wirkungsgrößen für verschiedene Indizes, einschließlich des ƒ vor (wo 0.1 eine kleine Wirkung ist, 0.25 ist eine mittlere Wirkung, und 0.4 ist eine große Wirkung). Er bietet auch eine Umrechnungstabelle an (sieh Cohen, 1988, p. 283), als eta (η) übereingestimmt hat, wo 0.0099 eine kleine Wirkung, 0.0588 eine mittlere Wirkung und 0.1379 eine große Wirkung einsetzt.

Anschlußtests

Einer statistisch bedeutenden Wirkung in ANOVA wird häufig mit einer oder verschiedeneren Anschlußtests gefolgt. Das kann getan werden, um zu bewerten, welche Gruppen von der andere Gruppen verschieden sind oder verschiedene andere eingestellte Hypothesen zu prüfen.

Anschlußtests sind häufig in Bezug darauf bemerkenswert, ob sie (a priori) geplant werden oder hoc anschlagen. Geplante Tests werden vor dem Schauen an den Daten bestimmt und eilen dahin Hoc-Tests werden nach dem Schauen an den Daten durchgeführt.

Eilen Sie dahin Hoc-Tests wie der Reihe-Test von Tukey vergleichen meistens jede Gruppe, die mit jeder anderen Gruppe bösartig ist, bösartig und normalerweise amtlich eingetragen eine Methode, für Fehler des Typs I zu kontrollieren.

Vergleiche, die meistens geplant werden, können entweder einfach oder zusammengesetzt sein. Einfache Vergleiche vergleichen eine Gruppe, die mit einer anderer bösartiger Gruppe bösartig ist. Zusammengesetzte Vergleiche vergleichen normalerweise zwei Sätze der Gruppenmittel, wo ein Satz zwei oder mehr Gruppen hat (z.B, vergleichen Sie durchschnittliche Gruppenmittel der Gruppe A, B und C mit der Gruppe D). Vergleiche können auch auf Tests der Tendenz wie geradlinige und quadratische Beziehungen schauen, wenn die unabhängige Variable bestellte Niveaus einschließt.

Studiendesigns und ANOVAs

Es gibt mehrere Typen von ANOVA. Viele Statistiker stützen ANOVA auf dem Design des Experimentes besonders auf dem Protokoll, das die zufällige Anweisung von Behandlungen zu Themen angibt; die Beschreibung des Protokolls des Anweisungsmechanismus sollte eine Spezifizierung der Struktur der Behandlungen und jedes Blockierens einschließen. Es ist auch üblich, ANOVA auf Beobachtungsdaten mit einem passenden statistischen Modell anzuwenden.

Einige populäre Designs verwenden die folgenden Typen von ANOVA:

  • Einweg-ANOVA wird verwendet, um für Unterschiede unter zwei oder mehr unabhängigen Gruppen (Mittel), z.B verschiedene Niveaus der Harnstoff-Anwendung in einem Getreide zu prüfen. Gewöhnlich jedoch wird die Einweg-ANOVA verwendet, um für Unterschiede unter mindestens drei Gruppen zu prüfen, da der Zwei-Gruppen-Fall durch einen T-Test bedeckt werden kann. Wenn es nur zwei Mittel gibt sich zu vergleichen, sind der T-Test und der F-Test von ANOVA gleichwertig; die Beziehung zwischen ANOVA und t wird durch F = t gegeben.
  • Factorial ANOVA wird verwendet, wenn der Experimentator die Wechselwirkungseffekten unter den Behandlungen studieren will.
  • Wiederholte Maßnahme-ANOVA wird verwendet, wenn dieselben Themen für jede Behandlung (z.B, in einer Längsstudie) verwendet werden.
  • Die Analyse von Multivariate der Abweichung (MANOVA) wird verwendet, wenn es mehr als eine Ansprechvariable gibt.

Geschichte

Die Analyse der Abweichung wurde informell von Forschern in den 1800er Jahren mit kleinsten Quadraten verwendet. In der Physik und Psychologie haben Forscher einen Begriff für die Maschinenbediener-Wirkung, den Einfluss einer besonderen Person auf Maßen gemäß den Geschichten von Stephen Stigler eingeschlossen.

Herr Ronald Fisher hat eine formelle Analyse der Abweichung in einem 1918-Artikel The Correlation Between Relatives über die Annahme des Mendelschen Erbes vorgeschlagen. Seine erste Anwendung der Analyse der Abweichung wurde 1921 veröffentlicht. Die Analyse der Abweichung ist weit bekannt geworden 1925 von Fisher eingeschlossen zu werden, bestellt Statistische Methoden für Forschungsarbeiter vor.

Siehe auch

  • ANOVA auf Reihen
  • ANOVA-gleichzeitige Teilanalyse
  • AMOVA
  • ANCOVA
  • ANORVA
  • MANOVA
  • Mischdesign-Analyse der Abweichung

Kommentare

Referenzen

  • Vorveröffentlichungskapitel sind online verfügbar.
  • Cohen, Jacob (1988). Statistische Macht-Analyse für die Verhaltenswissenschaften (2. Hrsg.). Routledge internationale Standardbuchnummer 978-0805802832
  • Steuermann, David R. (1958). Planung von Experimenten. Nachgedruckt als internationale Standardbuchnummer 978-0471574293
  • Freigelassener, David A.; Pisani, Robert; Purves, Roger (2007) Statistik, 4. Ausgabe. W.W. Norton & Company ISBN 978-0393929720
  • Freigelassener, David A. (2005). Statistische Modelle: Theorie und Praxis, Universität von Cambridge Presse. Internationale Standardbuchnummer 9780521671057
  • Lehmann, E.L. (1959) prüfende statistische Hypothesen. John Wiley & Sons.
  • Moore, David S. & McCabe, George P. (2005). Einführung in die Praxis der Statistik (5e). Internationale Standardbuchnummer von W H Freeman & Co 978-0716762829
  • Rosenbaum, Paul R. (2002). Beobachtungsstudien (2. Hrsg.). New York: Springer-Verlag. Internationale Standardbuchnummer 9780387989679

Weiterführende Literatur

  • Steuermann, David R. & Reid, Nancy M. (2000). Die Theorie des Designs von Experimenten. (Chapman & Hall/CRC). Internationale Standardbuchnummer 9781584881957
}\
  • Tabachnick, Barbara G. & Fidell, Linda S. (2007). Das Verwenden der Multivariate Statistik (5. Hrsg.). Boston: Pearson Internationale Ausgabe. Internationale Standardbuchnummer 9780205459384

Links


Abenteuer / Asien
Impressum & Datenschutz