Der chi-karierte Test von Pearson

Der chi-karierte Test von Pearson (χ) ist von mehreren chi-karierten Tests - statistische Verfahren am besten bekannt, deren Ergebnisse bezüglich des chi-karierten Vertriebs bewertet werden. Seine Eigenschaften wurden zuerst von Karl Pearson 1900 untersucht. In Zusammenhängen, wo es wichtig ist, eine Unterscheidung zwischen dem Test statistisch und seinem Vertrieb zu machen, werden Namen, die Pearson Χ-squared Test ähnlich sind oder statistisch sind, verwendet.

Es prüft eine ungültige Hypothese feststellend, dass der Frequenzvertrieb von bestimmten in einer Probe beobachteten Ereignissen mit einem besonderen theoretischen Vertrieb im Einklang stehend ist. Die betrachteten Ereignisse müssen gegenseitig exklusiv sein und Gesamtwahrscheinlichkeit 1 haben. Ein allgemeiner Fall dafür ist wo die Ereignisse jeder Deckel ein Ergebnis einer kategorischen Variable. Ein einfaches Beispiel ist die Hypothese, dass ein sechsseitiges Übliches "schön" ist, d. h. alle sechs Ergebnisse werden ebenso wahrscheinlich vorkommen.

Definition

Pearson hat chi-übereingestimmt wird verwendet, um zwei Typen des Vergleichs zu bewerten: Tests der Güte von passenden und Tests der Unabhängigkeit.

  • Ein Test der Güte von passenden gründet, ob sich ein beobachteter Frequenzvertrieb von einem theoretischen Vertrieb unterscheidet.
  • Ein Test der Unabhängigkeit bewertet, ob paarweise angeordnete Beobachtungen auf zwei Variablen, die in einer Kontingenztabelle ausgedrückt sind, von einander — zum Beispiel unabhängig sind, ob sich Leute von verschiedenen Gebieten in der Frequenz unterscheiden, mit der sie berichten, dass sie einen politischen Kandidaten unterstützen.

Der erste Schritt ist, den chi-karierten Test statistisch, X zu berechnen, der einer normalisierten Summe von karierten Abweichungen zwischen beobachteten und theoretischen Frequenzen (sieh unten) ähnelt. Der zweite Schritt ist, die Grade der Freiheit, dessen statistisch zu bestimmen, der im Wesentlichen die Zahl von Frequenzen ist, die durch die Zahl von Rahmen des taillierten Vertriebs reduziert sind. Im dritten Schritt, X ist im Vergleich zum kritischen Wert keiner Bedeutung vom Vertrieb, der in vielen Fällen eine gute Annäherung des Vertriebs X gibt. Ein Test, der sich auf diese Annäherung nicht verlässt, ist der genaue Test von Fisher; es ist im Erreichen einer Signifikanzebene besonders mit wenigen Beobachtungen wesentlich genauer.

Test auf passenden von einem Vertrieb

Getrennte Rechteckverteilung

In diesem Fall werden Beobachtungen unter Zellen geteilt. Eine einfache Anwendung soll die Hypothese prüfen, dass, in der allgemeinen Bevölkerung, Werte in jeder Zelle mit der gleichen Frequenz vorkommen würden. Die "theoretische Frequenz" für jede Zelle (laut der ungültigen Hypothese einer getrennten Rechteckverteilung) wird so als berechnet

:

und die Verminderung der Grade der Freiheit ist begrifflich, weil die beobachteten Frequenzen beschränkt werden, dazu zu resümieren.

Anderer Vertrieb

Wenn

man prüft, ob Beobachtungen zufällige Variablen sind, deren Vertrieb einer gegebenen Familie des Vertriebs gehört, werden die "theoretischen Frequenzen" mit einem Vertrieb von dieser Familie berechnet hat einen Standardweg eingefügt. Die Verminderung der Grade der Freiheit wird als berechnet, wo die Zahl von in der Anprobe des Vertriebs verwendeten Rahmen ist. Zum Beispiel, wenn man einen 3-Parameter-Vertrieb von Weibull überprüft, und wenn man eine Normalverteilung überprüft (wo die Rahmen Mittel- und Standardabweichung sind). Mit anderen Worten wird es Grade der Freiheit geben, wo die Zahl von Kategorien ist.

Es sollte bemerkt werden, dass die Grade der Freiheit auf der Zahl von Beobachtungen als mit einem t oder F-Vertrieb eines Studenten nicht basieren. Zum Beispiel, wenn die Prüfung für einen schönen, sechsseitiges stirbt, würde es fünf Grade der Freiheit geben, weil es sechs Kategorien/Rahmen (jede Zahl) gibt. Die Zahl von Zeiten, die das Sterben gerollt wird, wird gar keine Wirkung auf die Zahl von Graden der Freiheit haben.

Das Rechnen des teststatistischen

Der Wert des teststatistischen ist

:wo

: = der kumulative statistische Test von Pearson, der sich asymptotisch einem Vertrieb nähert.

: = eine beobachtete Frequenz;

: = eine erwartete (theoretische) Frequenz, die durch die ungültige Hypothese behauptet ist;

: = die Zahl von Zellen im Tisch.

Das chi-karierte statistische kann dann verwendet werden, um einen P-Wert durch das Vergleichen des Werts des statistischen zu einem chi-karierten Vertrieb zu berechnen. Die Zahl von Graden der Freiheit ist der Zahl von Zellen minus die Verminderung von Graden der Freiheit gleich.

Das Ergebnis über die Zahl von Graden der Freiheit ist gültig, als die ursprünglichen Daten multinomial waren und folglich die geschätzten Rahmen effizient sind, für das chi-karierte statistische zu minimieren. Mehr allgemein jedoch, wenn maximale Wahrscheinlichkeitsbewertung mit dem Minimum chi-karierte Bewertung nicht zusammenfällt, wird der Vertrieb irgendwo zwischen einem chi-karierten Vertrieb mit und Graden der Freiheit liegen (Sieh zum Beispiel Chernoff und Lehmann, 1954).

Methode von Bayesian

In der Bayesian Statistik würde man stattdessen einen Vertrieb von Dirichlet als verbunden vorherig verwenden. Wenn man eine vorherige Uniform genommen hat, dann ist die maximale Wahrscheinlichkeitsschätzung für die Bevölkerungswahrscheinlichkeit die beobachtete Wahrscheinlichkeit, und man kann ein glaubwürdiges Gebiet darum oder eine andere Schätzung schätzen.

Test der Unabhängigkeit

In diesem Fall besteht eine "Beobachtung" aus den Werten von zwei Ergebnissen, und die ungültige Hypothese ist, dass das Ereignis dieser Ergebnisse statistisch unabhängig ist. Jede Beobachtung wird einer Zelle einer zweidimensionalen Reihe von Zellen zugeteilt (hat einen Tisch genannt) gemäß den Werten der zwei Ergebnisse. Wenn es r Reihen und c Säulen im Tisch gibt, ist die "theoretische Frequenz" für eine Zelle, in Anbetracht der Hypothese der Unabhängigkeit,

:

wo N die Gesamtauswahl-Größe (die Summe aller Zellen im Tisch) ist. Der Wert des teststatistischen ist

:

Die Anprobe des Modells "der Unabhängigkeit" vermindert die Anzahl von Graden der Freiheit durch p = r + c − 1. Die Zahl von Graden der Freiheit ist der Zahl der Zellfernsteuerung, minus die Verminderung von Graden der Freiheit, p gleich, der dazu abnimmt (r − 1) (c − 1).

Für den Test der Unabhängigkeit, auch bekannt als den Test der Gleichartigkeit wird eine chi-karierte Wahrscheinlichkeit weniger als oder gleich 0.05 (oder das chi-karierte statistische, das an oder größer ist als der 0.05 kritische Punkt), von angewandten Arbeitern als Rechtfertigung allgemein interpretiert, für die ungültige Hypothese zurückzuweisen, dass die Reihe-Variable der Säulenvariable unabhängig ist.

Die alternative Hypothese entspricht den Variablen, die eine Vereinigung oder Beziehung haben, wo die Struktur dieser Beziehung nicht angegeben wird.

Annahmen

Der chi-karierte Test, wenn verwendet, mit der Standardannäherung, dass ein chi-karierter Vertrieb anwendbar ist, hat die folgenden Annahmen:

  • Einfache zufällige Probe - Die Beispieldaten sind eine zufällige Stichprobenerhebung von einem festen Vertrieb oder Bevölkerung, wo jedes Mitglied der Bevölkerung eine gleiche Wahrscheinlichkeit der Auswahl hat. Varianten des Tests sind für komplizierte Proben, solcher als entwickelt worden, wo die Daten beschwert werden.
  • Beispielgröße (ganzer Tisch) - Eine Probe mit einer genug großen Größe wird angenommen. Wenn ein chi karierter Test wird auf einer Probe mit einer kleineren Größe geführt, dann wird der chi quadratisch gemachter Test eine ungenaue Schlussfolgerung nachgeben. Der Forscher, indem er chi karierten Test auf kleinen Proben verwendet hat, könnte damit enden, einen Fehler des Typs II zu begehen.
  • Erwartete Zellzählung - Entsprechende erwartete Zellzählungen. Einige verlangen 5 oder mehr, und andere verlangen 10 oder mehr. Eine allgemeine Regel ist 5 oder mehr in allen Zellen 2 durch 2 Tisch, und 5 oder mehr in 80 % von Zellen in größeren Tischen, aber keine Zellen mit der Null haben Zählung erwartet. Wenn diese Annahme nicht entsprochen wird, wird die Korrektur von Yates angewandt.
  • Unabhängigkeit - wie man immer annimmt, sind Die Beobachtungen von einander unabhängig. Das bedeutet chi-kariert kann nicht verwendet werden, um aufeinander bezogene Daten (wie verglichene Paare oder Tafel-Daten) zu prüfen. In jenen Fällen könnten Sie sich dem Test von McNemar zuwenden wollen.

Beispiele

Güte von passenden

Zum Beispiel, um die Hypothese zu prüfen, dass eine zufällige Probe von 100 Menschen von einer Bevölkerung gezogen worden ist, in der Männer und Frauen in der Frequenz gleich sind, würde die beobachtete Zahl von Männern und Frauen im Vergleich zu den theoretischen Frequenzen von 50 Männern und 50 Frauen sein. Wenn es 44 Männer in der Probe und 56 Frauen, dann gab

:

Wenn die ungültige Hypothese wahr ist (d. h. Männer und Frauen werden mit der gleichen Wahrscheinlichkeit in der Probe gewählt), der statistische Test wird von einem chi-karierten Vertrieb mit einem Grad der Freiheit gezogen. Obwohl man zwei Grade der Freiheit erwarten könnte (ein jeder für die Männer und Frauen), müssen wir in Betracht ziehen, dass die Gesamtzahl von Männern und Frauen (100) beschränkt wird, und so es nur einen Grad der Freiheit gibt (2 − 1). Wechselweise, wenn die Zählung männlichen Geschlechts bekannt ist, wird die weibliche Zählung, und umgekehrt bestimmt.

Die Beratung des chi-karierten Vertriebs für 1 Grad der Freiheit zeigt, dass die Wahrscheinlichkeit, diesen Unterschied (oder einen mehr äußersten Unterschied zu beobachten, als das), wenn Männer und Frauen in der Bevölkerung ebenso zahlreich sind, etwa 0.23 ist. Diese Wahrscheinlichkeit ist höher als herkömmliche Kriterien für die statistische Bedeutung (0.001-0.05), so normalerweise würden wir die ungültige Hypothese nicht zurückweisen, dass die Zahl von Männern in der Bevölkerung dasselbe als die Zahl von Frauen ist (d. h. wir würden unsere Probe innerhalb der Reihe dessen denken, was wir für ein 50/50 männliches/weibliches Verhältnis erwarten würden.)

Probleme

Die Annäherung an den chi-karierten Vertrieb bricht zusammen, wenn erwartete Frequenzen zu niedrig sind. Es wird normalerweise annehmbar sein, so lange nicht mehr als 20 % der Ereignisse Frequenzen unten 5 erwartet haben. Wo es nur 1 Grad der Freiheit gibt, ist die Annäherung nicht zuverlässig, wenn erwartete Frequenzen unten 10 sind. In diesem Fall kann eine bessere Annäherung durch das Reduzieren des absoluten Werts jedes Unterschieds zwischen beobachteten und erwarteten Frequenzen durch 0.5 vor dem Quadrieren erhalten werden; das wird die Korrektur von Yates nach der Kontinuität genannt.

In Fällen, wo, wie man findet, der erwartete Wert, E, klein ist (entweder eine kleine zu Grunde liegende Bevölkerungswahrscheinlichkeit oder eine kleine Zahl von Beobachtungen anzeigend), kann die normale Annäherung des multinomial Vertriebs scheitern, und in solchen Fällen, wie man findet, ist es passender, den G-Test, eine Wahrscheinlichkeit Verhältnis-basierter statistischer Test zu verwenden. Wo die Gesamtauswahl-Größe klein ist, ist es notwendig, einen passenden genauen Test, normalerweise entweder der binomische Test oder (für Kontingenztabellen) der genaue Test von Fisher zu verwenden; aber bemerken Sie, dass dieser Test befestigte und bekannte Randsummen annimmt.

Vertrieb

Dem ungültigen Vertrieb des Pearsons, der mit j Reihen und k Säulen statistisch ist, wird durch den chi-karierten Vertrieb mit näher gekommen

(k − 1) (j − 1) Grade der Freiheit.

Diese Annäherung entsteht als der wahre Vertrieb laut der ungültigen Hypothese, wenn der erwartete Wert durch einen multinomial Vertrieb gegeben wird. Für große Beispielgrößen sagt der Hauptgrenzwertsatz, dass dieser Vertrieb zu einer bestimmten multivariate Normalverteilung neigt.

Zwei Zellen

Im speziellen Fall, wo es nur zwei Zellen im Tisch gibt, folgen die erwarteten Werte einem binomischen Vertrieb,

:wo

:p = Wahrscheinlichkeit, laut der ungültigen Hypothese,

:n = Zahl von Beobachtungen in der Probe.

Im obengenannten Beispiel ist die Hypothese aufgestellte Wahrscheinlichkeit einer männlichen Beobachtung 0.5, mit 100 Proben. So nehmen wir an, 50 Männer zu beobachten.

Wenn n genug groß ist, kann dem obengenannten binomischen Vertrieb von Gaussian (normaler) Vertrieb näher gekommen werden, und so prüft der Pearson statistisch kommt einem chi-karierten Vertrieb, näher

:

Lassen Sie O die Zahl von Beobachtungen von der Probe sein, die in der ersten Zelle sind. Der statistische Test von Pearson kann als ausgedrückt werden

:

der der Reihe nach als ausgedrückt werden kann

:

Durch die normale Annäherung an ein Binom ist das der karierte von einem normalem normalem variate, und wird folglich, wie gechi-quadratisch-macht, mit 1 Grad der Freiheit verteilt. Bemerken Sie, dass der Nenner eine Standardabweichung der Annäherung von Gaussian ist, so kann geschrieben werden

:

So, als im Einklang stehend mit der Bedeutung des chi-karierten Vertriebs messen wir, wie wahrscheinlich die beobachtete Zahl von Standardabweichungen weg vom bösartigen unter der Annäherung von Gaussian ist (der eine gute Annäherung für großen n ist).

Der chi-karierte Vertrieb wird dann rechts vom Statistikwert integriert, um den P-Wert zu erhalten, der der Wahrscheinlichkeit gleich ist, einen Statistikgleichen oder größeres zu bekommen als das beobachtete, die ungültige Hypothese annehmend.

Zwei durch zwei Kontingenztabellen

Wenn der Test auf eine Kontingenztabelle angewandt wird, die zwei Reihen und zwei Säulen enthält, ist der Test zu einem Z-Test von Verhältnissen gleichwertig.

Viele Zellen

Ähnliche Argumente führen als oben zum gewünschten Ergebnis. Jede Zelle (außer der endgültigen, dessen Wert durch andere völlig bestimmt wird) wird als eine unabhängige binomische Variable behandelt, und ihre Beiträge werden summiert, und jeder trägt einen Grad der Freiheit bei.

Siehe auch

  • G-Test, Test, an den chi-karierter Test eine Annäherung ist
  • Grade der Freiheit (Statistik), einschließlich Grade der Freiheit (Statistik) #Effective Grade der Freiheit für aufeinander bezogene Beobachtungen und normalisierte Modelle
  • Der genaue Test des Fischers
  • Mitteltest
  • Chi-karierter Test
  • Chi-karierter nomogram
  • Devianz (Statistik), ein anderes Maß der Qualität von passenden.
  • Die Korrektur von Yates für die Kontinuität
  • Mann-Whitney U
  • Die V von Cramér - ein Maß der Korrelation für den chi-karierten Test.

Referenzen

  • Belaubter Wald, P.E. Nikulin, M.S. (1996). Ein Handbuch zur chi-karierten Prüfung, J.Wiley, New York, internationale Standardbuchnummer 0 471 55779 X.

Heute (NBC Programm) / Sprachen von Pontic
Impressum & Datenschutz