Wahrscheinlichkeitsverhältnis-Test

In der Statistik ist ein Wahrscheinlichkeitsverhältnis-Test ein statistischer Test, der verwendet ist, um die passenden von zwei Modellen zu vergleichen, von denen eines (das ungültige Modell) ein spezieller Fall vom anderen (das alternative Modell) ist. Der Test basiert auf dem Wahrscheinlichkeitsverhältnis, das ausdrückt, wie oft wahrscheinlicher die Daten unter einem Modell sind als der andere. Dieses Wahrscheinlichkeitsverhältnis, oder gleichwertig sein Logarithmus, kann dann verwendet werden, um einen P-Wert, oder im Vergleich zu einem kritischen Wert zu schätzen, um zu entscheiden, ob man das ungültige Modell zu Gunsten vom alternativen Modell zurückweist. Wenn der Logarithmus des Wahrscheinlichkeitsverhältnisses verwendet wird, ist das statistische als ein Verhältnis der Klotz-Wahrscheinlichkeit statistisch, und der Wahrscheinlichkeitsvertrieb dieses statistischen Tests bekannt, annehmend, dass das ungültige Modell wahr ist, kann mit dem Lehrsatz von Wilks näher gekommen werden.

Im Fall vom Unterscheiden zwischen zwei Modellen, von denen jedes keine unbekannten Rahmen hat, kann der Gebrauch des Wahrscheinlichkeitsverhältnis-Tests durch das Lemma von Neyman-Pearson gerechtfertigt werden, das demonstriert, dass solch ein Test die höchste Macht unter allen Mitbewerbern hat.

Verwenden

Jedes der zwei konkurrierenden Modelle, des ungültigen Modells und des alternativen Modells, wird an die Daten und die registrierte Klotz-Wahrscheinlichkeit getrennt geeignet. Der Test statistisch (häufig angezeigt durch D) ist zweimal der Unterschied in dieser Klotz-Wahrscheinlichkeit:

: \begin {richten }\aus

D & =-2\ln\left (\frac {\\Text {Wahrscheinlichkeit für das ungültige Modell}} {\\Text {Wahrscheinlichkeit für das alternative Modell}} \right) \\

&=-2\ln (\text {Wahrscheinlichkeit für das ungültige Modell}) + 2\ln (\text {Wahrscheinlichkeit für das alternative Modell}) \\

\end {richten }\aus</Mathematik>

Das Modell mit mehr Rahmen wird immer mindestens ebenso passen (haben Sie eine größere Klotz-Wahrscheinlichkeit). Ob es bedeutsam besser passt und so bevorzugt werden sollte, wird durch das Abstammen der Wahrscheinlichkeit oder des P-Werts des Unterschieds D bestimmt. Wo die ungültige Hypothese einen speziellen Fall der alternativen Hypothese vertritt, ist der Wahrscheinlichkeitsvertrieb des statistischen Tests ungefähr ein chi-karierte Vertrieb mit Graden der Freiheit, die df2 &minus gleich ist; df1. Symbole df1 und df2 vertreten die Zahl von freien Rahmen von Modellen 1 und 2, dem ungültigen Modell und dem alternativen Modell beziehungsweise.

Der Test verlangt verschachtelte Modelle, der ist: Modelle, in denen der kompliziertere ins einfachere Modell durch das Auferlegen einer Reihe von Einschränkungen auf die Rahmen umgestaltet werden kann.

Zum Beispiel: Wenn das ungültige Modell 1 freien Parameter und eine Klotz-Wahrscheinlichkeit &minus;8024 hat und das alternative Modell 3 Grade der Freiheit und einen LL &minus;8012 hat, dann ist die Wahrscheinlichkeit dieses Unterschieds die des chi-karierten Werts von +2 · (8024 &minus; 8012) = 24 mit 3 &minus; 1 = 2 Grade der Freiheit. Bestimmte Annahmen müssen für das statistische entsprochen werden, um einem chi-karierten Vertrieb zu folgen, und häufig werden empirische P-Werte geschätzt.

Hintergrund

Das Wahrscheinlichkeitsverhältnis, das häufig durch (das griechische Kapitalbrief-Lambda) angezeigt ist, ist das Verhältnis der Wahrscheinlichkeitsfunktion, die die Rahmen mehr als zwei verschiedene Sätze im Zähler und Nenner ändert.

Ein Wahrscheinlichkeitsverhältnis-Test ist ein statistischer Test darauf, eine Entscheidung zwischen zwei auf dem Wert dieses Verhältnisses gestützten Hypothesen zu treffen.

Es ist zur Annäherung von Neyman-Pearson an die statistische Hypothese-Prüfung, und wie statistische Hypothese zentral, die allgemein prüft, wird sowohl weit verwendet und viel kritisiert; sieh Kritik unten.

Einfache-gegen-einfach Hypothesen

Ein statistisches Modell ist häufig eine parametrisierte Familie von Wahrscheinlichkeitsdichte-Funktionen oder Wahrscheinlichkeitsmassenfunktionen. Ein einfacher-gegen-einfach Hypothese-Test hat Modelle sowohl laut der ungültigen als auch laut alternativen Hypothesen völlig angegeben, die für die Bequemlichkeit in Bezug auf feste Werte eines begrifflichen Parameters geschrieben werden:

:\begin {richten }\aus

H_0 &:& \theta =\theta_0, \\

H_1 &:& \theta =\theta_1.

\end {richten }\aus</Mathematik>

Bemerken Sie, dass laut jeder Hypothese der Vertrieb der Daten völlig angegeben wird; es gibt keine unbekannten Rahmen, um zu schätzen. Das Wahrscheinlichkeitsverhältnis prüft statistisch kann als geschrieben werden:

:

\Lambda (x) = \frac {L (\theta_0|x)} {L (\theta_1|x)} = \frac {f (x |\theta_0)} {f (x |\theta_1) }\

</Mathematik>oder:

wo die Wahrscheinlichkeitsfunktion ist. Bemerken Sie, dass einige Verweisungen das Gegenstück als die Definition verwenden können. In der Form festgesetzt hier ist das Wahrscheinlichkeitsverhältnis klein, wenn das alternative Modell besser ist, als das ungültige Modell und der Wahrscheinlichkeitsverhältnis-Test die Entscheidungsregel als zur Verfügung stellen:

:If, weisen Sie nicht zurück;

:If

:Reject mit der Wahrscheinlichkeit wenn

Die Werte werden gewöhnlich gewählt, um eine angegebene Signifikanzebene durch die Beziehung zu erhalten:

Definition (Wahrscheinlichkeitsverhältnis-Test auf zerlegbare Hypothesen)

Eine ungültige Hypothese wird häufig durch den Ausspruch festgesetzt, dass der Parameter in einer angegebenen Teilmenge des Parameter-Raums ist.

:\begin {richten }\aus

H_0 &:& \theta \in \Theta_0 \\

H_1 &:& \theta \in \Theta_0^ {\\Ergänzung }\

\end {richten }\aus</Mathematik>

Die Wahrscheinlichkeitsfunktion ist (damit, der pdf zu sein, oder pmf) ist eine Funktion des Parameters mit dem gehaltenen, der am Wert befestigt ist, der wirklich, d. h., die Daten beobachtet wurde. Das Wahrscheinlichkeitsverhältnis prüft statistisch ist

:

Hier bezieht sich die Notation auf die Supremum-Funktion.

Ein Wahrscheinlichkeitsverhältnis-Test ist jeder Test mit dem kritischen Gebiet (oder Verwerfungsgebiet) von der Form, wo jede Zahl-Zufriedenheit ist. Viele allgemeine Teststatistiken wie der Z-Test, der F-Test, der chi-karierte Test von Pearson und der G-Test sind Tests auf verschachtelte Modelle und können als Verhältnisse der Klotz-Wahrscheinlichkeit oder Annäherungen davon ausgedrückt werden.

Interpretation

Eine Funktion der Daten seiend, ist der LR deshalb ein statistischer. Der Wahrscheinlichkeitsverhältnis-Test weist die ungültige Hypothese zurück, wenn der Wert davon statistisch zu klein ist. Wie klein zu klein ist, hängt von der Signifikanzebene des Tests, d. h., darauf ab, welche Wahrscheinlichkeit des Fehlers des Typs I erträglich betrachtet wird (Fehler "des Typs I" bestehen aus der Verwerfung einer ungültigen Hypothese, die wahr ist).

Der Zähler entspricht der maximalen Wahrscheinlichkeit eines beobachteten Ergebnisses laut der ungültigen Hypothese. Der Nenner entspricht der maximalen Wahrscheinlichkeit eines beobachteten Ergebnisses unterschiedliche Rahmen über den ganzen Parameter-Raum. Der Zähler dieses Verhältnisses ist weniger als der Nenner. Das Wahrscheinlichkeitsverhältnis ist folglich zwischen 0 und 1. Niedrigere Werte des Wahrscheinlichkeitsverhältnisses bedeuten, dass das beobachtete Ergebnis viel weniger wahrscheinlich war, um laut der ungültigen Hypothese verglichen mit der Alternative vorzukommen. Höhere Werte des Statistikbösartigen, dass das beobachtete Ergebnis mehr war als oder ebenso wahrscheinlich oder fast als, um wahrscheinlich laut der ungültigen Hypothese verglichen mit der Alternative und der ungültigen Hypothese vorzukommen, können nicht zurückgewiesen werden.

Vertrieb: Der Lehrsatz von Wilks

Wenn der Vertrieb des Wahrscheinlichkeitsverhältnisses entsprechend einer besonderen ungültigen und alternativen Hypothese dann ausführlich bestimmt werden kann, dass es direkt verwendet werden kann, um Entscheidungsgebiete zu bilden (um die ungültige Hypothese zu akzeptieren/zurückzuweisen). In den meisten Fällen, jedoch, ist der genaue Vertrieb des Wahrscheinlichkeitsverhältnisses entsprechend spezifischen Hypothesen sehr schwierig zu bestimmen. Ein günstiges Ergebnis, das Samuel S. Wilks zugeschrieben ist, sagt, dass weil sich die Beispielgröße nähert, wird der für ein verschachteltes Modell statistische Test mit Graden der Freiheit asymptotisch verteilt, die dem Unterschied in dimensionality gleich ist und. Das bedeutet, dass für eine große Vielfalt von Hypothesen ein Praktiker das Wahrscheinlichkeitsverhältnis für die Daten schätzen und mit dem chi quadratisch gemachten Wert entsprechend einer gewünschten statistischen Bedeutung als ein ungefährer statistischer Test vergleichen kann.

Beispiele

Münze, die rill

Ein Beispiel, im Fall vom Test von Pearson, könnten wir versuchen, zwei Münzen zu vergleichen, um zu bestimmen, ob sie dieselbe Wahrscheinlichkeit haben, Köpfe heraufzukommen. Unsere Beobachtung kann in eine Kontingenztabelle mit Reihen entsprechend der Münze und Säulen entsprechend Köpfen oder Schwänzen gestellt werden. Die Elemente der Kontingenztabelle werden die Zahl von Zeiten sein die Münze für diese Reihe ist Köpfe oder Schwänze heraufgekommen. Der Inhalt dieses Tisches ist unsere Beobachtung.

</tr>

</tr>

</tr>

</Tisch>

Hier besteht aus den Rahmen, und, die die Wahrscheinlichkeit sind, dass Münzen 1 und 2 Köpfe oder Schwänze heraufkommen. Der Hypothese-Raum wird durch die üblichen Einschränkungen auf einen Vertrieb definiert, und. Die ungültige Hypothese ist der Subraum wo. In allen diesen Einschränkungen, und.

Für die besten Werte für laut der Hypothese schreibend, wird maximale Wahrscheinlichkeit mit erreicht

:

Für die besten Werte für laut der ungültigen Hypothese schreibend, wird maximale Wahrscheinlichkeit mit erreicht

:

der von der Münze nicht abhängt.

Die Hypothese und ungültige Hypothese können ein bisschen umgeschrieben werden, so dass sie die Einschränkungen für den Logarithmus des Wahrscheinlichkeitsverhältnisses befriedigen, um den gewünschten netten Vertrieb zu haben. Da die Einschränkung das zweidimensionale veranlasst, auf das eindimensionale reduziert zu werden, wird der asymptotische Vertrieb für den Test, der Vertrieb mit einem Grad der Freiheit sein.

Für die allgemeine Kontingenztabelle können wir das Verhältnis der Klotz-Wahrscheinlichkeit statistisch als schreiben

:

Kritik

Kritiken von Bayesian von klassischen Wahrscheinlichkeitsverhältnis-Tests konzentrieren sich auf zwei Probleme:

  1. die Supremum-Funktion in der Berechnung des Wahrscheinlichkeitsverhältnisses, sagend, dass das keine Rechnung der Unklarheit über θ nimmt, und dass das Verwenden maximaler Wahrscheinlichkeitsschätzungen auf diese Weise komplizierte alternative Hypothesen mit einer übermäßigen Zahl von freien Rahmen fördern kann;
  2. die Prüfung der Wahrscheinlichkeit, dass die Probe ein Ergebnis als äußerst oder mehr äußerst laut der ungültigen Hypothese erzeugen würde, sagend, dass das den Test auf der Wahrscheinlichkeit von äußersten Ereignissen stützt, die nicht geschehen sind.

Stattdessen bringen sie Methoden wie Faktoren von Bayes vor, die ausführlich Unklarheit über die Rahmen in die Rechnung nehmen, und die auf den Beweisen basieren, die wirklich vorgekommen sind. Von einer Frequentist-Annäherung wird die Unklarheit über die Rahmen im Wahrscheinlichkeitsvertrieb des statistischen Tests in Betracht gezogen.

Links


Strohmann-Vorschlag / Wahrscheinlichkeit
Impressum & Datenschutz