Ungültige Hypothese

Die Praxis der Wissenschaft ist mit Formulierung und Prüfung von Hypothesen, Behauptungen verbunden, die dazu fähig sind, das falsche Verwenden eines Tests von beobachteten Daten bewiesen zu werden. Die ungültige Hypothese entspricht normalerweise einer allgemeinen Position oder Verzug-Position. Zum Beispiel könnte die ungültige Hypothese sein, dass es keine Beziehung zwischen zwei gemessenen Phänomenen gibt, oder dass eine potenzielle Behandlung keine Wirkung hat.

Der Begriff wurde vom englischen Genetiker und Statistiker Ronald Fisher 1935 ursprünglich ins Leben gerufen.

Es wird normalerweise mit einer zweiten Hypothese, der alternativen Hypothese paarweise angeordnet, die eine besondere Beziehung zwischen den Phänomenen behauptet. Jerzy Neyman und Egon Pearson haben den Begriff der Alternative formalisiert. Das alternative Bedürfnis nicht, die logische Ablehnung der ungültigen Hypothese sein; es sagt die Ergebnisse vom Experiment voraus, wenn die alternative Hypothese wahr ist. Der Gebrauch von alternativen Hypothesen war nicht ein Teil der Formulierung von Fisher, aber ist normal geworden.

Es ist wichtig zu verstehen, dass die ungültige Hypothese nie bewiesen werden kann. Eine Reihe von Daten kann nur eine ungültige Hypothese zurückweisen oder scheitern, sie zurückzuweisen. Zum Beispiel, wenn Vergleich von zwei Gruppen (z.B: Behandlung, keine Behandlung) offenbart keinen statistisch bedeutenden Unterschied zwischen den zwei, es bedeutet nicht, dass es keinen Unterschied in Wirklichkeit gibt. Es bedeutet nur, dass es nicht genug Beweise gibt, um die ungültige Hypothese zurückzuweisen (mit anderen Worten, scheitert das Experiment, die ungültige Hypothese zurückzuweisen).

Grundsatz

Hypothese, die Arbeiten durch das Sammeln von Daten und das Messen prüft, wie wahrscheinlich der besondere Satz von Daten ist, die ungültige Hypothese annehmend, ist wahr. Wenn die Datei sehr unwahrscheinlich, als das Gehören einer Reihe von Daten definiert ist, dass nur selten beobachtet wird (gewöhnlich in weniger entweder als 5 % der Zeit oder als 1 % der Zeit), weist der Experimentator die ungültige Hypothese zurück, die es schließt (wahrscheinlich) ist falsch. Wenn die Daten der ungültigen Hypothese nicht widersprechen, dann kann nur ein schwache Beschluss gemacht werden; nämlich dass die beobachtete Datei keine starken Beweise gegen die ungültige Hypothese zur Verfügung stellt. Da die ungültige Hypothese wahr oder in diesem Fall in einigen Zusammenhängen falsch sein konnte, wird das als das Meinen interpretiert, dass die Daten ungenügende Beweise geben, um jeden Beschluss zu machen, auf anderen bedeutet es, dass es keine Beweise gibt, um das Ändern von einem zurzeit nützlichen Regime bis ein verschiedenes zu unterstützen.

Zum Beispiel kann ein bestimmtes Rauschgift die Chance reduzieren, einen Herzanfall zu haben. Mögliche ungültige Hypothesen sind "dieses Rauschgift reduziert die Chancen nicht, einen Herzanfall zu haben", oder "dieses Rauschgift hat keine Wirkung auf die Chancen, einen Herzanfall zu haben". Der Test der Hypothese besteht daraus, das Rauschgift der Hälfte der Leute in einer Arbeitsgruppe als ein kontrolliertes Experiment zu verwalten. Wenn die Daten eine statistisch bedeutende Änderung in den Leuten zeigen, die das Rauschgift erhalten, wird die ungültige Hypothese zurückgewiesen.

Wahl von H

Die Wahl der ungültigen Hypothese (H) und Rücksicht von directionality (sieh "Ein-Schwanz-Test"), sind kritisch. Denken Sie die Frage dessen, ob eine geworfene Münze schön ist (d. h. dass durchschnittlich es landet, leitet 50 % der Zeit). Eine potenzielle ungültige Hypothese ist "diese Münze wird zu Köpfen" (Ein-Schwanz-Test) nicht beeinflusst. Das Experiment soll die Münze wiederholt werfen. Ein mögliches Ergebnis von 5 Werfen ist 5 Köpfe. Laut dieser ungültigen Hypothese werden die Daten unwahrscheinlich betrachtet (mit einer schönen Münze, die Wahrscheinlichkeit davon ist 3 %, und das Ergebnis würde noch unwahrscheinlicher sein, wenn die Münze zu Gunsten von Schwänzen beeinflusst würde). Die Daten widerlegen die ungültige Hypothese (dass die Münze entweder Messe oder beeinflusst zu Schwänzen ist) und der Beschluss darin besteht, dass die Münze zu Köpfen beeinflusst wird.

Wechselweise konnte die ungültige Hypothese, "ist diese Münze schön", dadurch untersucht werden, entweder auf zu viele Schwänze oder auf zu viele Köpfe aufzupassen, und so sind die Typen von Ergebnissen, die dazu neigen würden, dieser ungültigen Hypothese zu widersprechen, diejenigen, wo eine Vielzahl von Köpfen oder eine Vielzahl von Schwänzen beobachtet werden. So würde ein mögliches diagnostisches Ergebnis sein, dass das ganze Werfen dasselbe Ergebnis nachgibt, und die Wahrscheinlichkeit von 5 einer Art 6 % laut der ungültigen Hypothese ist. Das ist nicht statistisch bedeutend, die ungültige Hypothese in diesem Fall bewahrend.

Dieses Beispiel illustriert, dass der von einem statistischen Test gelangene Schluss von der genauen Formulierung der ungültigen und alternativen Hypothesen abhängen kann. Die Beispiel-Datei demonstriert den Punkt, aber ist wirklich zu klein, um jeden Beschluss zu unterstützen. Allgemein stellen weniger als 30 Proben jeden Beschluss gefährdet.

Das Beispiel illustriert auch eine Gefahr der Hypothese-Prüfung, diese der vielfachen Prüfung. In der Praxis wird das Verwenden eines einzelnen dataset, um eine Vielzahl von verschiedenen ungültigen Hypothesen zu bewerten oder zu prüfen, die tatsächlich wahr sind, zu falschen Beschlüssen führen, wenn passende Korrekturen zum Probeverfahren zum Beispiel mit der Korrektur von Bonferroni nicht ausgebessert werden. Das Steigern der Zahl von verschiedenen Tests, die auf einem einzelnen dataset gemacht sind, ohne für die Zahl von Tests verantwortlich zu sein, die führen werden, steigert die Zahl von diesen, die darauf hinweisen würden, dass die entsprechende ungültige Hypothese zurückgewiesen werden sollte. Diese Gefahr wird wichtig im Zusammenhang des Datenbergwerks. Dieses Thema wird häufig unter dem Kopfstück besprochen, "durch die Daten angedeutete Hypothesen zu prüfen".

Prüfung für Unterschiede

In der wissenschaftlichen und medizinischen Forschung spielen ungültige Hypothesen eine Hauptrolle in der Prüfung der Bedeutung von Unterschieden in der Behandlung und kontrollieren Gruppen. Dieser Gebrauch, während weit verbreitet, bietet mehreren Boden für die Kritik, einschließlich des Strohmannes, der Kritik von Bayesian und der Veröffentlichungsneigung an.

Die typische ungültige Hypothese am Anfang vom Experiment ist, dass kein Unterschied zwischen der Kontrolle und den experimentellen Gruppen (für die Variable besteht, die wird vergleicht). Andere Möglichkeiten schließen ein:

  • das schätzt in Proben von einer gegebenen Bevölkerung kann mit einer bestimmten Familie des statistischen Vertriebs modelliert werden.
  • dass die Veränderlichkeit von Daten in verschiedenen Gruppen dasselbe ist, obwohl sie um verschiedene Werte in den Mittelpunkt gestellt werden können.

Beispiel

In Anbetracht der Testhunderte von zwei zufälligen Proben von Männern und Frauen unterscheidet sich eine Gruppe vom anderen? Eine mögliche ungültige Hypothese ist, dass die männliche Mittelkerbe dasselbe als die weibliche Mittelkerbe ist:

: H: μ = μ\

wo:

: H = die ungültige Hypothese

: μ = die bösartige von der Bevölkerung 1, und

: μ = die bösartige von der Bevölkerung 2.

Eine stärkere ungültige Hypothese ist, dass die zwei Proben von derselben Bevölkerung gezogen, solch werden, dass die Abweichung und Gestalt des Vertriebs auch gleich sind.

Fachsprache

Viel von der im Zusammenhang mit ungültigen Hypothesen verwendeten Fachsprache ist auf die unmittelbare Beziehung zur statistischen Hypothese-Prüfung zurückzuführen; ein Teil dieser Fachsprache wird hier entworfen, aber sieh diese Liste von Definitionen für einen mehr ganzen Satz.

Einfache Hypothese: Jede Hypothese, die den Bevölkerungsvertrieb völlig angibt.

Zerlegbare Hypothese: Jede Hypothese, die den Bevölkerungsvertrieb völlig nicht angibt.

Eine Punkt-Hypothese ist mehr kompliziert, um zu beschreiben. Der Begriff entsteht in Zusammenhängen, wohin der Satz des ganzen möglichen Bevölkerungsvertriebs in der parametrischen Form gestellt wird. Eine Punkt-Hypothese ist diejenige, wo genaue Werte entweder für alle Rahmen oder für eine Teilmenge der Rahmen angegeben werden. Formell ist der Fall, wo nur eine Teilmenge von Rahmen definiert wird, noch eine zerlegbare Hypothese; dennoch wird die Begriff-Punkt-Hypothese häufig in solchen Fällen besonders angewandt, wo der Hypothese-Test auf solche Art und Weise strukturiert werden kann, dass der Vertrieb des Tests statistisch (der Vertrieb laut der ungültigen Hypothese) von den Rahmen nicht abhängt, deren Werte unter dem Punkt ungültige Hypothese nicht angegeben worden sind. Sorgfältige Behandlungen von Punkt-Hypothesen für Teilmengen von Rahmen betrachten sie wirklich als zerlegbare Hypothesen und studieren, wie sich der P-Wert für einen festen kritischen Wert des statistischen Tests mit den Rahmen ändert, die durch die ungültige Hypothese nicht angegeben werden.

Eine Ein-Schwanz-Hypothese ist eine Hypothese, in der der Wert eines Parameters angegeben wird als, auch zu sein:

  • über einem bestimmten Wert oder
  • unter einem bestimmten Wert.

Ein Beispiel einer ungültigen Ein-Schwanz-Hypothese würde sein, dass, in einem medizinischen Zusammenhang, eine vorhandene Behandlung, A, nicht schlechter ist als eine neue Behandlung, B. Die entsprechende alternative Hypothese würde sein, dass B besser ist als A. Hier, wenn die ungültige Hypothese akzeptiert würde (d. h. es keinen Grund gibt, die Hypothese zurückzuweisen, dass A mindestens so gut ist wie B), würde der Beschluss darin bestehen, dass Behandlung A fortsetzen sollte, verwendet zu werden. Wenn die ungültige Hypothese zurückgewiesen würde, würde das Ergebnis darin bestehen, dass Behandlung B verwendet in der Zukunft würde, vorausgesetzt, dass es Beweise gibt, dass es besser ist als A. Ein Hypothese-Test würde nach Beweisen suchen, dass B besser ist als A, nicht für Beweise, dass die Ergebnisse von Behandlungen A und B verschieden sind. Wie man sagt, gibt die Formulierung der Hypothese als "besser als" Vergleich die Hypothese directionality.

Directionality

Ganz häufig sind Behauptungen des Punkts ungültige Hypothesen scheinen, einen "directionality" nämlich nicht zu haben, der größer oder kleiner schätzt als ein Hypothese aufgestellter Wert, begrifflich identisch. Jedoch können ungültige Hypothesen und wirklich "Richtung" - in vielen Beispielen haben, statistische Theorie erlaubt der Formulierung des Testverfahrens, vereinfacht zu werden, so ist der Test zur Prüfung für eine genaue Identität gleichwertig. Zum Beispiel, wenn sie eine alternative Ein-Schwanz-Hypothese formulieren wird, wird die Anwendung des Rauschgifts A zu vergrößertem Wachstum in Patienten führen, dann ist die wahre ungültige Hypothese das Gegenteil der alternativen Hypothese, d. h. die Anwendung des Rauschgifts A wird zu vergrößertem Wachstum in Patienten (eine zerlegbare ungültige Hypothese) nicht führen. Die wirksame ungültige Hypothese wird Anwendung des Rauschgifts A sein wird keine Wirkung auf das Wachstum in Patienten (ein Punkt ungültige Hypothese) haben.

Um zu verstehen, warum die wirksame ungültige Hypothese gültig ist, ist es aufschlussreich, um die obengenannten Hypothesen zu denken. Die Alternative sagt voraus, dass ausgestellte Patienten vergrößertes Wachstum im Vergleich zur Kontrollgruppe erfahren. Das, ist

: H: μ> μ (wo μ = das Mittelwachstum der Patienten)

Die wahre ungültige Hypothese ist:

: H: μ  μ\

Die wirksame ungültige Hypothese ist:

: H: μ = μ\

Die Verminderung kommt vor, weil, um Unterstützung für die alternative, klassische Hypothese-Prüfung zu messen, das Rechnen verlangt, wie oft die Ergebnisse als oder mehr äußerst sein würden als die Beobachtungen. Das verlangt das Messen der Wahrscheinlichkeit, die ungültige Hypothese für jede Möglichkeit zurückzuweisen, die es, und zweit einschließt, um sicherzustellen, dass diese Wahrscheinlichkeiten aller weniger als oder gleich der angesetzten Signifikanzebene des Tests sind. Für angemessene Testverfahren das größte kommt solche Wahrscheinlichkeit an der Gebiet-Grenze H spezifisch für die Fälle vor, die in H nur eingeschlossen sind. So kann das Testverfahren definiert werden (der die kritischen Werte ist, kann definiert werden), für die ungültige Hypothese H genau zu prüfen, als ob die ungültige Hypothese von Interesse die reduzierte Version H war.

Fisher hat gesagt, "die ungültige Hypothese muss genau sein, der frei von der Zweideutigkeit und Zweideutigkeit ist, weil es die Basis des 'Problems des Vertriebs,' liefern muss, deren der Test der Bedeutung die Lösung ist", ein einschränkenderes Gebiet für H einbeziehend. Gemäß dieser Ansicht muss die ungültige Hypothese numerisch genau sein - es muss feststellen, dass eine besondere Menge oder Unterschied einer besonderen Zahl gleich sind. In der klassischen Wissenschaft ist es am meisten normalerweise die Behauptung, dass es keine Wirkung einer besonderen Behandlung gibt; in Beobachtungen ist es normalerweise, dass es keinen Unterschied zwischen dem Wert einer besonderen gemessenen Variable und dem einer Vorhersage gibt. Die Mehrheit von ungültigen Hypothesen entspricht in der Praxis diesem "Genauigkeits"-Kriterium nicht. Denken Sie zum Beispiel den üblichen Test, dass zwei Mittel gleich sind, wo die wahren Werte der Abweichungen unbekannt-genaue Werte der Abweichungen sind, werden nicht angegeben.

Die meisten Statistiker glauben, dass es gültig ist, um Richtung als ein Teil der ungültigen Hypothese, oder als ein Teil eines ungültigen Hypothese-Paares der Hypothese/Alternative festzusetzen. Jedoch sind die Ergebnisse nicht eine ausführliche Beschreibung aller Ergebnisse eines Experimentes, bloß eines einzelnen zu einem besonderem Zweck geschneiderten Ergebnisses. Denken Sie zum Beispiel einen H, der behauptet, dass die für einen neuen treatmemnt bösartige Bevölkerung eine Verbesserung auf einer festen Behandlung mit der Bevölkerung (bekannt von der langen Erfahrung) mit der Ein-Schwanz-Alternative ist, die dass die neue Behandlung ist. Wenn die durch die X-Bar erhaltenen Beispielbeweise −200 gleich sind und der entsprechende statistische T-Test −50 gleich ist, würde der Beschluss vom Test darin bestehen, dass es keine Beweise gibt, dass der neue treatmnent besser ist als der vorhandene: Es würde nicht berichten, dass es deutlich schlechter ist, aber das ist nicht, wonach dieser besondere Test sucht. Um jede mögliche Zweideutigkeit im Melden des Ergebnisses des Tests einer ungültigen Hypothese zu überwinden, ist es am besten anzuzeigen, ob der Test zweiseitig war und, wenn einseitig, um die Richtung der Wirkung einzuschließen, die wird prüft.

Die statistische Theorie, die erforderlich ist, sich mit den einfachen Fällen von directionality zu befassen, befasst hier, und mehr komplizierte, macht vom Konzept eines unvoreingenommenen Tests Gebrauch.

Beispielgröße

Statistische Hypothese-Prüfung ist mit dem Durchführen desselben Experimentes auf vielfachen Themen verbunden. Die Zahl von Themen ist als die Beispielgröße bekannt. Die Eigenschaften des Verfahrens hängen von der Beispielgröße ab. Selbst wenn eine ungültige Hypothese für die Bevölkerung nicht hält, kann eine ungenügende Beispielgröße seine Verwerfung verhindern. Wenn Beispielgröße unter einer Kontrolle eines Forschers ist, hängt eine gute Wahl von der statistischen Macht des Tests, die Wirkungsgröße ab, die der Test offenbaren muss und die gewünschte Signifikanzebene. Die Signifikanzebene ist die Wahrscheinlichkeit, die ungültige Hypothese zurückzuweisen, wenn die ungültige Hypothese in der Bevölkerung hält. Die statistische Macht ist die Wahrscheinlichkeit, die ungültige Hypothese zurückzuweisen, wenn es in der Bevölkerung (d. h., für eine besondere Wirkungsgröße) nicht hält.

Siehe auch

Weiterführende Literatur

.

Links


Taschenveto / Heute (NBC Programm)
Impressum & Datenschutz