Rand des Fehlers

Der Rand des Fehlers ist ein Statistikausdrücken des Betrags des zufälligen Stichprobenfehlers in Ergebnissen eines Überblicks. Je größer der Rand des Fehlers, desto weniger Glaube man das die berichteten Ergebnisse der Wahl haben sollte, den "wahren" Zahlen nah ist; d. h. die Zahlen für die ganze Bevölkerung. Der Rand des Fehlers kommt vor, wann auch immer eine Bevölkerung unvollständig probiert wird.

Erklärung

Der Rand des Fehlers wird gewöhnlich als der "Radius" (oder Hälfte der Breite) von einem Vertrauensintervall für eine aus einem Überblick statistische Einzelheit definiert. Ein Beispiel ist das Prozent von Leuten, die Produkt gegen das Produkt B bevorzugen. Wenn ein einzelner, globaler Rand des Fehlers wegen eines Überblicks berichtet wird, bezieht es sich auf den maximalen Rand des Fehlers für alle berichteten Prozentsätze mit der vollen Probe aus dem Überblick. Wenn das statistische ein Prozentsatz ist, kann dieser maximale Rand des Fehlers als der Radius des Vertrauensintervalls für einen berichteten Prozentsatz von 50 % berechnet werden.

Der Rand des Fehlers ist als eine "absolute" Menge beschrieben, zu einem Vertrauensintervall-Radius für das statistische gleich worden. Zum Beispiel, wenn der wahre Wert 50 Prozentpunkte ist, und das statistische einen Vertrauensintervall-Radius von 5 Prozentpunkten hat, dann sagen wir, dass der Rand des Fehlers 5 Prozentpunkte ist. Als ein anderes Beispiel, wenn der wahre Wert 50 Menschen ist, und hat das statistische einen Vertrauensintervall-Radius von 5 Menschen, dann könnten wir sagen, dass der Rand des Fehlers 5 Menschen ist.

In einigen Fällen wird der Rand des Fehlers als eine "absolute" Menge nicht ausgedrückt; eher wird es als eine "Verhältnis"-Menge ausgedrückt. Nehmen Sie zum Beispiel an, dass der wahre Wert 50 Menschen ist, und das statistische einen Vertrauensintervall-Radius von 5 Menschen hat. Wenn wir die "absolute" Definition verwenden, würde der Rand des Fehlers 5 Menschen sein. Wenn wir die "Verhältnis"-Definition verwenden, dann drücken wir diesen absoluten Rand des Fehlers als ein Prozent des wahren Werts aus. Also in diesem Fall ist der absolute Rand des Fehlers 5 Menschen, aber der "Prozent" Verhältnisrand des Fehlers ist 10 % (weil 5 Menschen zehn Prozent von 50 Menschen sind). Häufig, jedoch die Unterscheidung wird noch gewöhnlich nicht ausführlich gemacht, ist aus dem Zusammenhang offenbar.

Wie Vertrauensintervalle kann der Rand des Fehlers für jedes gewünschte Vertrauensniveau definiert werden, aber gewöhnlich ein Niveau von 90 %, 95 % oder 99 % werden (normalerweise 95 %) gewählt. Dieses Niveau ist die Wahrscheinlichkeit, dass ein Rand des Fehlers um den berichteten Prozentsatz den "wahren" Prozentsatz einschließen würde. Zusammen mit dem Vertrauensniveau bestimmen das Beispieldesign für einen Überblick, und insbesondere seine Beispielgröße, den Umfang des Randes des Fehlers. Eine größere Beispielgröße erzeugt einen kleineren Rand des Fehlers, alle sonst restlich gleich.

Wenn die genauen Vertrauensintervalle verwendet werden, dann zieht der Rand des Fehlers sowohl Stichprobenfehler als auch Nichtstichprobenfehler in Betracht. Wenn ein ungefähres Vertrauensintervall verwendet wird (zum Beispiel, durch das Annehmen, dass der Vertrieb normal und dann das Vertrauensintervall entsprechend modellierend ist), dann kann der Rand des Fehlers nur zufälligen Stichprobenfehler in Betracht ziehen. Es vertritt andere potenzielle Quellen des Fehlers oder der Neigung wie ein nichtvertretendes Beispieldesign, schlecht ausgedrückte Fragen, Leute nicht, die lügen oder sich weigern, der Ausschluss von Leuten zu antworten, mit denen, oder miscounts und Verkalkulationen nicht in Verbindung gesetzt werden konnte.

Konzept

Ein Beispiel von 2004 amerikanische Präsidentenkampagne wird verwendet, um Konzepte überall in diesem Artikel zu illustrieren. Gemäß einem Überblick am 2. Oktober 2004 durch das Newsweek würden 47 % von eingetragenen Stimmberechtigten für John Kerry/John zu Edwards wählen, wenn die Wahl an diesem Tag gehalten würde, würden 45 % für George W. Bush / Detektiv zu Cheney wählen, und 2 % würden für Ralph Nader/Peter Camejo wählen. Die Größe der Probe war 1,013. Wenn sonst nicht festgesetzt, verwendet der Rest dieses Artikels ein 95-%-Niveau des Vertrauens.

Grundlegendes Konzept

Wahlen sind normalerweise mit Einnahme einer Probe von einer bestimmten Bevölkerung verbunden. Im Fall von der Newsweek-Wahl ist die Bevölkerung von Interesse die Bevölkerung von Leuten, die stimmen werden. Weil es unpraktisch ist, um jeden zu befragen, der stimmen wird, nehmen Meinungsforscher kleinere Proben, die beabsichtigt sind, um, d. h. eine zufällige Probe der Bevölkerung vertretend zu sein. Es ist möglich, dass Meinungsforscher-Probe 1,013 Stimmberechtigte, die zufällig für Bush stimmen, wenn tatsächlich die Bevölkerung zwischen Bush und Kerry gleichmäßig gespalten wird, aber das ist sehr unwahrscheinlich (p = 2  1.1 × 10) vorausgesetzt, dass die Probe zufällig ist.

Stichprobenerhebung der Theorie stellt Methoden zur Verfügung, für die Wahrscheinlichkeit zu berechnen, dass sich die Wahlergebnisse von der Wirklichkeit durch mehr als einen bestimmten Betrag einfach wegen der Chance unterscheiden; zum Beispiel, dass die Wahl 47 % wegen Kerrys meldet, aber seine Unterstützung ist wirklich nicht weniger als 50 %, oder ist wirklich mindestens 44 %. Diese Theorie und einige Annahmen von Bayesian weisen darauf hin, dass der "wahre" Prozentsatz wahrscheinlich ziemlich 47 % nah sein wird. Je mehr Menschen, die probiert werden, desto überzeugtere Meinungsforscher sein können, dass der "wahre" Prozentsatz dem beobachteten Prozentsatz nah ist. Der Rand des Fehlers ist ein Maß dessen, wie nahe die Ergebnisse wahrscheinlich sein werden.

Jedoch ist der Rand des Fehlers nur für zufälligen Stichprobenfehler verantwortlich, so ist es zu systematischen Fehlern blind, die durch die Nichtantwort oder durch Wechselwirkungen zwischen dem Überblick und dem Gedächtnis von Themen, der Motivation, der Kommunikation und den Kenntnissen eingeführt werden können.

Berechnungen, die zufällige Stichprobenerhebung annehmen

Diese Abteilung wird den Standardfehler eines Prozentsatzes, des entsprechenden Vertrauensintervalls kurz besprechen, und diese zwei Konzepte mit dem Rand des Fehlers verbinden. Für die Einfachheit nehmen die Berechnungen hier an, dass die Wahl auf einer einfachen zufälligen Probe von einer großen Bevölkerung basiert hat.

Der Standardfehler eines berichteten Verhältnisses oder Prozentsatzes p misst seine Genauigkeit, und ist die geschätzte Standardabweichung dieses Prozentsatzes. Es kann von gerade p und die Beispielgröße, n geschätzt werden, wenn n hinsichtlich der Bevölkerungsgröße mit der folgenden Formel klein ist:

:

Wenn die Probe nicht ist, muss eine einfache zufällige Probe von einer großen Bevölkerung, dem Standardfehler und dem Vertrauensintervall durch fortgeschrittenere Berechnungen geschätzt werden. Linearization und Wiederstichprobenerhebung sind weit verwendete Techniken für Daten von komplizierten Beispieldesigns.

Bemerken Sie, dass es nicht notwendigerweise eine strenge Verbindung zwischen dem wahren Vertrauensintervall und dem wahren Standardfehler gibt. Das wahre p Prozent-Vertrauensintervall ist der Zwischenraum [a, b], der p Prozent des Vertriebs, und wo enthält (100 − p) liegt das/2-Prozent des Vertriebs unter a, und (100 − p) liegt das/2-Prozent des Vertriebs über b. Der wahre Standardfehler des statistischen ist die Quadratwurzel der wahren ausfallenden Abweichung des statistischen. Diese zwei können direkt nicht verbunden sein, obwohl im Allgemeinen für den großen Vertrieb, der wie normale Kurven aussieht, es eine direkte Beziehung gibt.

In der Newsweek-Wahl, dem Niveau von Kerry der Unterstützung p = 0.47 und n = 1,013. Der Standardfehler (.016 oder 1.6 %) hilft, einen Sinn der Genauigkeit des geschätzten Prozentsatzes von Kerry (47 %) zu geben. Eine Bayesian Interpretation des Standardfehlers ist, dass, obwohl wir den "wahren" Prozentsatz nicht wissen, er hoch wahrscheinlich innerhalb von zwei Standardfehlern des geschätzten Prozentsatzes (47 %) gelegen wird. Der Standardfehler kann verwendet werden, um ein Vertrauensintervall zu schaffen, innerhalb dessen der "wahre" Prozentsatz zu einem bestimmten Niveau des Vertrauens sein sollte.

Der geschätzte Prozentsatz plus oder minus sein Rand des Fehlers ist ein Vertrauensintervall für den Prozentsatz. Mit anderen Worten ist der Rand des Fehlers Hälfte der Breite des Vertrauensintervalls. Es kann als ein Vielfache des Standardfehlers mit dem Faktor berechnet werden, der vom Niveau des gewünschten Vertrauens abhängt; ein Rand eines Standardfehlers gibt ein 68-%-Vertrauensintervall, während die Schätzung plus oder minus 1.96 Standardfehler ein 95-%-Vertrauensintervall ist, und ein 99-%-Vertrauensintervall 2.58 Standardfehler auf beiden Seiten der Schätzung führt.

Definition

Der Rand des Fehlers für eine Einzelheit statistisch von Interesse wird gewöhnlich als der Radius (oder Hälfte der Breite) vom Vertrauensintervall dafür statistisch definiert. Der Begriff kann auch gebraucht werden, um Stichprobenfehler im Allgemeinen zu bedeuten. In Mediaberichten von Wahlergebnissen bezieht sich der Begriff gewöhnlich auf den maximalen Rand des Fehlers für jeden Prozentsatz von dieser Wahl.

Verschiedene Vertrauensniveaus

Für eine einfache zufällige Probe von einer großen Bevölkerung ist der maximale Rand des Fehlers ein einfacher Wiederausdruck der Beispielgröße n. Die Zähler dieser Gleichungen werden zu zwei dezimalen Plätzen rund gemacht.

:Margin des Fehlers an 99-%-Vertrauen

:Margin des Fehlers an 95-%-Vertrauen

:Margin des Fehlers an 90-%-Vertrauen

Wenn ein Artikel über eine Wahl den Rand des Fehlers nicht meldet, aber wirklich feststellt, dass eine einfache zufällige Probe einer bestimmten Größe verwendet wurde, kann der Rand des Fehlers für einen gewünschten Grad des Vertrauens mit einer der obengenannten Formeln berechnet werden. Außerdem, wenn der 95-%-Rand des Fehlers gegeben wird, kann man den 99-%-Rand des Fehlers finden, indem man den berichteten Rand des Fehlers durch ungefähr 30 % vergrößert.

Als ein Beispiel des obengenannten wird eine zufällige Probe der Größe 400 einen Rand des Fehlers, an einem 95-%-Vertrauensniveau, von 0.98/20 oder 0.049 - gerade weniger als 5 % geben. Eine zufällige Probe der Größe 1600 wird einen Rand des Fehlers von 0.98/40, oder 0.0245 - gerade weniger als 2.5 % geben. Eine zufällige Probe der Größe 10 000 wird einen Rand des Fehlers am 95-%-Vertrauensniveau von 0.98/100, oder 0.0098 - gerade weniger als 1 % geben.

Maximale und spezifische Ränder des Fehlers

Während der Rand des Fehlers normalerweise in den Medien berichtet hat, ist eine weite Wahl Zahl, die die maximale ausfallende Schwankung jedes Prozentsatzes widerspiegelt, der auf allen Befragten von dieser Wahl gestützt ist, bezieht sich der Begriff Rand des Fehlers auch auf den Radius des Vertrauensintervalls für eine statistische Einzelheit.

Der Rand des Fehlers für einen besonderen individuellen Prozentsatz wird gewöhnlich kleiner sein als der maximale Rand des für den Überblick angesetzten Fehlers. Dieses Maximum gilt nur, wenn der beobachtete Prozentsatz 50 % ist, und der Rand des Fehlers zurückweicht, weil sich der Prozentsatz den Extremen von 0 % oder 100 % nähert.

Mit anderen Worten ist der maximale Rand des Fehlers der Radius eines 95-%-Vertrauensintervalls für einen berichteten Prozentsatz von 50 %. Wenn p von 50 % abrückt, wird das Vertrauensintervall für p kürzer sein. So vertritt der maximale Rand des Fehlers einen zur Unklarheit gebundenen oberen; man ist um mindestens 95 % sicher, dass der "wahre" Prozentsatz innerhalb des maximalen Randes des Fehlers eines berichteten Prozentsatzes für jeden berichteten Prozentsatz ist.

Wirkung der Bevölkerungsgröße

Die Formeln oben für den Rand des Fehlers nehmen an, dass es eine ungeheuer große Bevölkerung gibt und hängen Sie so von der Größe der Bevölkerung von Interesse nicht ab. Gemäß der ausfallenden Theorie ist diese Annahme angemessen, wenn der ausfallende Bruchteil klein ist. Der Rand des Fehlers für eine besondere ausfallende Methode ist im Wesentlichen dasselbe unabhängig davon, ob die Bevölkerung von Interesse die Größe einer Schule, Stadt, Staates oder Landes ist, so lange der ausfallende Bruchteil weniger als 5 % ist.

In Fällen, wo der ausfallende Bruchteil um 5 % zu weit geht, können Analytiker den Rand des Fehlers mit einer "begrenzten Bevölkerungskorrektur", (FPC) anpassen, um für die zusätzliche gewonnene Präzision verantwortlich zu sein, indem sie in der Nähe von einem größeren Prozentsatz der Bevölkerung ausfallen. FPC kann mit der Formel berechnet werden:

:

Sich für einen großen ausfallenden Bruchteil, der fpc factored in die Berechnung des Randes des Fehlers anzupassen, der die Wirkung hat, den Rand des Fehlers einzuengen. Es meint, dass sich der fpc Null nähert, wie sich die Beispielgröße (n) der Bevölkerungsgröße (N) nähert, der die Wirkung hat, den Rand des Fehlers völlig zu beseitigen. Das hat intuitiven Sinn, weil, wenn N = n, die Probe eine Volkszählung und Stichprobenfehler wird, strittig wird.

Analytiker sollten aufmerksam sein, dass die Proben aufrichtig zufällig bleiben, als der ausfallende Bruchteil, damit wächst, Neigung probierend, eingeführt werden.

Andere Statistik

Vertrauensintervalle können berechnet werden, und auch können Ränder des Fehlers, für eine Reihe der Statistik einschließlich individueller Prozentsätze, Unterschiede zwischen Prozentsätzen, Mitteln, Mittellinien und Summen.

Der Rand des Fehlers für den Unterschied zwischen zwei Prozentsätzen ist größer als die Ränder des Fehlers für jeden dieser Prozentsätze, und kann sogar größer sein als der maximale Rand des Fehlers für jeden individuellen Prozentsatz aus dem Überblick.

Das Vergleichen von Prozentsätzen

In einem Mehrzahl-Wahlsystem, wo der Sieger der Kandidat mit den meisten Stimmen ist, ist es wichtig zu wissen, wer vorn ist. Die Begriffe "statistisches Band" und "statistisches totes Rennen" werden manchmal gebraucht, um berichtete Prozentsätze zu beschreiben, die sich durch weniger als einen Rand des Fehlers unterscheiden, aber diese Begriffe können irreführend sein. Erstens einmal ist der Rand des Fehlers, wie allgemein berechnet, auf einen individuellen Prozentsatz und nicht den Unterschied zwischen Prozentsätzen anwendbar, so kann der Unterschied zwischen Zwei-Prozentsatz-Schätzungen nicht statistisch bedeutend sein, selbst wenn sie sich durch mehr unterscheiden als der berichtete Rand des Fehlers. Die Überblick-Ergebnisse geben auch häufig starke Auskunft, selbst wenn es nicht einen statistisch bedeutenden Unterschied gibt.

Wenn

man Prozentsätze vergleicht, kann es entsprechend nützlich sein, die Wahrscheinlichkeit zu denken, dass ein Prozentsatz höher ist als ein anderer. In einfachen Situationen kann diese Wahrscheinlichkeit mit 1) der Standardfehler-Berechnung eingeführt früher, 2) die Formel für die Abweichung des Unterschieds von zwei zufälligen Variablen, und 3) eine Annahme abgeleitet werden, dass, wenn irgendjemand Kerry nicht wählt, sie Bush, und umgekehrt wählen werden; sie werden vollkommen negativ aufeinander bezogen. Das kann keine haltbare Annahme sein, wenn es mehr als zwei mögliche Wahlantworten gibt. Für kompliziertere Überblick-Designs müssen verschiedene Formeln, für den Standardfehler des Unterschieds zu berechnen, verwendet werden.

Der Standardfehler des Unterschieds von Prozentsätzen p für Kerry und q für Bush, annehmend, dass sie vollkommen negativ aufeinander bezogen werden, folgt:

:

In Anbetracht des beobachteten Prozentsatz-Unterschieds p − q (2 % oder 0.02) und der Standardfehler des Unterschieds, der oben (.03) berechnet ist, jede statistische Rechenmaschine kann verwendet werden, um die Wahrscheinlichkeit zu berechnen, dass eine Probe von einer Normalverteilung mit bösartigen 0.02 und Standardabweichung 0.03 größer ist als 0.

Zeichen

Siehe auch

  • Vertrauensintervall
  • Techniktoleranz
  • Schlüsselrelevanz
  • Sudman, Seymour und Bradburn, Normanne (1982). Das Stellen von Fragen: Ein Praktisches Handbuch zum Fragebogen-Design. San Francisco: Jossey Bass. Internationale Standardbuchnummer 0-87589-546-8

Außenverbindungen


Mudpot / Computermathematik
Impressum & Datenschutz