Binomischer Vertrieb

In der Wahrscheinlichkeitstheorie und Statistik ist der binomische Vertrieb der getrennte Wahrscheinlichkeitsvertrieb der Zahl von Erfolgen in einer Folge des n Unabhängigen ja/no Experimente, von denen jedes Erfolg mit der Wahrscheinlichkeit p nachgibt. Solch ein Experiment des Erfolgs/Misserfolgs wird auch ein Experiment von Bernoulli oder Probe von Bernoulli genannt; wenn n = 1, der binomische Vertrieb ein Vertrieb von Bernoulli ist. Der binomische Vertrieb ist die Basis für den populären binomischen Test der statistischen Bedeutung.

Der binomische Vertrieb wird oft verwendet, um die Zahl von Erfolgen in einer Probe der Größe n gezogen mit dem Ersatz von einer Bevölkerung der Größe N zu modellieren. Wenn die Stichprobenerhebung ohne Ersatz ausgeführt wird, sind die Attraktionen ziemlich abhängig, und so ist der resultierende Vertrieb ein hypergeometrischer Vertrieb, nicht ein binomischer. Jedoch, für den N, der viel größer ist als n, ist der binomische Vertrieb eine gute Annäherung, und weit verwendet.

Spezifizierung

Wahrscheinlichkeitsmassenfunktion

Im Allgemeinen, wenn die zufällige Variable K dem binomischen Vertrieb mit Rahmen n und p folgt, schreiben wir K ~ B (n, p). Die Wahrscheinlichkeit des Bekommens genau k Erfolge in n Proben wird durch die Wahrscheinlichkeitsmassenfunktion gegeben:

:

für k = 0, 1, 2..., n, wo

:

ist der binomische Koeffizient (folglich der Name des Vertriebs) "n wählen k" hat auch C (n, k), C, oder C angezeigt. Die Formel kann wie folgt verstanden werden: Wir wollen k Erfolge (p) und n  k Misserfolge (1  p). Jedoch können die k Erfolge überall unter den n Proben vorkommen, und es gibt C (n, k) verschiedene Weisen, k Erfolge in einer Folge von n Proben zu verteilen.

Im Schaffen von Referenztabellen für die binomische Vertriebswahrscheinlichkeit gewöhnlich wird der Tisch bis zu N/2-Werten ausgefüllt. Das ist, weil für k> n/2 die Wahrscheinlichkeit durch seine Ergänzung als berechnet werden kann

:

Auf den Ausdruck-ƒ (k, n, p) als eine Funktion von k schauend, gibt es einen K-Wert, der es maximiert. Dieser K-Wert kann durch das Rechnen gefunden werden

:

und es mit 1 vergleichend. Es gibt immer eine ganze Zahl M, die befriedigt

:

ƒ (k, n, p) ist Eintönigkeit, die für k zunimmt

Kumulative Vertriebsfunktion

Die kumulative Vertriebsfunktion kann als ausgedrückt werden:

:

wo der "Fußboden" unter x, d. h. die größte ganze Zahl weniger ist als oder gleich x.

Es kann auch in Bezug auf die normalisierte unvollständige Beta-Funktion wie folgt vertreten werden:

:\begin {richten }\aus

F (k; n, p) & = \Pr (X \le k) = I_ {1-p} (n-k, k+1) \\

& = (n-k) {n \choose k} \int_0^ {1-p} T^ {n-k-1} (1-t) ^k \, dt.

\end {richten }\aus</Mathematik>

Für k  np können obere Grenzen für den niedrigeren Schwanz der Vertriebsfunktion abgeleitet werden. Insbesondere die Ungleichheit von Hoeffding gibt den bestimmten nach

:

und die Ungleichheit von Chernoff kann verwendet werden, um den bestimmten abzuleiten

:

Außerdem sind diese Grenzen vernünftig dicht, wenn p = 1/2 da der folgende Ausdruck für den ganzen k  3n/8 hält

:

Bösartig und Abweichung

Wenn X ~ B (n, p) (d. h. X ist eine binomisch verteilte zufällige Variable), dann ist der erwartete Wert von X

:

\operatorname {E} [X] = np

</Mathematik>

und die Abweichung ist

:

\operatorname {Var} [X] = np (1 - p).

</Mathematik>

Diese Tatsache wird wie folgt leicht bewiesen. Nehmen Sie zuerst an, dass wir eine einzelne Probe von Bernoulli haben. Es gibt zwei mögliche Ergebnisse: 1 und 0, das erste Auftreten mit der Wahrscheinlichkeit p und der zweiten habenden Wahrscheinlichkeit 1  p. Der erwartete Wert in dieser Probe wird dem gleich sein. Die Abweichung in dieser Probe wird ähnlich berechnet:.

Der allgemeine binomische Vertrieb ist eine Summe von n unabhängigen Proben von Bernoulli. Das bösartige und die Abweichung solchen Vertriebs sind den Summen der Mittel und Abweichungen jeder individuellen Probe gleich:

:

\mu_n = \sum_ {k=1} ^n \mu = np, \qquad

\sigma^2_n = \sum_ {k=1} ^n \sigma^2 = np (1 - p).

</Mathematik>

Weise und Mittellinie

Gewöhnlich die Weise eines Binoms B (n, p) ist Vertrieb dem gleich, wo die Fußboden-Funktion ist. Jedoch, wenn (n + 1) p eine ganze Zahl ist und p weder 0 noch 1 ist, dann hat der Vertrieb zwei Weisen: (n + 1) p und (n + 1) p  1. Wenn p 0 oder 1 gleich ist, wird die Weise 0 und n entsprechend sein. Diese Fälle können wie folgt zusammengefasst werden:

:

\text {Weise} =

\begin {Fälle }\

\lfloor (n+1) \, p\rfloor & \text {wenn} (n+1) p\text {0 oder eine nichtganze Zahl}, \\ist

(n+1) \, p\\text {und }\\(n+1) \, p - 1 &\\Text {wenn} (n+1) p\in\{1, \dots, n\}, \\

n & \text {wenn} (n+1) p = n + 1.

\end {Fälle }\

</Mathematik>

Im Allgemeinen gibt es keine einzelne Formel, um die Mittellinie für einen binomischen Vertrieb zu finden, und es kann sogar nichteinzigartig sein. Jedoch sind mehrere spezielle Ergebnisse gegründet worden:

  • Wenn np eine ganze Zahl ist, dann fallen das bösartige, mittlere, und Weise zusammen und gleicher np.
  • Jede MittelM muss innerhalb des Zwischenraums np   M  np  liegen.
  • Eine MittelM kann zu weit weg vom bösartigen nicht liegen:}.
  • Die Mittellinie ist einzigartig und der M = herum (np) in Fällen gleich, wenn entweder oder oder M  np  Minute {p, 1  p} (abgesehen vom Fall, wenn p = ½ und n seltsam ist).
  • Wenn p = 1/2 und n, jede Zahl seltsam ist, ist die M im Zwischenraum ½ (n  1)  M  ½ (n + 1) eine Mittellinie des binomischen Vertriebs. Wenn p = 1/2 und n sogar ist, dann ist M = n/2 die einzigartige Mittellinie.

Kovarianz zwischen zwei Binomen

Wenn zwei binomisch verteilte zufällige Variablen X und Y zusammen beobachtet werden, einschätzend, dass ihre Kovarianz nützlich sein kann. Mit der Definition der Kovarianz im Fall n = 1 (so Proben von Bernoulli zu sein), haben wir

:

Der erste Begriff ist Nichtnull nur, wenn sowohl X als auch Y ein sind, und μ und μ den zwei Wahrscheinlichkeiten gleich sind. p als die Wahrscheinlichkeit von beidem Ereignis zur gleichen Zeit definierend, gibt das

:

und für n solche Proben wieder wegen der Unabhängigkeit

:

Wenn X und Y dieselbe Variable sind, nimmt das zur Abweichungsformel ab, die oben gegeben ist.

Beziehung zu anderem Vertrieb

Summen von Binomen

Wenn X ~ B (n, p) und Y ~ B (M, p) unabhängige binomische Variablen mit derselben Wahrscheinlichkeit p sind, dann X + ist Y wieder eine binomische Variable; sein Vertrieb ist

:

Bedingte Binome

Wenn X ~ B (n, p) und, bedingt durch X, Y ~ B (X, q), dann ist Y eine einfache binomische Variable mit dem Vertrieb

:

Vertrieb von Bernoulli

Der Vertrieb von Bernoulli ist ein spezieller Fall des binomischen Vertriebs, wo n = 1. Symbolisch, X ~ B (1, p) hat dieselbe Bedeutung wie das X ~ Bern (p). Umgekehrt, jeder binomische Vertrieb, B (n, p), ist die Summe von n unabhängigen Proben von Bernoulli, Bern (p), jeder mit derselben Wahrscheinlichkeit p.

Binom-Vertrieb von Poisson

Der binomische Vertrieb ist ein spezieller Fall des Binom-Vertriebs von Poisson, der eine Summe von n unabhängigen nichtidentischen Proben von Bernoulli Bern (p) ist. Wenn X den Binom-Vertrieb von Poisson mit p = … = p =p dann X ~ B (n, p) hat.

Normale Annäherung

Wenn n groß genug ist, dann ist das Verdrehen des Vertriebs nicht zu groß. In diesem Fall, wenn eine passende Kontinuitätskorrektur verwendet wird, dann wird eine ausgezeichnete Annäherung an B (n, p) durch die Normalverteilung gegeben

:

Die Annäherung verbessert sich allgemein als n Zunahmen (mindestens 20) und ist besser, wenn p nicht in der Nähe von 0 oder 1 ist. Verschiedene Faustregeln können verwendet werden, um zu entscheiden, ob n groß genug ist, und p von den Extremen der Null oder ein weit genug ist:

  • Eine Regel besteht darin, dass sowohl x=np als auch n (1  p) größer sein müssen als 5. Jedoch ändert sich die spezifische Zahl von der Quelle zur Quelle und hängt ab, wie gut eine Annäherung man will; einige Quellen geben 10, der eigentlich dieselben Ergebnisse wie die folgende Regel für großen n gibt, bis n sehr groß ist (ab: x=11, n=7752).
  • Diese Regel besteht darin, der für die normale Annäherung wenn entsprechend
ist

::

  • Eine andere allgemein verwendete Regel meint, dass die normale Annäherung nur passend ist, wenn alles innerhalb von 3 Standardabweichungen seines bösartigen innerhalb der Reihe von möglichen Werten ist, ist dieser wenn

::

  • Auch da sich die Annäherung allgemein verbessert, kann es gezeigt werden, dass die Beugungspunkte an vorkommen
::

Der folgende ist ein Beispiel, eine Kontinuitätskorrektur anzuwenden: Nehmen Sie An, dass man Pr berechnen möchte (X  8) für eine binomische zufällige Variable X. Wenn Y einen Vertrieb durch die normale Annäherung geben ließ, dann Pr (X  8) wird von Pr (Y  8.5) näher gekommen. Die Hinzufügung von 0.5 ist die Kontinuitätskorrektur; die unkorrigierte normale Annäherung gibt beträchtlich weniger genaue Ergebnisse.

Diese Annäherung, die als Lehrsatz von de Moivre-Laplace bekannt ist, ist ein riesiger zeitsparender (genaue Berechnungen mit großem n sind sehr lästig); historisch war es der erste Gebrauch der Normalverteilung, die im Buch von Abraham de Moivre Die Doktrin von Chancen 1738 eingeführt ist. Heutzutage kann es demzufolge des Hauptgrenzwertsatzes gesehen werden, da B (n, p) eine Summe des n Unabhängigen, der identisch verteilten Variablen von Bernoulli mit dem Parameter p ist. Diese Tatsache ist die Basis eines Hypothese-Tests, eines "Verhältnis-Z-Tests," für den Wert von p, der x/n, dem Beispielverhältnis und Vorkalkulatoren von p in einem allgemeinen statistischen Test verwendet.

Nehmen Sie Sie zum Beispiel n zufällig Beispielleute aus einer großen Bevölkerung an und fragen Sie sie, ob sie mit einer bestimmten Behauptung übereinstimmen. Das Verhältnis von Leuten, die zustimmen, wird natürlich von der Probe abhängen. Wenn Sie Gruppen von n Leuten wiederholt und aufrichtig zufällig probieren würden, würden die Verhältnisse einer ungefähren Normalverteilung mit dem bösartigen folgen, der dem wahren Verhältnis p der Abmachung in der Bevölkerung und mit der Standardabweichung σ = (p (1  p)/n) gleich ist. Große Beispielgrößen n sind gut, weil die Standardabweichung, als ein Verhältnis des erwarteten Werts, kleiner wird, der eine genauere Schätzung des unbekannten Parameters p erlaubt.

Annäherung von Poisson

Der binomische Vertrieb läuft zum Vertrieb von Poisson zusammen, als die Zahl von Proben zur Unendlichkeit geht, während das Produkt np fest bleibt. Deshalb kann der Vertrieb von Poisson mit dem Parameter λ = np als eine Annäherung an B (n, p) des binomischen Vertriebs verwendet werden, wenn n genug groß ist und p genug klein ist. Gemäß zwei Faustregeln ist diese Annäherung wenn n  20 und p  0.05, oder wenn n  100 und np  10 gut.

Grenzen

  • Grenzwertsatz von Poisson: Da sich n  nähert und sich p 0 nähert, während np fest an λ> 0 bleibt oder mindestens sich np λ> 0, dann das Binom nähert (n, p), nähert sich Vertrieb dem Vertrieb von Poisson mit dem erwarteten Wert λ.
  • Lehrsatz von de Moivre-Laplace: Da sich n  nähert, während p fest, der Vertrieb von bleibt
::

:approaches die Normalverteilung mit dem erwarteten Wert 0 und der Abweichung 1. Dieses Ergebnis wird manchmal durch den Ausspruch dass der Vertrieb von X Annäherungen die Normalverteilung mit dem erwarteten Wert np und der Abweichung np (1  p) lose festgesetzt. Diese lose Behauptung kann wörtlich nicht genommen werden, weil das Ding, das behauptet ist, wirklich genähert zu werden, vom Wert von n abhängt, und sich n Unendlichkeit nähert. Dieses Ergebnis ist ein spezifischer Fall des Hauptgrenzwertsatzes.

Das Erzeugen binomischen zufälligen variates

Beispiele

Ein elementares Beispiel ist das: Rollen Sie normalen zehn Zeiten und zählen Sie die Zahl von fours auf. Der Vertrieb dieser Zufallszahl ist ein binomischer Vertrieb mit n = 10 und p = 1/6.

Symmetrischer binomischer Vertrieb (p

0.5) ===

Dieses Beispiel illustriert den Hauptgrenzwertsatz im Beispiel des schönen Münzwerfens.

Eine Münze ist schön, wenn sie Köpfe und Schwänze mit der gleichen Wahrscheinlichkeit p = 1/2 zeigt.

Wenn wir eine schöne Münze n Zeiten, die Nummer k von Zeiten werfen die Münzshows 'Köpfe' sind eine zufällige Variable, die binomisch verteilt wird.

Das erste Bild zeigt unten den binomischen Vertrieb für mehrere Werte von n als eine Funktion von k.

File:Bindis-plain.png|Binomial Vertrieb mit p = 0.5 und n = 4,16,64

Haben Sie File:Bindis-sym.png|Moved zur Null vor

File:Bindis-rescaled.png|Rescaled mit der Standardabweichung

</Galerie>

Dieser Vertrieb ist Nachdenken, das in Bezug auf die Linie k = n/2 symmetrisch ist, der, ist

die Wahrscheinlichkeitsmassenfunktion befriedigt &fnof; (k; n, 1/2) = ƒ (n &minus; k; n, 1/2).

Im mittleren Bild wurde der Vertrieb ausgewechselt, so dass ihr bösartiges Null ist.

Die Breite des Vertriebs ist zur Standardabweichung proportional. Der Wert der ausgewechselten Funktionen daran ist ihr jeweiliges maximales und proportionales dazu.

Folglich kann der binomische Vertrieb mit verschiedenen Werten dessen durch das Multiplizieren der Funktionswerte mit und das Teilen der X-Achse dadurch wiedererklettert werden. Das wird im dritten Bild oben gezeichnet.

Das Bild auf den richtigen Shows hat ausgewechselt und hat binomischen Vertrieb normalisiert, jetzt für mehr und größere Werte von n, um sich das zu vergegenwärtigen, laufen die Funktionswerte zu einer allgemeinen Kurve zusammen. Indem man die Annäherung von Stirling der binomischen Koeffizienten verwendet, kommt man diese diese Kurve ist eine Standardnormalverteilung:

:

Das ist die Wahrscheinlichkeitsdichte-Funktion der Standardnormalverteilung. Der Hauptgrenzwertsatz verallgemeinert das obengenannte zu Grenzen des Vertriebs, der nicht notwendigerweise binomisch verteilt wird. Das zweite Bild auf dem Recht zeigt dieselben Daten, aber verwendet eine logarithmische Skala, die manchmal ratsam ist, um in Anwendungen zu verwenden.

Ein Beispiel von Sportarten

Ein Fußballspieler macht vielfache Versuche, Absichten einzukerben. Wenn sie eine schießende Erfolgswahrscheinlichkeit 0.25 hat und 4 Schüsse in einem Match nimmt, dann kann die Zahl von Absichten sie Hunderte als B (4, 0.25) modelliert werden. Bemerken Sie, dass p die Wahrscheinlichkeit jedes gegebenen Schusses vertritt, der eine Absicht, und 1 &minus wird; p vertritt die Wahrscheinlichkeit des Misserfolgs. Die Wahrscheinlichkeit des Spielers, der 0, 1, 2, 3, oder 4 Absichten auf 4 Schüssen zählt, ist:

:::::

Gebrauch

Der binomische Vertrieb wird in vielfachen Feldern schwer verwendet, und entsteht natürlich, wann auch immer ein Experiment oder Prozess als eine Reihe von wiederholten Proben von Bernoulli beschrieben werden können. Beispiele sind, wie oft eine Münze "Köpfe", wenn geschnipst, wiederholt heraufkommt, oder wie viele Babys als Jungen in einer Reihe von Geburten geboren sind.

Eine Beschränkung des binomischen Vertriebs ist, dass er annimmt, dass alle zu Grunde liegenden Proben von Bernoulli dieselbe Wahrscheinlichkeit des Erfolgs haben. Das Ergebnis besteht darin, dass die Abweichung unabhängig von der Wahrscheinlichkeit des Erfolgs und der Zahl von Proben nicht beschrieben werden kann; insbesondere die Abweichung des beobachteten Verhältnisses von erfolgreichen Ergebnissen ist immer weniger geradlinig mit der Zahl von Proben. Zum Beispiel, wenn wir von der lang-geführten Statistik bemerken, dass ein gegebener Kongressbezirk mit n=600,000 Menschenstimmen, die auf durchschnittlichen 60 % der Zeit dann demokratisch sind wenn wir die Stimmen mit einem binomischen Vertrieb modellieren, sagen wir voraus, dass die Standardabweichung des Verhältnisses von demokratischen Stimmen in einer gegebenen Wahl, wo 50 % der Bevölkerungsstimmen = 0.00089 sind. Mit anderen Worten, gut mehr als 99 % der Zeit mit allen diesen Wahlen unabhängig von den Kandidaten, die wir annehmen, zwischen demokratischen und 59.7-%-60.3-%-Stimmen zu sehen —, wohingegen in Wirklichkeit wir annehmen, beträchtlich mehr Schwankung zu sehen. Das Problem hier ist die Annahme, dass jeder individuelle Stimmberechtigte zu demokratisch mit derselben Frequenz wie die Bevölkerung als Ganzes wählt.

Eine realistischere Annahme ist solche Fälle würde einen vorherigen Vertrieb über die Wahrscheinlichkeit des Erfolgs einer gegebenen Probe von Bernoulli (in diesem Fall, eine gegebene Stimme) legen sollen. Wenn wir die mathematisch günstige Wahl machen, den Beta-Vertrieb zu verwenden (der verbundene vorherige vom binomischen Vertrieb), dann folgt der Vertrieb der Zahl von Erfolgen einem mit dem Beta binomischen Vertrieb. Dieser Vertrieb ist etwas einem binomischen Vertrieb ähnlich, aber hat größere Abweichung, und hat kritisch einen Extraparameter, der der Abweichung erlaubt, unabhängig von der Bevölkerungsgröße und erwarteten Wahrscheinlichkeit des Erfolgs angepasst zu werden. Infolgedessen kann ein Modell, das diesen Vertrieb verwendet, in solchen Fällen realistischer sein.

Siehe auch

  • Bohnenmaschine / Kasten von Galton
  • Binomisches Verhältnis-Vertrauensintervall
  • Logistisches rückwärts Gehen
  • Vertrieb von Multinomial
  • Negativer binomischer Vertrieb
Beispielgröße

Benjamin Disraeli / Biostatistics
Impressum & Datenschutz