Wahrscheinlichkeitsvertrieb

In der Wahrscheinlichkeitstheorie, einer Wahrscheinlichkeitsmasse, der Wahrscheinlichkeitsdichte oder dem Wahrscheinlichkeitsvertrieb ist eine Funktion, die die Wahrscheinlichkeit zufällige variable nehmende bestimmte Werte beschreibt.

Für eine genauere Definition muss man zwischen getrennten und dauernden zufälligen Variablen unterscheiden. Im getrennten Fall kann man eine Wahrscheinlichkeit jedem möglichen Wert leicht zuteilen: Wenn er a wirft, hat jeder der sechs Werte 1 bis 6 die Wahrscheinlichkeit 1/6. Im Gegensatz, wenn eine zufällige Variable Werte von einem Kontinuum nimmt, sind Wahrscheinlichkeiten Nichtnull nur, wenn sie sich auf begrenzte Zwischenräume beziehen: In der Qualitätskontrolle könnte man fordern, dass die Wahrscheinlichkeit "500 g" Paket, das zwischen 490 g und 510 g enthält, keine weniger als 98 % sein sollte.

Wenn ein Gesamtbezug für die zufällige Variable definiert wird, gibt die kumulative Vertriebsfunktion die Wahrscheinlichkeit, dass die zufällige Variable nicht größer ist als ein gegebener Wert; es ist das Integral des nichtkumulativen Vertriebs.

Fachsprache

Da Wahrscheinlichkeitstheorie in ziemlich verschiedenen Anwendungen verwendet wird, ist Fachsprache nicht gleichförmig und manchmal verwirrend. Die folgenden Begriffe werden für nichtkumulative Wahrscheinlichkeitsvertriebsfunktionen gebraucht:

  • Wahrscheinlichkeitsmasse, Wahrscheinlichkeitsmassenfunktion, p.m.f.: für getrennte zufällige Variablen.
  • Kategorischer Vertrieb: für getrennte zufällige Variablen mit einem begrenzten Satz von Werten.
  • Wahrscheinlichkeitsdichte, Wahrscheinlichkeitsdichte-Funktion, p.d.f: Meistenteils vorbestellt für dauernde zufällige Variablen.

Die folgenden Begriffe sind etwas zweideutig, weil sie sich auf den nichtkumulativen oder kumulativen Vertrieb abhängig von den Einstellungen von Autoren beziehen können:

  • Wahrscheinlichkeitsvertriebsfunktion: Dauernd oder getrennt, nichtkumulativ oder kumulativ.
  • Wahrscheinlichkeitsfunktion: Noch mehr zweideutig, kann einigen der obengenannten, oder irgend etwas anderes bedeuten.

Schließlich,

  • Wahrscheinlichkeitsvertrieb: Irgendein dasselbe als Wahrscheinlichkeitsvertriebsfunktion. Oder verstanden als etwas das grundsätzlichere Unterliegen einer wirklichen Masse oder Dichte-Funktion.

Grundlegende Begriffe

  • Weise: am häufigsten vorkommender Wert in einem Vertrieb
  • Schwanz: Gebiet am wenigsten oft vorkommender Werte in einem Vertrieb

Getrennter Wahrscheinlichkeitsvertrieb

Ein getrennter Wahrscheinlichkeitsvertrieb soll als ein durch eine Wahrscheinlichkeitsmassenfunktion charakterisierter Wahrscheinlichkeitsvertrieb verstanden werden. So ist der Vertrieb einer zufälligen Variable X getrennt, und X wird dann eine getrennte zufällige Variable, wenn genannt

:

weil u den Satz aller möglichen Werte von X durchbohrt. Hieraus folgt dass solch eine zufällige Variable nur einen begrenzten oder zählbar unendliche Zahl von Werten annehmen kann.

In öfter in Betracht gezogenen Fällen ist dieser Satz von möglichen Werten ein topologisch getrennter Satz im Sinn, dass alle seine Punkte Punkte isoliert werden. Aber es gibt getrennte zufällige Variablen, für die dieser zählbare Satz auf der echten Linie (zum Beispiel, ein Vertrieb über rationale Zahlen) dicht ist.

Unter dem wohl bekanntesten getrennten Wahrscheinlichkeitsvertrieb, der für das statistische Modellieren verwendet wird, sind der Vertrieb von Poisson, der Vertrieb von Bernoulli, der binomische Vertrieb, der geometrische Vertrieb und der negative binomische Vertrieb. Außerdem wird die getrennte Rechteckverteilung in Computerprogrammen allgemein verwendet, die gleiche Wahrscheinlichkeit zufällige Auswahlen zwischen mehreren Wahlen machen.

Kumulative Dichte

Gleichwertig zum obengenannten kann eine getrennte zufällige Variable als eine zufällige Variable definiert werden, deren kumulative Vertriebsfunktion (cdf) nur durch Sprung-Diskontinuitäten — d. h. seine Cdf-Zunahmen zunimmt nur dort, wo es zu einem höheren Wert "springt", und zwischen jenen Sprüngen unveränderlich ist. Die Punkte, wo Sprünge vorkommen, sind genau die Werte, die die zufällige Variable nehmen kann. Die Zahl solcher Sprünge kann begrenzt oder zählbar unendlich sein. Der Satz von Positionen solcher Sprünge braucht nicht topologisch getrennt zu sein; zum Beispiel könnte sich der cdf auf jede rationale Zahl stürzen.

Darstellung der Delta-Funktion

Folglich wird ein getrennter Wahrscheinlichkeitsvertrieb häufig als ein verallgemeinertes Wahrscheinlichkeitsdichte-Funktionsbeteiligen Delta-Funktionen von Dirac vertreten, der wesentlich die Behandlung des dauernden und getrennten Vertriebs vereinigt. Das ist wenn besonders nützlich, sich mit Wahrscheinlichkeitsvertrieb befassend, der mit sowohl einem dauernden als auch einem getrennten Teil verbunden ist.

Anzeigefunktionsdarstellung

Für eine getrennte zufällige Variable X, lassen Sie u, u, seien Sie... die Werte, die er mit der Nichtnullwahrscheinlichkeit nehmen kann. Zeigen Sie an

:

Das sind zusammenhanglose Sätze, und durch die Formel (1)

:

Hieraus folgt dass die Wahrscheinlichkeit, die X jeden Wert abgesehen von u, u nimmt... Null ist, und so man X als schreiben kann

:

außer auf einer Reihe der Wahrscheinlichkeitsnull, wo die Anzeigefunktion von A ist. Das kann als eine alternative Definition von getrennten zufälligen Variablen dienen.

Dauernder Wahrscheinlichkeitsvertrieb

Ein dauernder Wahrscheinlichkeitsvertrieb soll als ein Wahrscheinlichkeitsvertrieb verstanden werden, der eine Wahrscheinlichkeitsdichte-Funktion hat. Mathematiker nennen auch solch einen Vertrieb absolut dauernd, da seine kumulative Vertriebsfunktion in Bezug auf den Maß-λ von Lebesgue absolut dauernd ist. Wenn der Vertrieb X dauernd ist, dann X wird eine dauernde zufällige Variable genannt. Es gibt viele Beispiele des dauernden Wahrscheinlichkeitsvertriebs: normal, gleichförmig, chi-kariert, und andere.

Intuitiv ist eine dauernde zufällige Variable diejenige, die einen dauernden Wertbereich — im Vergleich mit einem getrennten Vertrieb nehmen kann, wo der Satz von möglichen Werten für die zufällige Variable höchstens zählbar ist. Während für einen getrennten Vertrieb ein Ereignis mit der Wahrscheinlichkeitsnull unmöglich ist (z.B das Rollen 3½ auf einem Standard sterben ist unmöglich, und hat Wahrscheinlichkeitsnull), das ist nicht so im Fall von einer dauernden zufälligen Variable. Zum Beispiel, wenn man die Breite eines Eiche-Blattes misst, ist das Ergebnis von 3½ Cm möglich, jedoch hat es Wahrscheinlichkeitsnull, weil es unzählbar viele andere potenzielle Werte sogar zwischen 3 Cm und 4 Cm gibt. Jedes dieser individuellen Ergebnisse hat Wahrscheinlichkeitsnull, noch ist die Wahrscheinlichkeit, dass das Ergebnis in den Zwischenraum fallen wird, Nichtnull. Dieses offenbare Paradox wird durch die Tatsache aufgelöst, dass die Wahrscheinlichkeit, die X einen Wert innerhalb eines unendlichen Satzes wie ein Zwischenraum erreicht, durch das naive Hinzufügen der Wahrscheinlichkeiten für individuelle Werte nicht gefunden werden kann. Formell hat jeder Wert eine unendlich klein kleine Wahrscheinlichkeit, die statistisch zur Null gleichwertig ist.

Formell, wenn X eine dauernde zufällige Variable ist, dann hat sie eine Wahrscheinlichkeitsdichte-Funktion, die (x) ƒ, und deshalb seine Wahrscheinlichkeit des Fallens in einen gegebenen Zwischenraum, sagen, wird durch den integrierten gegeben

:

\Pr [a\le X\le b] = \int_a^b f (x) \, dx

</Mathematik>

Insbesondere die Wahrscheinlichkeit für X, um jeden einzelnen Wert zu nehmen (der ist) ist Null, weil ein Integral mit zusammenfallenden oberen und niedrigeren Grenzen immer der Null gleich ist.

Die Definition stellt fest, dass ein dauernder Wahrscheinlichkeitsvertrieb eine Dichte, oder gleichwertig, seine kumulative Vertriebsfunktion besitzen muss, absolut dauernd sein. Diese Voraussetzung ist stärker als einfache Kontinuität des cdf, und es gibt eine spezielle Klasse des Vertriebs, einzigartigen Vertriebs, der weder dauernd noch getrennt ist noch ihre Mischung. Ein Beispiel wird durch den Kantor-Vertrieb angeführt. Auf solchen einzigartigen Vertrieb wird jedoch in der Praxis nie gestoßen.

Zeichen auf der Fachsprache: Einige Autoren gebrauchen den Begriff "dauernder Vertrieb", um den Vertrieb mit dauerndem cdf anzuzeigen. So schließt ihre Definition sowohl den (absolut) dauernden als auch einzigartigen Vertrieb ein.

Durch eine Tagung wird ein Wahrscheinlichkeitsvertrieb dauernd genannt, wenn seine kumulative Vertriebsfunktion dauernd ist und, deshalb, das Wahrscheinlichkeitsmaß des Singletons für alle.

Eine andere Tagung bestellt den Begriff dauernder Wahrscheinlichkeitsvertrieb für den absolut dauernden Vertrieb vor. Dieser Vertrieb kann durch eine Wahrscheinlichkeitsdichte-Funktion charakterisiert werden: Eine nichtnegative Funktion von Lebesgue integrable hat auf den solchen reellen Zahlen dass definiert

:

F (x) = \mu (-\infty, x] = \int_ {-\infty} ^x f (t) \, dt.

</Mathematik>

Getrennter Vertrieb und etwas dauernder Vertrieb (wie der Kantor-Vertrieb) lassen solch eine Dichte nicht zu.

Wahrscheinlichkeitsvertrieb von reellwertigen zufälligen Variablen

Weil ein Wahrscheinlichkeitsvertrieb Pr auf der echten Linie wird durch die Wahrscheinlichkeit einer reellwertigen zufälligen Variable X bestimmt, in einem halb offenen Zwischenraum - , x, der Wahrscheinlichkeitsvertrieb seiend, durch seine kumulative Vertriebsfunktion völlig charakterisiert wird:

:

Fachsprache

Die Unterstützung eines Vertriebs ist der kleinste geschlossene Zwischenraum/Satz, dessen Ergänzung Wahrscheinlichkeitsnull hat. Es kann als die Punkte oder Elemente verstanden werden, die wirkliche Mitglieder des Vertriebs sind.

Einige Eigenschaften

  • Die Wahrscheinlichkeitsdichte-Funktion der Summe von zwei unabhängigen zufälligen Variablen ist die Gehirnwindung von jeder ihrer Dichte-Funktionen.
  • Die Wahrscheinlichkeitsdichte-Funktion des Unterschieds von zwei unabhängigen zufälligen Variablen ist die Quer-Korrelation ihrer Dichte-Funktionen.
  • Wahrscheinlichkeitsvertrieb ist nicht ein Vektorraum - sie werden unter geradlinigen Kombinationen nicht geschlossen, weil diese Nichtnegativität oder ganzen integrierten 1 nicht bewahren - aber sie werden unter der konvexen Kombination geschlossen, so eine konvexe Teilmenge des Raums von Funktionen (oder Maßnahmen) bildend.

Zufallszahl-Generation

Ein häufiges Problem in statistischen Simulationen (Methode von Monte Carlo) ist die Generation von pseudozufälligen Zahlen, die in einem nachgegebenen verteilt werden. Die meisten Algorithmen basieren auf einem Pseudozufallszahlengenerator, der Zahlen X erzeugt, die im Zwischenraum [0,1 gleichförmig verteilt werden). Diese X werden dann in einen u (X) umgestaltet, die einen gegebenen Vertrieb f (u) befriedigen.

Definition von Kolmogorov

In der mit dem Maß theoretischen Formalisierung der Wahrscheinlichkeitstheorie wird eine zufällige Variable als eine messbare Funktion X von einem Wahrscheinlichkeitsraum bis messbaren Raum definiert. Ein Wahrscheinlichkeitsvertrieb ist das Pushforward-Maß XP = PX darauf.

Anwendungen

Das Konzept des Wahrscheinlichkeitsvertriebs und der zufälligen Variablen, die sie beschreiben, unterliegt der mathematischen Disziplin der Wahrscheinlichkeitstheorie und der Wissenschaft der Statistik. Dort wird ausgebreitet oder Veränderlichkeit in fast jedem Wert, der in einer Bevölkerung (z.B Höhe von Leuten, Beständigkeit eines Metalls, Verkaufswachstums, Verkehrsflusses, usw.) gemessen werden kann; fast alle Maße werden mit etwas innerem Fehler gemacht; in der Physik werden viele Prozesse probabilistically, von den kinetischen Eigenschaften von Benzin zum Quant mechanische Beschreibung von grundsätzlichen Partikeln beschrieben. Für diese und viele andere Gründe sind einfache Zahlen häufig unzulänglich, für eine Menge zu beschreiben, während Wahrscheinlichkeitsvertrieb häufig passender ist.

Als ein spezifischeres Beispiel einer Anwendung tun die Sprachmodelle des geheimen Lagers und anderen statistischen in der Verarbeitung der natürlichen Sprache verwendeten Sprachmodelle, um Wahrscheinlichkeiten dem Ereignis von besonderen Wörtern und Wortfolgen zuzuteilen, so mittels des Wahrscheinlichkeitsvertriebs.

Allgemeiner Wahrscheinlichkeitsvertrieb

Der folgende ist eine Liste von etwas vom allgemeinsten Wahrscheinlichkeitsvertrieb, der durch den Typ des Prozesses gruppiert ist, mit dem sie verbunden sind. Für eine mehr ganze Liste, sieh Liste des Wahrscheinlichkeitsvertriebs, der Gruppen durch die Natur des Ergebnisses, das (getrennt, dauernd, multivariate, usw.) wird betrachtet

Bemerken Sie auch, dass der ganze univariate Vertrieb unten einzeln kulminiert wird; d. h. es wird dass die Werttraube um einen einzelnen Punkt angenommen. In der Praxis können sich wirklich beobachtete Mengen um vielfache Werte sammeln. Solche Mengen können mit einem Mischungsvertrieb modelliert werden.

Verbunden mit reellwertigen Mengen, die geradlinig (z.B Fehler, Ausgleiche) wachsen

Verbunden mit positiven reellwertigen Mengen, die exponential (z.B Preise, Einkommen, Bevölkerungen) wachsen

Verbunden mit reellwertigen Mengen, die, wie man annimmt, über (vielleicht unbekannt) Gebiet gleichförmig verteilt werden

  • Getrennte Rechteckverteilung, für einen begrenzten Satz von Werten (z.B das Ergebnis einer Messe sterben)
  • Dauernde Rechteckverteilung, für unaufhörlich verteilte Werte

Verbunden mit Proben von Bernoulli (ja/no Ereignisse, mit einer gegebenen Wahrscheinlichkeit)

  • Grundlegender Vertrieb:
  • Vertrieb von Bernoulli, für das Ergebnis einer einzelnen Probe von Bernoulli (z.B Erfolg/Misserfolg, ja/no)
  • Binomischer Vertrieb, für die Zahl "positiver Ereignisse" (z.B Erfolge, ja Stimmen, usw.) gegeben eine feste Gesamtzahl von unabhängigen Ereignissen
  • Negativer binomischer Vertrieb, für Beobachtungen des binomischen Typs, aber wo die Menge von Interesse die Zahl von Misserfolgen vor einer gegebenen Zahl von Erfolgen ist, kommt vor
  • Geometrischer Vertrieb, für Beobachtungen des binomischen Typs, aber wo die Menge von Interesse die Zahl von Misserfolgen vor dem ersten Erfolg ist; ein spezieller Fall des negativen binomischen Vertriebs
  • Verbunden mit ausfallenden Schemas über eine begrenzte Bevölkerung:
  • Hypergeometrischer Vertrieb, für die Zahl "positiver Ereignisse" (z.B Erfolge, ja Stimmen, usw.) gegeben eine festgelegte Zahl von Gesamtereignissen, mit ausfallend ohne Ersatz
  • Mit dem Beta binomischer Vertrieb, für die Zahl "positiver Ereignisse" (z.B Erfolge, ja Stimmen, usw.) gegeben eine festgelegte Zahl von Gesamtereignissen, das Verwenden eines Urne-Schemas von Polya (in einem Sinn, dem "Gegenteil" der Stichprobenerhebung ohne Ersatz) probierend

Verbunden mit kategorischen Ergebnissen (Ereignisse mit K möglichen Ergebnissen, mit einer gegebenen Wahrscheinlichkeit für jedes Ergebnis)

  • Kategorischer Vertrieb, für ein einzelnes kategorisches Ergebnis (z.B yes/no/maybe in einem Überblick); eine Generalisation des Vertriebs von Bernoulli
  • Vertrieb von Multinomial, für die Zahl jedes Typs des kategorischen Ergebnisses, in Anbetracht einer festgelegten Zahl von Gesamtergebnissen; eine Generalisation des binomischen Vertriebs
  • Multivariate hypergeometrischer Vertrieb, der dem multinomial Vertrieb ähnlich ist, aber verwendend, ohne Ersatz ausfallend; eine Generalisation des hypergeometrischen Vertriebs

Verbunden mit Ereignissen in einem Prozess von Poisson (Ereignisse, die unabhängig mit einer gegebenen Rate vorkommen)

  • Vertrieb von Poisson, für die Zahl von Ereignissen eines Poisson-Typ-Ereignisses in einer gegebenen Zeitspanne
  • Exponentialvertrieb für die Zeit bevor kommt das folgende Poisson-Typ-Ereignis vor

Nützlich für die Hypothese-Prüfung hat sich auf normalerweise verteilte Ergebnisse bezogen

Nützlich als verbundener vorheriger Vertrieb in der Schlussfolgerung von Bayesian

  • Beta-Vertrieb, für eine einzelne Wahrscheinlichkeit (reelle Zahl zwischen 0 und 1); paaren Sie sich zum Vertrieb von Bernoulli und binomischen Vertrieb
  • Gammavertrieb, für einen nichtnegativen kletternden Parameter; paaren Sie sich zum Rate-Parameter eines Vertriebs von Poisson oder Exponentialvertriebs, die Präzision (umgekehrte Abweichung) einer Normalverteilung usw.
  • Vertrieb von Dirichlet, für einen Vektoren von Wahrscheinlichkeiten, die zu 1 resümieren müssen; paaren Sie sich zum kategorischen Vertrieb und multinomial Vertrieb; Generalisation des Beta-Vertriebs
  • Vertrieb von Wishart, für eine symmetrische nichtnegative bestimmte Matrix; paaren Sie sich zum Gegenteil der Kovarianz-Matrix einer multivariate Normalverteilung; Generalisation des Gammavertriebs

Siehe auch

  • Momentenerzeugungsfunktion
  • Satzband (Statistik)
  • Histogram
  • Wahrscheinlichkeitsfunktion
  • Liste von statistischen Themen
  • Riemann-Stieltjes integrierte Anwendung auf die Wahrscheinlichkeitstheorie
  • B. S. Everitt: Das Wörterbuch von Cambridge der Statistik, Universität von Cambridge Presse, Cambridge (3. Ausgabe, 2006). Internationale Standardbuchnummer 0521690277
  • Bischof: Muster-Anerkennung und das Maschinenlernen, der Springer, die internationale Standardbuchnummer 0-387-31073-8

Links


Wahrscheinlichkeitstheorie / Psychologische Statistik
Impressum & Datenschutz