Kumulative Vertriebsfunktion

In der Wahrscheinlichkeitstheorie und Statistik beschreibt die kumulative Vertriebsfunktion (CDF), oder gerade Vertriebsfunktion, die Wahrscheinlichkeit, dass eine reellwertige zufällige Variable X mit einem gegebenen Wahrscheinlichkeitsvertrieb an einem Wert weniger gefunden als oder zu x gleich wird. Intuitiv ist es das "Gebiet bis jetzt" Funktion des Wahrscheinlichkeitsvertriebs. Kumulative Vertriebsfunktionen werden auch verwendet, um den Vertrieb von multivariate zufälligen Variablen anzugeben.

Definition

Für jede reelle Zahl x wird die kumulative Vertriebsfunktion einer reellwertigen zufälligen Variable X durch gegeben

:

wo die Rechte die Wahrscheinlichkeit vertritt, dass die zufällige Variable X einen Wert weniger übernimmt als oder

gleich x. Die Wahrscheinlichkeit, dass X im Zwischenraum liegt (a, b, wo < b, ist deshalb

:

Hier die Notation (a, b, zeigt einen halbgeschlossenen Zwischenraum an.

Wenn

man mehrere zufällige Variablen X, Y... usw. behandelt, werden die entsprechenden Briefe als Subschriften verwendet, während, wenn man nur einen behandelt, die Subschrift weggelassen wird. Es ist herkömmlich, um ein Kapital F für eine kumulative Vertriebsfunktion, im Gegensatz zum Kleinbuchstaben f verwendet für Wahrscheinlichkeitsdichte-Funktionen und Wahrscheinlichkeitsmassenfunktionen zu verwenden. Das gilt, wenn es allgemeine Vertriebe bespricht: Etwas spezifischer Vertrieb hat ihre eigene herkömmliche Notation, zum Beispiel die Normalverteilung.

Der CDF einer dauernden zufälligen Variable X kann in Bezug auf seinen Wahrscheinlichkeitsdichte-Funktions-ƒ wie folgt definiert werden:

:

Bemerken Sie, dass in der Definition oben, "weniger als oder gleich dem" Zeichen, " ", eine Tagung, nicht allgemein verwendet eine ist (z.B ungarischer Literaturgebrauch",

:

wo F (x-) die Grenze vom verlassenen von F an x anzeigt: D. h. lim F (y) als y nimmt zu x zu.

Eigenschaften

Jede kumulative Vertriebsfunktion F ist (nicht notwendigerweise ausschließlich) das Eintönigkeitsnichtverringern (sieh Eintönigkeit zunehmen), und richtig-dauernd. Außerdem,

:

Jede Funktion mit diesen vier Eigenschaften ist ein CDF: Mehr spezifisch, für jede solche Funktion, kann eine zufällige Variable solch definiert werden, dass die Funktion die kumulative Vertriebsfunktion dieser zufälligen Variable gemäß dem defintion oben ist.

Die Eigenschaften deuten an, dass alle CDFs Càdlàg-Funktionen sind.

Wenn X eine rein getrennte zufällige Variable ist, dann erreicht sie Werte x, x... mit der Wahrscheinlichkeit p = P (x), und der CDF X wird an den Punkten x diskontinuierlich und zwischen unveränderlich sein:

:

Wenn der CDF F X dauernd ist, dann X ist eine dauernde zufällige Variable; wenn außerdem F absolut dauernd ist, dann dort besteht eine Lebesgue-Integrable-Funktion f (x) solch dass

:

für alle reellen Zahlen a und b. (Die erste von den zwei Gleichheiten, die oben gezeigt sind, würde im Allgemeinen nicht richtig sein, wenn wir nicht gesagt hatten, dass der Vertrieb dauernd ist. Die Kontinuität des Vertriebs deutet dass P (X = a) = P (X = b) = 0, so der Unterschied zwischen "an

Kolmogorov-Smirnov und die Tests von Kuiper

Der Test von Kolmogorov-Smirnov basiert auf kumulativen Vertriebsfunktionen und kann verwendet werden, um zu prüfen, um zu sehen, ob zwei empirischer Vertrieb verschieden ist, oder ob ein empirischer Vertrieb von einem idealen Vertrieb verschieden ist. Der Test des nah verwandten Kuipers ist nützlich, wenn das Gebiet des Vertriebs als am Tag der Woche zyklisch ist. Zum Beispiel könnten wir den Test von Kuiper verwenden, um zu sehen, ob sich die Zahl von Tornados während des Jahres ändert, oder wenn sich Verkäufe eines Produktes beim Tag der Woche oder Tag des Monats ändern.

Kumulative Ergänzungsvertriebsfunktion (Schwanz-Vertrieb)

Manchmal ist es nützlich, die entgegengesetzte Frage zu studieren und zu fragen, wie oft die zufällige Variable über einem besonderen Niveau ist. Das wird die kumulative Ergänzungsvertriebsfunktion (ccdf) oder einfach den Schwanz-Vertrieb oder exceedance genannt, und wird als definiert

Das hat Anwendungen in der statistischen Hypothese-Prüfung zum Beispiel, weil einseitiger P-Wert die Wahrscheinlichkeit ist, einen Test statistisch mindestens so äußerst zu beobachten, wie derjenige beobachtet hat; folglich wird der einseitige P-Wert einfach durch den ccdf gegeben.

In der Überleben-Analyse, wird die Überleben-Funktion genannt und angezeigt, während die Begriff-Zuverlässigkeitsfunktion in der Technik üblich ist.

Eigenschaften

  • Für eine nichtnegative dauernde zufällige Variable, die eine Erwartung hat, setzt die Ungleichheit von Markov das fest
::
  • Als, und tatsächlich

:Proof: Das Annehmen X hat eine Dichte-Funktion f für jeden

::

\mathbb E (X) = \int_0^\\infty xf (x) dx \geq \int_0^c xf (x) dx + c\int_c^\\infty f (x) dx

</Mathematik>

:Then, anerkennend und Begriffe, umordnend

::

0 \leq c\bar F (c) \leq \mathbb E (X) - \int_0^c x f (x) dx \to 0 \text {als} c \to \infty

</Mathematik>

:as gefordert.

Gefalteter kumulativer Vertrieb

Während der Anschlag eines kumulativen Vertriebs häufig eine S ähnliche Gestalt hat, ist eine alternative Illustration der gefaltete kumulative Vertrieb oder Berganschlag, der die Spitzenhälfte des Graphen, faltet

so mit zwei Skalen, ein für den upslope und einen anderen für den downslope. Diese Form der Illustration betont die Mittellinie und Streuung des Vertriebs oder der empirischen Ergebnisse.

Beispiele

Als ein Beispiel, denken Sie X wird auf dem Einheitszwischenraum [0, 1] gleichförmig verteilt.

Dann wird der CDF X durch gegeben

:

0 &:\x

Nehmen Sie stattdessen an, dass X nur die getrennten Werte 0 und 1, mit der gleichen Wahrscheinlichkeit nimmt.

Dann wird der CDF X durch gegeben:0 &:\x

Umgekehrte Vertriebsfunktion (quantile Funktion)

Wenn der CDF F ausschließlich zunimmt und dauernd dann die einzigartige solche reelle Zahl dass ist.

Leider hat der Vertrieb im Allgemeinen kein Gegenteil. Man kann weil die verallgemeinerte umgekehrte Vertriebsfunktion definieren:

:

F^ {-1} (y) = \inf_ {x \in \mathbb {R}} \{F (x) \geq y \}.

</Mathematik>
  • Beispiel 1: Die Mittellinie ist.
  • Beispiel 2: Stellen. Dann nennen wir den 95. Prozentanteil.

Das Gegenteil des cdf wird die Quantile-Funktion genannt.

Das Gegenteil des cdf kann verwendet werden, um Ergebnisse zu übersetzen, die für die Rechteckverteilung zu anderem Vertrieb erhalten sind. Einige nützliche Eigenschaften des Gegenteils cdf sind:

  1. nichtvermindert
  1. wenn und nur wenn
  2. Wenn einen Vertrieb hat, dann wird als verteilt. Das wird in der Zufallszahl-Generation verwendet, die das Gegenteil verwendet, gestalten Stichprobenerhebungsmethode um.
  3. Wenn eine Sammlung des Unabhängigen ist - hat zufällige auf demselben Beispielraum definierte Variablen verteilt, dann dort bestehen zufällige solche Variablen, der als und mit der Wahrscheinlichkeit 1 für alle verteilt wird.

Fall von Multivariate

Wenn

man sich gleichzeitig mit mehr als einer zufälliger Variable befasst, kann die gemeinsame kumulative Vertriebsfunktion auch definiert werden. Zum Beispiel, für ein Paar von zufälligen Variablen X, Y, wird der gemeinsame CDF durch gegeben

wo die Rechte die Wahrscheinlichkeit vertritt, dass die zufällige Variable X einen Wert weniger übernimmt als oder

gleich x, und dass Y einen Wert weniger übernimmt als oder

gleich y.

Jeder multivariate CDF ist:

  1. Monotonically, der für jede seiner Variablen nichtabnimmt
  2. Richtig-dauernd für jede seiner Variablen.
  1. und

Siehe auch

  • Beschreibende Statistik
  • Empirische Vertriebsfunktion
  • Kumulative Frequenzanalyse
  • Q-Q planen
  • Ogive
  • Einzelne sich treffende Bedingung

Carlo Goldoni / Haupttendenz
Impressum & Datenschutz