Kurtosis

In der Wahrscheinlichkeitstheorie und Statistik, kurtosis (vom griechischen Wort , kyrtos oder kurtos, bedeutend sich ausbauchend) ist jedes Maß des "peakedness" des Wahrscheinlichkeitsvertriebs einer reellwertigen zufälligen Variable. Auf eine ähnliche Weise zum Konzept der Schiefe ist kurtosis ein Deskriptor der Gestalt eines Wahrscheinlichkeitsvertriebs und, ebenso für die Schiefe, es gibt verschiedene Weisen, es für einen theoretischen Vertrieb und entsprechende Weisen zu messen, es von einer Probe von einer Bevölkerung zu schätzen.

Ein allgemeines Maß von kurtosis, mit Karl Pearson entstehend, basiert auf einer schuppigen Version des vierten Moments der Daten oder Bevölkerung, aber es ist behauptet worden, dass dieses Maß wirklich schwere Schwänze, und nicht peakedness misst. Für dieses Maß höher bedeutet kurtosis, dass mehr von der Abweichung das Ergebnis von seltenen äußersten Abweichungen im Vergleich mit häufigen bescheiden großen Abweichungen ist. Es ist übliche Praxis, um eine angepasste Version des kurtosis von Pearson, das Übermaß kurtosis zu verwenden, einen Vergleich der Gestalt eines gegebenen Vertriebs zu dieser der Normalverteilung zur Verfügung zu stellen. Der Vertrieb mit dem negativen oder positiven Übermaß kurtosis wird platykurtic Vertrieb oder leptokurtic Vertrieb beziehungsweise genannt.

Alternative Maßnahmen von kurtosis sind: Der L-kurtosis, der eine schuppige Version des vierten L-Moments ist; Maßnahmen, die auf 4 Bevölkerung oder Probe quantiles gestützt sind. Diese entsprechen den alternativen Maßnahmen der Schiefe, die auf gewöhnlichen Momenten nicht basieren.

Momente von Pearson

Der vierte standardisierte Moment wird als definiert

:

wo μ der vierte Moment über das bösartige ist und σ die Standardabweichung ist. Das wird manchmal als die Definition von kurtosis in älteren Arbeiten verwendet, aber ist nicht die Definition verwendet hier.

Kurtosis wird als der vierte cumulant allgemeiner definiert, der durch das Quadrat des zweiten cumulant geteilt ist, der dem vierten Moment um das bösartige gleich ist, das durch das Quadrat der Abweichung des Wahrscheinlichkeitsvertriebs minus 3, geteilt ist

:

der auch bekannt als Übermaß kurtosis ist. "Minus 3" am Ende dieser Formel wird häufig als eine Korrektur erklärt, um den kurtosis der der Null gleichen Normalverteilung zu machen. Ein anderer Grund kann durch das Schauen auf die Formel für den kurtosis der Summe von zufälligen Variablen gesehen werden. Nehmen Sie an, dass Y die Summe von n ist, identisch hat unabhängige zufällige Variablen alle mit demselben Vertrieb wie X verteilt. Dann

:

Diese Formel würde viel mehr kompliziert sein, wenn kurtosis als μ / σ (ohne minus 3) definiert würden.

Mehr allgemein, wenn X..., X unabhängige zufällige Variablen, nicht notwendigerweise identisch verteilt, aber alle sind, dieselbe Abweichung, dann habend

:

wohingegen diese Identität nicht halten würde, ob die Definition die Subtraktion 3 nicht eingeschlossen hat.

Der vierte standardisierte Moment muss mindestens 1 sein, so muss das Übermaß kurtosis −2 oder mehr sein. Das tiefer gebunden wird durch den Vertrieb von Bernoulli mit p = ½, oder "Münzwerfen" begriffen. Es gibt keine obere Grenze zum Übermaß kurtosis, und es kann unendlich sein.

Interpretation

Die genaue Interpretation des Maßes von Pearson von kurtosis (oder Übermaß kutosis) wird diskutiert. Die "klassische" Interpretation, die nur für den symmetrischen Vertrieb gilt (diejenigen, deren Schiefe 0 ist), ist, dass kurtosis sowohl den "peakedness" des Vertriebs als auch die Last seines Schwanzes misst. Verschiedene Statistiker haben andere Interpretationen, solche vorgeschlagen, die "Schultern" fehlen (wo die "Schulter" vage als das Gebiet zwischen der Spitze und dem Schwanz, oder mehr spezifisch als das Gebiet über eine Standardabweichung vom bösartigen definiert wird), oder "bimodality". Balanda und MacGillivray behaupten, dass die Standarddefinition von kurtosis "ein schlechtes Maß des kurtosis, peakedness, oder Schwanz-Gewicht eines Vertriebs ist" und haben Sie stattdessen vor, kurtosis vage als die Position - und Bewegung ohne Skalen der Wahrscheinlichkeitsmasse von den Schultern eines Vertriebs in sein Zentrum und Schwänze "zu definieren".

Fachsprache und Beispiele

Ein hoher kurtosis Vertrieb hat schärfere fettere, längere und Maximalschwänze, während ein niedriger kurtosis Vertrieb eine mehr rund gemachte Spitze und kürzer, dünnere Schwänze hat.

Der Vertrieb mit dem Nullübermaß kurtosis wird mesokurtic oder mesokurtotic genannt. Das prominenteste Beispiel eines mesokurtic Vertriebs ist die Normalverteilungsfamilie unabhängig von den Werten seiner Rahmen. Einiger anderer wohl bekannter Vertrieb kann mesokurtic abhängig von Parameter-Werten sein: Zum Beispiel ist der binomische Vertrieb mesokurtic dafür.

Ein Vertrieb mit dem positiven Übermaß kurtosis wird leptokurtic oder leptokurtotic genannt. "Lepto-" bedeutet "schlank" http://medical-dictionary.thefreedictionary.com/lepto-. In Bezug auf die Gestalt hat ein leptokurtic Vertrieb eine akutere Spitze um die bösartigen und fetteren Schwänze. Beispiele des leptokurtic Vertriebs schließen den Vertrieb von Cauchy, den T-Vertrieb des Studenten, Vertrieb von Rayleigh, Vertrieb von Laplace, Exponentialvertrieb, Vertrieb von Poisson und den logistischen Vertrieb ein. Solcher Vertrieb wird manchmal fantastischer Gaussian genannt.

Ein Vertrieb mit dem negativen Übermaß kurtosis wird platykurtic oder platykurtotic genannt. "Platy-" bedeutet "breit" http://www.yourdictionary.com/platy-prefix. In Bezug auf die Gestalt hat ein platykurtic Vertrieb eine niedrigere, breitere Spitze um die bösartigen und dünneren Schwänze. Beispiele des platykurtic Vertriebs schließen die dauernden oder getrennten Rechteckverteilungen und den erhobenen Kosinus-Vertrieb ein. Der grösste Teil des platykurtic Vertriebs von allen ist der Vertrieb von Bernoulli mit p = ½ (zum Beispiel die Zahl von Zeiten man erhält "Köpfe", wenn man eine Münze einmal, ein Münzwerfen schnipst), für den das Übermaß kurtosis −2 ist. Solcher Vertrieb ist manchmal genanntes U-Boot Gaussian.

Grafische Beispiele

Die Familie des Typs VII von Pearson

Die Effekten von kurtosis werden mit einer parametrischen Familie des Vertriebs illustriert, dessen kurtosis angepasst werden kann, während ihre Momente der niedrigeren Ordnung und cumulants unveränderlich bleiben. Denken Sie die Familie des Typs VII von Pearson, die ein spezieller Fall der auf symmetrische Dichten eingeschränkten Familie des Typs IV von Pearson ist. Die Wahrscheinlichkeitsdichte-Funktion wird durch gegeben

:

wo eines Skala-Parameters und M zu sein, ein Gestalt-Parameter ist.

Alle Dichten in dieser Familie sind symmetrisch. Der kth Moment besteht zur Verfügung gestellter m> (k + 1)/2. Für den kurtosis, um zu bestehen, verlangen wir m> 5/2. Dann bestehen das bösartige und die Schiefe und sind beide identisch Null-. Das Setzen = 2 M − 3 macht die Abweichung gleich der Einheit. Dann ist der einzige freie Parameter M, die den vierten Moment (und cumulant) und folglich der kurtosis kontrolliert. Man kann damit wiederparametrisieren, wo der kurtosis, wie definiert, oben ist. Das gibt einen einen Parameter leptokurtic Familie mit der Null bösartig, Einheitsabweichung, Nullschiefe und willkürlicher positiver kurtosis nach. Die wiederparametrisierte Dichte ist

:

In der Grenze weil erhält man die Dichte

:

der als die rote Kurve in den Images rechts gezeigt wird.

In der anderen Richtung weil erhält man die normale Standarddichte als der Begrenzungsvertrieb, der als die schwarze Kurve gezeigt ist.

In den Images rechts vertritt die blaue Kurve die Dichte mit kurtosis 2. Das Spitzenimage zeigt, dass leptokurtic Dichten in dieser Familie eine höhere Spitze haben als die mesokurtic normale Dichte. Die verhältnismäßig fetteren Schwänze der leptokurtic Dichten werden im zweiten Image illustriert, das den natürlichen Logarithmus der Dichten des Typs VII von Pearson plant: Die schwarze Kurve ist der Logarithmus der normalen Standarddichte, die eine Parabel ist. Man kann sehen, dass die normale Dichte wenig Wahrscheinlichkeitsmasse den vom bösartigen weiten Gebieten zuteilt ("hat dünne Schwänze"), im Vergleich zur blauen Kurve der leptokurtic Dichte des Typs VII von Pearson mit kurtosis 2. Zwischen der blauen Kurve und dem Schwarzen sind andere Dichten des Typs VII von Pearson mit γ = 1, 1/2, 1/4, 1/8, und 1/16. Die rote Kurve zeigt wieder die obere Grenze der Familie des Typs VII von Pearson, mit (der genau genommen bedeutet, dass der vierte Moment nicht besteht). Die rote Kurve vermindert das langsamste, als man sich äußer vom Ursprung bewegt ("hat fette Schwänze").

Kurtosis des wohl bekannten Vertriebs

Mehrerer wohl bekannter, unimodaler und symmetrischer Vertrieb von verschiedenen parametrischen Familien wird hier verglichen. Jeder hat einen bösartigen und Schiefe der Null. Die Rahmen sind gewählt worden, um auf eine Abweichung hinauszulaufen, die 1 in jedem Fall gleich ist. Die Images auf der richtigen Show biegen sich für die folgenden sieben Dichten, auf einer geradlinigen Skala und logarithmischer Skala:

  • D: Laplace Vertrieb, auch bekannt als der doppelte Exponentialvertrieb, rote Kurve (zwei Geraden im Anschlag der Klotz-Skala), Übermaß kurtosis = 3
  • S: schneidender Hyperbelvertrieb, Orangenkurve, Übermaß kurtosis = 2
  • L: logistischer Vertrieb, grüne Kurve, Übermaß kurtosis = 1.2
  • N: Normalverteilung, schwarze Kurve (umgekehrte Parabel im Anschlag der Klotz-Skala), Übermaß kurtosis = 0
  • C: erhobener Kosinus-Vertrieb, zyane Kurve, Übermaß kurtosis = 0.593762...
  • W: Wigner Halbkreis-Vertrieb, blaue Kurve, Übermaß kurtosis = 1
  • U: Rechteckverteilung, Purpurrot-Kurve (gezeigt für die Klarheit als ein Rechteck in beiden Images), Übermaß kurtosis = 1.2.

Bemerken Sie, dass in diesen Fällen die platykurtic Dichten Unterstützung begrenzt haben, wohingegen die Dichten mit dem positiven oder Nullübermaß kurtosis auf der ganzen echten Linie unterstützt werden.

Dort bestehen Sie platykurtic Dichten mit der unendlichen Unterstützung,

  • z.B, Exponentialmacht-Vertrieb mit dem genug großen Gestalt-Parameter b

und dort bestehen Sie leptokurtic Dichten mit der begrenzten Unterstützung.

  • z.B, ein Vertrieb, der zwischen 3 und 0.3, zwischen 0.3 und 0.3, und zwischen 0.3 und 3, mit derselben Dichte in (3, 0.3) und (0.3, 3) Zwischenräume, aber mit 20mal mehr Dichte in (0.3, 0.3) Zwischenraum gleichförmig
ist

Probe kurtosis

Weil eine Probe von n das Beispielübermaß kurtosis schätzt, ist

:

wo M der vierte Beispielmoment über das bösartige ist, ist M der zweite Beispielmoment über das bösartige (d. h. die Beispielabweichung), x ist der Ich-Wert, und ist die bösartige Probe.

Die Abweichung der Probe kurtosis einer Probe der Größe n von der Normalverteilung ist

:

Eine ungefähre Alternative ist 24/n, aber das ist für kleine Proben ungenau.

Vorkalkulatoren der Bevölkerung kurtosis

In Anbetracht einer Teilmenge von Proben von einer Bevölkerung ist das Beispielübermaß kurtosis oben ein voreingenommener Vorkalkulator des Bevölkerungsübermaßes kurtosis. Der übliche Vorkalkulator des Bevölkerungsübermaßes kurtosis (verwendet in DAP/SAS, Minietikett, PSPP/SPSS, und ragen Hervor, aber nicht durch BMDP), ist G, definiert wie folgt:

:

\begin {richten }\aus

G_2 & = \frac {k_4} {k_ {2} ^2} \\

& = \frac {n^2 \, (n+1) \, m_4 - 3 \, (n-1) \, m_ {2} ^2)} {(n-1) \, (n-2) \, (n-3)} \; \frac {(n-1) ^2} {n^2 \, m_ {2} ^2} \\

& = \frac {n-1} {(n-2) \, (n-3)} \left ((n+1) \, \frac {m_4} {m_ {2} ^2} - 3 \, (n-1) \right) \\

& = \frac {n-1} {(n-2) (n-3)} \left ((n+1) \, g_2 + 6 \right) \\

& = \frac {(n+1) \, n \, (n-1)} {(n-2) \, (n-3)} \; \frac {\\sum_ {i=1} ^n (x_i - \bar {x}) ^4} {\\ist (\sum_ {i=1} ^n (x_i - \bar {x}) ^2\right) ^2} - 3 \,\frac {(n-1) ^2} {(n-2) \, (n-3)} \\abgereist

& = \frac {(n+1) \, n} {(n-1) \, (n-2) \, (n-3)} \; \frac {\\sum_ {i=1} ^n (x_i - \bar {x}) ^4} {k_ {2}} - 3 \,\frac {(n-1) ^2} {(n-2) (n-3) }\

\end {richten }\aus

</Mathematik>

wo k der einzigartige symmetrische unvoreingenommene Vorkalkulator des vierten cumulant ist, ist k die unvoreingenommene Schätzung des zweiten cumulant (identisch zur unvoreingenommenen Schätzung der Beispielabweichung), M ist der vierte Beispielmoment über das bösartige, M ist der zweite Beispielmoment über das bösartige, x ist der Ich-Wert, und ist die bösartige Probe. Leider, wird selbst allgemein beeinflusst. Für die Normalverteilung ist es unvoreingenommen.

Für rechenbetont effiziente Weisen, die Probe zu berechnen, sehen kurtosis Algorithmen, um höherwertige Statistik zu berechnen.

Anwendungen

Der K-Squared-Test von D'Agostino ist ein Normalitätstest der Güte-passend, der auf einer Kombination der Beispielschiefe und Probe kurtosis gestützt ist, wie der Jarque-Bera-Test auf die Normalität ist.

Andere Maßnahmen von kurtosis

Ein verschiedenes Maß von "kurtosis", der vom "peakedness" eines Vertriebs ist, wird durch das Verwenden von L-Momenten statt der gewöhnlichen Momente zur Verfügung gestellt.

Siehe auch

  • Kurtosis riskieren

Weiterführende Literatur

Außenverbindungen


Kentucky / Kon Ichikawa
Impressum & Datenschutz