Belastet bösartig

Das belastete bösartige ist einer bösartigen Arithmetik ähnlich (der allgemeinste Typ des Durchschnitts), wo statt jedes der Datenpunkte, die ebenso zum Enddurchschnitt beitragen, einige Datenpunkte mehr beitragen als andere. Der Begriff von belasteten Mittelspielen eine Rolle in der beschreibenden Statistik und kommt auch in einer allgemeineren Form in mehreren anderen Gebieten der Mathematik vor.

Wenn alle Gewichte gleich sind, dann ist das belastete bösartige dasselbe als die bösartige Arithmetik. Während sich belastete Mittel allgemein auf eine ähnliche Mode zu arithmetischen Mitteln benehmen, haben sie wirklich einige gegenintuitive Eigenschaften, wie gewonnen, zum Beispiel im Paradox von Simpson.

Der Begriff gewogener Mittelwert bezieht sich gewöhnlich auf eine belastete Arithmetik bösartige aber beschwerte Versionen anderer Mittel können auch, wie das belastete geometrische Mittel und die belastete bösartige Harmonische berechnet werden.

Beispiel

In Anbetracht zwei Schulklassen, ein mit 20 Studenten, und ein mit 30 Studenten, waren die Ränge in jeder Klasse auf einem Test:

:Morning-Klasse = 62, 67, 71, 74, 76, 77, 78, 79, 79, 80, 80, 81, 81, 82, 83, 84, 86, 89, 93, 98

:Afternoon-Klasse = 81, 82, 83, 84, 85, 86, 87, 87, 88, 88, 89, 89, 89, 90, 90, 90, 90, 91, 91, 91, 92, 92, 93, 93, 94, 95, 96, 97, 98, 99

Der gerade Durchschnitt für die Morgenklasse ist 80, und der gerade Durchschnitt der Nachmittag-Klasse ist 90. Der gerade Durchschnitt 80 und 90 ist 85, die bösartigen von den zwei Klassenmitteln. Jedoch ist das für den Unterschied in der Zahl von Studenten in jeder Klasse nicht verantwortlich, und der Wert von 85 widerspiegelt den durchschnittlichen Studentenrang (unabhängig der Klasse) nicht. Der durchschnittliche Studentenrang kann durch die Mittelwertbildung aller Ränge ohne Rücksicht auf Klassen erhalten werden:

:

\bar {x} = \frac {4300} {50} = 86.

</Mathematik>

Oder das kann durch die Gewichtung der Klassenmittel durch die Zahl von Studenten in jeder Klasse vollbracht werden (ein belastetes bösartige von den Klassenmitteln verwendend):

:

\bar {x} = \frac {(20) 80 + (30) 90} {20 + 30} = 86.

</Mathematik>

So macht das belastete bösartige es möglich, den durchschnittlichen Studentenrang im Fall zu finden, wo nur die Klassenmittel und die Zahl von Studenten in jeder Klasse verfügbar sind.

Mathematische Definition

Formell, der belastete bösartige von einem nichtleeren Satz von Daten

:

mit nichtnegativen Gewichten

:

ist die Menge

:</Mathematik>

was bedeutet:

:

\bar {x} = \frac {w_1 x_1 + w_2 x_2 + \cdots + w_n x_n} {w_1 + w_2 + \cdots + w_n}.

</Mathematik>

Deshalb tragen Datenelemente mit einem hohen Gewicht mehr zum belasteten bösartigen bei, als Elemente mit einem niedrigen Gewicht tun. Die Gewichte können nicht negativ sein. Einige können Null, aber nicht sie alle sein (da der Abteilung durch die Null nicht erlaubt wird).

Die Formeln werden vereinfacht, wenn die Gewichte solch normalisiert werden, dass sie zu summieren, d. h. Für solche normalisierten Gewichte ist das belastete bösartige einfach

.

Das allgemeine bösartige ist ein spezieller Fall des belasteten bösartigen, wo alle Daten gleiche Gewichte haben. Wenn die Gewichte dann normalisiert werden

Länge-belastet bösartig

Das wird verwendet, für eine Ansprechvariable zu beschweren, die auf seiner Abhängigkeit von, eine Entfernungsvariable gestützt ist.

:

\bar {y} = \frac {y_2 x_2 - y_1 x_1} {x_2 - x_1 }\

</Mathematik>

Konvexe Kombination

Da nur die Verhältnisgewichte wichtig sind, kann irgendwelcher beschwert bösartig mit Koeffizienten diese Summe an einer ausgedrückt werden. Solch eine geradlinige Kombination wird eine konvexe Kombination genannt.

Mit dem vorherigen Beispiel würden wir den folgenden bekommen:

:

\frac {20} {20 + 30} = 0.4 \,

</Mathematik>:

\frac {30} {20 + 30} = 0.6 \,

</Mathematik>:

\bar {x} = \frac {(0.4) 80 + (0.6) 90} {0.4 + 0.6} = 86.

</Mathematik>

Das vereinfacht zu:

:

\bar {x} = (0.4) 80 + (0.6) 90 = 86.

</Mathematik>

Statistische Eigenschaften

Die belastete Probe bösartig, mit normalisierten Gewichten (Gewichte, die zu einem resümieren), ist selbst eine zufällige Variable. Sein erwarteter Wert und Standardabweichung sind mit den erwarteten Werten und Standardabweichungen der Beobachtungen wie folgt verbunden.

Wenn die Beobachtungen Werte erwartet haben

:

dann hat die belastete bösartige Probe Erwartung

:

Besonders, wenn die Erwartungen aller Beobachtungen gleich sind, dann wird die Erwartung der belasteten bösartigen Probe dasselbe, sein

:

Für unkorrelierte Beobachtungen mit Standardabweichungen hat die belastete bösartige Probe Standardabweichung

:

Folglich, wenn die Standardabweichungen aller Beobachtungen gleich sind, wird die belastete bösartige Probe Standardabweichung haben. Hier ist die Menge

:

solch dass. Es erreicht seinen minimalen Wert für gleiche Gewichte und sein Maximum, wenn alle Gewichte außer man Null ist. Im ehemaligen Fall haben wir, der mit dem Hauptgrenzwertsatz verbunden ist.

Sich mit Abweichung befassend

Für die belastete bösartige von einer Liste von Daten, für die jedes Element aus einem verschiedenen Wahrscheinlichkeitsvertrieb mit der bekannten Abweichung kommt, wird durch eine mögliche Wahl für die Gewichte gegeben:

:

w_i = \frac {1} {\\sigma_i^2}.

</Mathematik>

Das belastete bösartige ist in diesem Fall:

:

\bar {x} = \frac {\sum_ {i=1} ^n (x_i/{\\sigma_i} ^2)} {\\sum_ {i=1} ^n (1/{\\sigma_i} ^2)},

</Mathematik>

und die Abweichung des belasteten bösartigen ist:

:

\sigma_ {\\Bar {x}} ^2 = \frac {1} {\\sum_ {i=1} ^n (1/{\\sigma_i} ^2)},

</Mathematik>

der zu, wenn der ganze abnimmt

Die Bedeutung dieser Wahl besteht darin, dass das bösartig beschwert hat, ist der maximale Wahrscheinlichkeitsvorkalkulator des bösartigen vom Wahrscheinlichkeitsvertrieb unter der Annahme, dass sie unabhängig und normalerweise mit bösartigem demselben verteilt sind.

Das Korrigieren für über - oder unter der Streuung

Belastete Mittel werden normalerweise verwendet, um die belasteten bösartigen von experimentellen Angaben, aber nicht theoretisch erzeugte Daten zu finden. In diesem Fall wird es etwas Fehler in der Abweichung jedes Datenpunkts geben. Normalerweise experimentelle Fehler können wegen des Experimentators unterschätzt werden, der nicht alle Quellen des Fehlers im Rechnen der Abweichung jedes Datenpunkts in Betracht zieht. In diesem Ereignis muss die Abweichung im belasteten bösartigen korrigiert werden, um für die Tatsache verantwortlich zu sein, die zu groß ist. Die Korrektur, die gemacht werden muss, ist

:

wo durch die Zahl von Graden der Freiheit, in diesem Fall n &minus geteilt wird; 1. Das gibt die Abweichung im belasteten bösartigen als:

:

Belastete Beispielabweichung

Normalerweise, wenn ein bösartiger berechnet wird, ist es wichtig, die Abweichung und Standardabweichung darüber bösartig zu wissen. Wenn ein belasteter bösartiger verwendet wird, ist die Abweichung der belasteten Probe von der Abweichung der unbelasteten Probe verschieden. Die voreingenommene belastete Beispielabweichung wird ähnlich zur normalen voreingenommenen Beispielabweichung definiert:

:

\sigma^2\= \frac {

\sum_ {i=1} ^N {\\ist (x_i - \mu\right) ^2} abgereist

} {

N

}\</Mathematik>:

\sigma^2_\mathrm {beschwert} = \frac {\\sum_ {i=1} ^N w_i \left (x_i - \mu^*\right) ^2} {V_1 }\

</Mathematik>

wo, der 1 für normalisierte Gewichte ist.

Für kleine Proben ist es üblich, um einen unvoreingenommenen Vorkalkulatoren für die Bevölkerungsabweichung zu verwenden. In normalen unbelasteten Proben wird der N im Nenner (entsprechend der Beispielgröße) zu N &minus geändert; 1. Während das in unbelasteten Proben einfach ist, ist es nicht aufrichtig, wenn die Probe beschwert wird. Durch den unvoreingenommenen Vorkalkulatoren einer belasteten Bevölkerungsabweichung (wird das Annehmen von jedem von einem Vertrieb von Gaussian mit der Abweichung gezogen), wird gegeben:

:

s^2\= \frac {V_1} {V_1^2-V_2} \sum_ {i=1} ^N w_i \left (x_i - \mu^*\right) ^2,

</Mathematik>

wo, wie eingeführt, vorher.

Die Grade der Freiheit der belasteten, unvoreingenommenen Beispielabweichung ändern sich entsprechend von N &minus; 1 unten zu 0.

Die Standardabweichung ist einfach die Quadratwurzel der Abweichung oben.

Wenn ganzer, gezogen von demselben Vertrieb und den Gewichten der ganzen Zahl zu sein, Frequenz des Ereignisses in der Probe anzeigt, dann wird dem unvoreingenommenen Vorkalkulatoren der belasteten Bevölkerungsabweichung durch gegeben

:

s^2\= \frac {1} {V_1 - 1} \sum_ {i=1} ^N w_i \left (x_i - \mu^*\right) ^2,

</Mathematik>

Wenn alle einzigartig sind, dann zählen Zählungen die Zahl von einzigartigen Werten, und die Zahl von Proben auf.

Zum Beispiel, wenn Werte von demselben Vertrieb gezogen werden, dann können wir diesen Satz als eine unbelastete Probe behandeln, oder wir können es als die belastete Probe mit entsprechenden Gewichten behandeln, und wir sollten dieselben Ergebnisse bekommen.

Vektor-geschätzte Schätzungen

Der obengenannte verallgemeinert leicht zum Fall, die bösartigen von Vektor-geschätzten Schätzungen zu nehmen. Zum Beispiel können Schätzungen der Position auf einem Flugzeug weniger Gewissheit in einer Richtung haben als ein anderer. Als im Skalarfall können die belasteten bösartigen von vielfachen Schätzungen eine maximale Wahrscheinlichkeitsschätzung zur Verfügung stellen. Wir ersetzen einfach durch die Kovarianz-Matrix:

:

W_i = \Sigma_i^ {-1}.

</Mathematik>Das belastete bösartige ist in diesem Fall::

\bar {\\mathbf {x}} = \left (\sum_ {i=1} ^n \Sigma_i^ {-1 }\\Recht) ^ {-1 }\\ist (\sum_ {i=1} ^n \Sigma_i^ {-1} \mathbf {x} _i\right), abgereist

</Mathematik>

und die Kovarianz des belasteten bösartigen ist:

:

\Sigma_ {\\Bar {\\mathbf {x}}} = \left (\sum_ {i=1} ^n \Sigma_i^ {-1 }\\Recht) ^ {-1},

</Mathematik>

Denken Sie zum Beispiel den belasteten bösartigen vom Punkt [1 0] mit der hohen Abweichung im zweiten Bestandteil und [0 1] mit der hohen Abweichung im ersten Bestandteil. Dann

::

dann ist das belastete bösartige:

:::

der Sinn hat: [1 0] ist Schätzung im zweiten Bestandteil und [0 1] "entgegenkommend" Schätzung ist im ersten Bestandteil entgegenkommend, so ist das belastete bösartige fast [1 1].

Erklärung von Korrelationen

Im allgemeinen Fall, nehmen Sie an, dass, die Kovarianz-Matrix Verbindung der Mengen ist, das allgemeine bösartige ist, das zu schätzen ist, und die Designmatrix [1..., 1] (von der Länge) ist. Der Lehrsatz von Gauss-Markov stellt fest, dass durch die Schätzung der minimalen habenden Mittelabweichung gegeben wird:

:und:

Das Verringern der Kraft von Wechselwirkungen

Betrachten Sie die Zeitreihe einer unabhängigen Variable und einer abhängigen Variable mit in getrennten Zeiten als probierten Beobachtungen. In vielen allgemeinen Situationen hängt der Wert in der Zeit nicht nur von sondern auch auf seinen vorigen Werten ab. Allgemein nimmt die Kraft dieser Abhängigkeit als die Trennung von Beobachtungen in Zeitzunahmen ab. Um diese Situation zu modellieren, kann man die unabhängige Variable durch sein für eine Fenstergröße bösartiges Schieben ersetzen.

:

z_k =\sum_ {i=1} ^m w_i x_ {k+1-i}.

</Mathematik>

Exponential abnehmende Gewichte

Im Drehbuch, das in der vorherigen Abteilung am häufigsten beschrieben ist, folgt die Abnahme in der Wechselwirkungskraft einem negativen Exponentialgesetz. Wenn die Beobachtungen in gleich weit entfernten Zeiten probiert werden, dann ist Exponentialabnahme gleichwertig, um durch einen unveränderlichen Bruchteil abzunehmen

:

wo die Summe der unnormalisierten Gewichte ist. In diesem Fall ist einfach

:

sich für große Werte dessen nähernd.

Die unveränderliche Dämpfung muss der wirklichen Abnahme der Wechselwirkungskraft entsprechen. Wenn das von theoretischen Rücksichten nicht bestimmt werden kann, dann sind die folgenden Eigenschaften exponential abnehmender Gewichte im Bilden einer passenden Wahl nützlich: Am Schritt ist das Gewicht ungefähr, das Schwanz-Gebiet der Wert, das Hauptgebiet gleich. Das Schwanz-Gebiet am Schritt ist. Wo in erster Linie die nächste Beobachtungssache und die Wirkung der restlichen Beobachtungen sicher ignoriert werden können, dann solch zu wählen, dass das Schwanz-Gebiet genug klein ist.

Gewogene Mittelwerte von Funktionen

Das Konzept des gewogenen Mittelwertes kann zu Funktionen erweitert werden. Gewogene Mittelwerte von Funktionen spielen eine wichtige Rolle in den Systemen der belasteten unterschiedlichen und Integralrechnung.

Siehe auch

Referenzen

Weiterführende Literatur

  • Bevington, Philip. Die Datenverminderung und Fehleranalyse für die physischen Wissenschaften.

Links


William Crossing / W. H. Auden
Impressum & Datenschutz