Vorkalkulator

In der Statistik ist ein Vorkalkulator eine Regel, für eine Schätzung einer gegebenen auf beobachteten Daten gestützten Menge zu berechnen: So sind die Regel und sein Ergebnis (die Schätzung) bemerkenswert.

Es gibt Punkt und Zwischenraum-Vorkalkulatoren. Die Punkt-Vorkalkulatoren geben einzeln geschätzte Ergebnisse nach, obwohl das die Möglichkeit von einzelnen Vektor-geschätzten Ergebnissen und Ergebnissen einschließt, die als eine einzelne Funktion ausgedrückt werden können. Das ist im Gegensatz zu einem Zwischenraum-Vorkalkulatoren, wo das Ergebnis eine Reihe von plausiblen Werten (oder Vektoren oder Funktionen) sein würde.

Statistische Theorie ist mit den Eigenschaften von Vorkalkulatoren beschäftigt; d. h. mit dem Definieren von Eigenschaften, die verwendet werden können, um verschiedene Vorkalkulatoren (verschiedene Regeln zu vergleichen, um Schätzungen zu schaffen), für dieselbe Menge, die auf denselben Daten gestützt ist. Solche Eigenschaften können verwendet werden, um die besten Regeln zu bestimmen, unter gegebenen Verhältnissen zu verwenden. Jedoch, in der robusten Statistik, setzt statistische Theorie fort, das Gleichgewicht dazwischen zu denken, gute Eigenschaften zu haben, wenn dicht definierte Annahmen halten, und weniger gute Eigenschaften zu haben, die unter breiteren Bedingungen halten.

Hintergrund

Ein "Vorkalkulator" oder "Punkt-Schätzung" sind ein statistischer (d. h. eine Funktion der Daten), der verwendet wird, um den Wert eines unbekannten Parameters in einem statistischen Modell abzuleiten. Der Parameter, der wird schätzt, wird manchmal den estimand genannt. Es kann irgendein (in parametrischen und halbparametrischen Modellen) endlich-dimensional, oder (halbnichtparametrische und nichtparametrische Modelle) unendlich-dimensional sein. Wenn der Parameter θ dann angezeigt wird, wird der Vorkalkulator normalerweise geschrieben, indem er einen "Hut" über das Symbol hinzufügt:. Eine Funktion der Daten seiend, ist der Vorkalkulator selbst eine zufällige Variable; eine besondere Verwirklichung dieser zufälligen Variable wird die "Schätzung" genannt. Manchmal werden die Wörter "Vorkalkulator" und "Schätzung" austauschbar verwendet.

Die Definition legt eigentlich keine Beschränkungen, auf denen Funktionen der Daten die "Vorkalkulatoren" genannt werden können. Der Reiz von verschiedenen Vorkalkulatoren kann durch das Schauen auf ihre Eigenschaften, wie Unbefangenheit, Mittelquadratfehler, Konsistenz, asymptotischer Vertrieb usw. beurteilt werden. Der Aufbau und Vergleich von Vorkalkulatoren sind die Themen der Bewertungstheorie. Im Zusammenhang der Entscheidungstheorie ist ein Vorkalkulator ein Typ der Entscheidungsregel, und seine Leistung kann durch den Gebrauch von Verlust-Funktionen bewertet werden.

Wenn das Wort "Vorkalkulator" ohne einen Qualifikator verwendet wird, bezieht es sich gewöhnlich auf die Punktschätzung. Die Schätzung ist in diesem Fall ein einzelner Punkt im Parameter-Raum. Andere Typen von Vorkalkulatoren bestehen auch: Zwischenraum-Vorkalkulatoren, wo die Schätzungen Teilmengen des Parameter-Raums sind.

Das Problem der Dichte-Bewertung entsteht in zwei Anwendungen. Erstens, im Schätzen der Wahrscheinlichkeitsdichte-Funktionen von zufälligen Variablen und zweitens im Schätzen der geisterhaften Dichte-Funktion einer Zeitreihe. In diesen Problemen sind die Schätzungen Funktionen, von denen gedacht werden kann, weil Punkt in einem unendlichen dimensionalen Raum schätzt, und es entsprechende Zwischenraum-Bewertungsprobleme gibt.

Definition

Nehmen Sie an, dass es einen festen Parameter gibt, der geschätzt werden muss. Dann ist ein "Vorkalkulator" eine Funktion, die den Beispielraum zu einer Reihe von Beispielschätzungen kartografisch darstellt. Ein Vorkalkulator dessen wird gewöhnlich durch das Symbol angezeigt. Es ist häufig günstig, die Theorie mit der Algebra von zufälligen Variablen auszudrücken: So, wenn X verwendet wird, um eine zufällige Variable entsprechend den beobachteten Daten anzuzeigen, der Vorkalkulator (selbst hat als eine zufällige Variable behandelt) wird als eine Funktion dieser zufälligen Variable symbolisiert. Die Schätzung für eine Einzelheit hat bemerkt, dass dataset (d. h. für X=x) dann ist, der ein fester Wert ist. Häufig wird eine abgekürzte Notation verwendet, in dem direkt als eine zufällige Variable interpretiert wird, aber das kann Verwirrung verursachen.

Gemessene Eigenschaften

Die folgenden Definitionen und Attribute gelten:

Fehler

Für eine gegebene Probe wird der "Fehler" des Vorkalkulatoren als definiert

:

wo der Parameter ist, der wird schätzt. Bemerken Sie, dass der Fehler, e, nicht nur vom Vorkalkulatoren (die Bewertungsformel oder das Verfahren), aber auf der Probe abhängt.

Karierter Mittelfehler

Der karierte Mittelfehler dessen wird als der erwartete Wert (gewogener Mittelwert der Wahrscheinlichkeit, über alle Proben) von den karierten Fehlern definiert; das, ist

:

Es wird verwendet, um anzuzeigen, wie weit, durchschnittlich, die Sammlung von Schätzungen vom einzelnen Parameter ist, der wird schätzt. Denken Sie die folgende Analogie. Nehmen Sie an, dass der Parameter das Bullauge eines Ziels ist, ist der Vorkalkulator der Prozess von schießenden Pfeilen am Ziel, und die individuellen Pfeile sind Schätzungen (Proben). Dann bedeutet hoher MSE, dass die durchschnittliche Entfernung der Pfeile vom Bullauge hoch ist, und niedriger MSE bedeutet, dass die durchschnittliche Entfernung vom Bullauge niedrig ist. Die Pfeile können oder dürfen nicht gebündelt werden. Zum Beispiel, selbst wenn alle Pfeile denselben Punkt schlagen, noch äußerst das Ziel verfehlen, ist der MSE noch relativ groß., Bemerken Sie jedoch, dass, wenn der MSE relativ niedrig ist, dann werden die Pfeile wahrscheinlich höher gebündelt (als hoch verstreut).

Stichprobenerhebung der Abweichung

Für eine gegebene Probe wird die ausfallende Abweichung des Vorkalkulatoren als definiert

:

wo der erwartete Wert des Vorkalkulatoren ist. Bemerken Sie, dass die ausfallende Abweichung, d, nicht nur vom Vorkalkulatoren, aber von der Probe abhängt.

Abweichung

Die Abweichung dessen ist einfach der erwartete Wert der karierten ausfallenden Abweichungen; d. h. Es wird verwendet, um anzuzeigen, wie weit, durchschnittlich, die Sammlung von Schätzungen vom erwarteten Wert der Schätzungen ist. Bemerken Sie den Unterschied zwischen MSE und Abweichung. Wenn der Parameter das Bullauge eines Ziels ist, und die Pfeile Schätzungen sind, dann bedeutet eine relativ hohe Abweichung, dass die Pfeile verstreut werden, und eine relativ niedrige Abweichung bedeutet, dass die Pfeile gebündelt werden. Einige Dinge zu bemerken: Selbst wenn die Abweichung niedrig ist, kann die Traube von Pfeilen noch weit außer Ziel sein, und selbst wenn die Abweichung hoch ist, kann die weitschweifige Sammlung von Pfeilen noch unvoreingenommen sein. Bemerken Sie schließlich dass, selbst wenn alle Pfeile äußerst das Ziel verfehlen, wenn sie dennoch der ganze Erfolg derselbe Punkt, die Abweichung Null ist.

Neigung

Die Neigung dessen wird als definiert. Es ist die Entfernung zwischen dem Durchschnitt der Sammlung von Schätzungen und dem einzelnen Parameter, der wird schätzt. Es ist auch der erwartete Wert des Fehlers seitdem. Wenn der Parameter das Bullauge eines Ziels ist, und die Pfeile Schätzungen sind, dann bedeutet ein relativ hoher absoluter Wert für die Neigung, dass die durchschnittliche Position der Pfeile außer Ziel ist, und eine relativ niedrige absolute Neigung bedeutet, dass die durchschnittliche Position der Pfeile auf dem Ziel ist. Sie können verstreut werden oder können gebündelt werden. Die Beziehung zwischen Neigung und Abweichung ist der Beziehung zwischen Genauigkeit und Präzision analog.

Unvoreingenommener

Der Vorkalkulator ist ein unvoreingenommener Vorkalkulator wenn und nur wenn. Bemerken Sie, dass Neigung ein Eigentum des Vorkalkulatoren ist, nicht der Schätzung. Häufig beziehen sich Leute auf eine "voreingenommene Schätzung" oder eine "unvoreingenommene Schätzung," aber sie sprechen wirklich über eine "Schätzung von einem voreingenommenen Vorkalkulatoren," oder eine "Schätzung von einem unvoreingenommenen Vorkalkulatoren." Außerdem verwechseln Leute häufig den "Fehler" einer einzelnen Schätzung mit der "Neigung" eines Vorkalkulatoren. Gerade, weil der Fehler für eine Schätzung groß ist, bedeutet nicht, dass der Vorkalkulator beeinflusst wird. Tatsächlich, selbst wenn alle Schätzungen astronomische absolute Werte für ihre Fehler haben, wenn der erwartete Wert des Fehlers Null ist, ist der Vorkalkulator unvoreingenommen. Außerdem gerade, weil ein Vorkalkulator beeinflusst wird, schließt den Fehler einer Schätzung davon nicht aus, Null zu sein (wir können glücklich geworden sein). Die ideale Situation soll natürlich einen unvoreingenommenen Vorkalkulatoren mit der niedrigen Abweichung haben, und auch versuchen, die Zahl von Proben zu beschränken, wo der Fehler äußerst ist (d. h. haben Sie wenige outliers). Und doch ist Unbefangenheit nicht notwendig. Häufig, wenn gerade eine kleine Neigung erlaubt wird, dann kann ein Vorkalkulator mit tiefer MSE und/oder weniger outlier Beispielschätzungen gefunden werden.

Eine Alternative zur Version von "unvoreingenommenen" oben, ist "mittelunvoreingenommen", wo die Mittellinie des Vertriebs von Schätzungen mit dem wahren Wert übereinstimmt; so im langen Lauf wird Hälfte der Schätzungen zu niedrig sein und Hälfte zu hoch. Während das sofort nur für skalargeschätzte Vorkalkulatoren gilt, kann es zu jedem Maß der Haupttendenz eines Vertriebs erweitert werden: Sieh mittelunvoreingenommene Vorkalkulatoren.

Beziehungen

  • Die MSE, Abweichung, und Neigung, sind verbunden: d. h. karierter Mittelfehler = Abweichung + Quadrat der Neigung. Insbesondere für einen unvoreingenommenen Vorkalkulatoren kommt die Abweichung dem MSE gleich.
  • Die Standardabweichung eines Vorkalkulatoren von θ (die Quadratwurzel der Abweichung), oder eine Schätzung der Standardabweichung eines Vorkalkulatoren von θ, wird den Standardfehler von θ genannt.

Verhaltenseigenschaften

Konsistenz

Eine konsequente Folge von Vorkalkulatoren ist eine Folge von Vorkalkulatoren, die in der Wahrscheinlichkeit zur Menge zusammenlaufen, die wird schätzt, als der Index (gewöhnlich die Beispielgröße) ohne bestimmten wächst. Mit anderen Worten vergrößert die Erhöhung der Beispielgröße die Wahrscheinlichkeit des Vorkalkulatoren, der dem Parameter der Grundgesamtheit nah ist.

Mathematisch ist eine Folge von Vorkalkulatoren} ein konsequenter Vorkalkulator für den Parameter θ, wenn und nur wenn, für alle, egal wie klein wir haben

:

\lim_ {n\to\infty }\\Pr\left\{\

\left|

t_n-\theta\right |

Die Konsistenz, die oben definiert ist, kann schwache Konsistenz genannt werden. Die Folge entspricht stark, wenn sie fast sicher zum wahren Wert zusammenläuft.

Ein Vorkalkulator, der zu einem Vielfache eines Parameters zusammenläuft, kann in einen konsequenten Vorkalkulatoren gemacht werden, indem er den Vorkalkulatoren durch einen Einteilungsfaktor, nämlich der wahre durch den asymptotischen Wert des Vorkalkulatoren geteilte Wert multipliziert. Das kommt oft nach der Bewertung von Skala-Rahmen durch Maßnahmen der statistischen Streuung vor.

Asymptotische Normalität

Ein asymptotisch normaler Vorkalkulator ist ein konsequenter Vorkalkulator, dessen sich Vertrieb um den wahren Parameter θ einer Normalverteilung mit der Standardabweichung nähert, die im Verhältnis dazu zurückweicht, als die Beispielgröße n wächst. Mit, um Konvergenz im Vertrieb anzuzeigen, ist t wenn asymptotisch normal

:

für ungefähr V, der die asymptotische Abweichung des Vorkalkulatoren genannt wird.

Der Hauptgrenzwertsatz bezieht asymptotische Normalität der als ein Vorkalkulator des wahren bösartigen bösartigen Probe ein.

Mehr allgemein sind maximale Wahrscheinlichkeitsvorkalkulatoren unter ziemlich schwachen Regelmäßigkeitsbedingungen asymptotisch normal — sieh die asymptotics Abteilung des maximalen Wahrscheinlichkeitsartikels. Jedoch sind nicht alle Vorkalkulatoren, die einfachsten Beispiele asymptotisch normal, die Fall sind, wo der wahre Wert eines Parameters in der Grenze des zulässigen Parameter-Gebiets liegt.

Leistungsfähigkeit

Zwei natürlich wünschenswerte Eigenschaften von Vorkalkulatoren sind für sie, um unvoreingenommen zu sein und minimalen karierten Mittelfehler (MSE) zu haben. Diese können im Allgemeinen beide gleichzeitig nicht zufrieden sein: Ein voreingenommener Vorkalkulator kann niedrigeren karierten Mittelfehler (MSE) haben als jeder unvoreingenommene Vorkalkulator: Trotz, Neigung zu haben, kann die Vorkalkulator-Abweichung genug kleiner sein als dieser jedes unvoreingenommenen Vorkalkulatoren, und es kann vorzuziehend sein, trotz der Neigung zu verwenden; sieh Vorkalkulator-Neigung.

Unter unvoreingenommenen Vorkalkulatoren, dort besteht häufig ein mit der niedrigsten Abweichung, genannt die minimale Abweichung unvoreingenommenen Vorkalkulatoren (MVUE). In einigen Fällen besteht ein unvoreingenommener effizienter Vorkalkulator, der, zusätzlich dazu die niedrigste Abweichung unter unvoreingenommenen Vorkalkulatoren zu haben, den gebundenen Cramér-Rao befriedigt, der ein Absolutes ist, tiefer hat zu Abweichung für die Statistik einer Variable gebunden.

Bezüglich solcher "besten unvoreingenommenen Vorkalkulatoren" sieh auch Cramér-Rao gebunden, Lehrsatz von Gauss-Markov, Lehrsatz von Lehmann-Scheffé, Lehrsatz von Rao-Blackwell.

Robustheit

Sieh: Robuster Vorkalkulator, Robuste Statistik

Siehe auch

  • Am besten geradliniger unvoreingenommener Vorkalkulator (BLUE)
  • Vorkalkulator von Invariant
  • Filter von Kalman
  • Kette von Markov Monte Carlo (MCMC)
  • Maximum a posteriori (MAP)
  • Methode von Momenten, verallgemeinerte Methode von Momenten
  • Minimum bedeutet quadratisch gemachten Fehler (MMSE)
  • Partikel-Filter
  • Zusammenschrumpfen-Vorkalkulator
  • Signal, das in einer Prozession geht
  • Testimator
  • Filter von Wiener
  • Wohl erzogener statistischer
  • Empfindlichkeit und Genauigkeit

Links


EAN / Smaragd
Impressum & Datenschutz