Schlussfolgerung von Bayesian

In der Statistik ist Schlussfolgerung von Bayesian eine Methode der Schlussfolgerung, in der die Regel von Buchten verwendet wird, um die Wahrscheinlichkeitsschätzung für eine Hypothese zu aktualisieren, weil zusätzliche Beweise erfahren werden. Aktualisierender Bayesian ist eine wichtige Technik überall in der Statistik, und besonders in der mathematischen Statistik: Das Ausstellen einer Abstammung von Bayesian für eine statistische Methode stellt automatisch sicher, dass die Methode sowie jede sich bewerbende Methode für einige Fälle arbeitet. Aktualisierender Bayesian ist in der dynamischen Analyse einer Folge von Daten besonders wichtig. Schlussfolgerung von Bayesian hat Anwendung in einer Reihe von Feldern einschließlich Wissenschaft, Technik, Medizin und Gesetzes gefunden.

In der Philosophie der Entscheidungstheorie ist Schlussfolgerung von Bayesian nah mit Diskussionen der subjektiven Wahrscheinlichkeit, häufig genannt "Wahrscheinlichkeit von Bayesian verbunden." Wahrscheinlichkeit von Bayesian stellt eine vernünftige Methode zur Verfügung, um Glauben zu aktualisieren; jedoch, non-Bayesian aktualisierende Regeln sind mit der Vernunft, gemäß Ian Hacking und Bas van Fraassen vereinbar.

Einführung in die Regel von Buchten

Schlussfolgerung von Bayesian leitet die spätere Wahrscheinlichkeit demzufolge zwei vorangegangener Ereignisse ab, eine vorherige Wahrscheinlichkeit und eine "Wahrscheinlichkeitsfunktion" sind auf ein Wahrscheinlichkeitsmodell für die zu beobachtenden Daten zurückzuführen gewesen. Schlussfolgerung von Bayesian schätzt die spätere Wahrscheinlichkeit gemäß der Regel von Buchten:

:

Bemerken Sie, dass, wenn sie die Regel von Buchten anwenden, die Beweise Daten entsprechen, der in der Computerwissenschaft der vorherigen Wahrscheinlichkeit nicht verwendet wurde. tritt für jede Hypothese ein, deren Wahrscheinlichkeit durch die beobachteten Daten betroffen werden kann; häufig dort bewerben sich Hypothesen, und eine Entscheidung soll basiert auf ihren Verhältniswahrscheinlichkeiten getroffen werden.

Die Interpretation der Faktoren in der Regel von Buchten ist wie folgt:

:*, das spätere, ist die Wahrscheinlichkeit darin, nachdem beobachtet wird. Das erzählt uns, was wir wissen wollen: Wie die Wahrscheinlichkeit von verschiedenen möglichen Hypothesen in Anbetracht der beobachteten Beweise sind.

:*, das vorherige, ist die Wahrscheinlichkeit darin, bevor beobachtet wird. Das zeigt jemandes vorgefassten Glauben darüber an, wie wahrscheinlich verschiedene Hypothesen sind.

:* ist die Wahrscheinlichkeit. Es zeigt an, wie wahrscheinlich es die Beweise würde beobachten sollen, die wir wirklich in Anbetracht einer besonderen Hypothese beobachtet haben: Mit anderen Worten, wie vereinbar die Beweise mit einer gegebenen Hypothese sind.

:* wird manchmal die Randwahrscheinlichkeit oder "Musterbeweise" genannt. Dieser Faktor ist dasselbe für alle möglichen Hypothesen, die betrachten werden. (Das kann durch die Tatsache gesehen werden, dass die Hypothese nirgends im Symbol unterschiedlich für alle anderen Faktoren erscheint.) Bedeutet das, dass dieser Faktor in Bestimmung der Verhältniswahrscheinlichkeiten von verschiedenen Hypothesen nicht eintritt.

Bemerken Sie, dass, was den Wert für verschiedene Werte dessen betrifft, nur die Faktoren ist und, der, sowohl im Zähler, als auch folglich zu erscheinen, die spätere Wahrscheinlichkeit zu beiden proportional ist. In Wörtern:

:The spätere Wahrscheinlichkeit einer Hypothese wird durch eine Kombination der innewohnenden Wahrscheinlichkeit einer Hypothese (das vorherige) und die Vereinbarkeit der beobachteten Beweise mit der Hypothese (die Wahrscheinlichkeit) bestimmt.

Auf eine kürzere und technische Mode:

:Posterior ist zu vorherigen Zeiten likehood proportional.

Bemerken Sie, dass die Regel von Buchten auch wie folgt geschrieben werden kann:

:

Der Faktor vertritt den Einfluss auf der Wahrscheinlichkeit dessen.

Von einer logischen Einstellung hat die Regel von Buchten sehr viel Sinn. Wenn die Beweise mit einer Hypothese nicht zusammenpassen, werde ich es kaum glauben. Andererseits, wenn ich denke, dass eine Hypothese äußerst unwahrscheinlich a priori ist, werde ich es auch kaum glauben, selbst wenn die Beweise wirklich scheinen, zusammenzupassen. Stellen Sie sich zum Beispiel vor, dass ich verschiedene Hypothesen über die Natur eines neugeborenen Babys eines Freunds von mir habe. Wenn mir Beweise in der Form eines Bildes eines blond-haarigen Baby-Mädchens geboten wird, werde ich wahrscheinlich glauben, dass das Baby tatsächlich ein Mädchen ist und wirklich tatsächlich blondes Haar hat, und weniger wahrscheinlich zu glauben, dass das Baby wirklich ein braunhaariger Junge ist, da die Beweise mit dieser Hypothese nicht übereinstimmen. Andererseits, wenn mir Beweise eines Bildes eines Baby-Hunds geboten wird, dann werde ich kaum glauben, dass das Baby wirklich ein Hund, seit meinem vorherigen Glauben an diese Hypothese ist (dass ein Mensch einen Hund zur Welt bringen kann), ist äußerst klein.

Der kritische Punkt über die Schlussfolgerung von Bayesian ist dann, dass sie eine Weise mit hohen Grundsätzen zur Verfügung stellt, neue Beweise mit dem vorherigen Glauben durch die Anwendung der Regel von Buchten zu verbinden. (Stellen Sie dem mit der frequentist Schlussfolgerung gegenüber, die sich nur auf die Beweise als Ganzes ohne Verweisung auf den vorherigen Glauben verlässt.)

Die Regel von Buchten kann wiederholend angewandt werden. D. h. nach dem Beobachten einiger Beweise kann die resultierende spätere Wahrscheinlichkeit dann als eine vorherige Wahrscheinlichkeit und eine neue spätere von neuen Beweisen geschätzte Wahrscheinlichkeit behandelt werden. Das berücksichtigt Grundsätze von Bayesian, die auf verschiedene Arten von Beweisen, ob angesehen plötzlich oder mit der Zeit anzuwenden sind. Dieses Verfahren ist genannter aktualisierender Bayesian.

Aktualisierender Bayesian

Aktualisierender Bayesian wird weit verwendet und rechenbetont günstig. Jedoch ist es nicht die einzige aktualisierende Regel, die "vernünftig" betrachtet werden könnte.

Ian Hacking hat bemerkt, dass traditionelles "holländisches Buch" Argumente aktualisierenden Bayesian nicht angegeben hat: Sie haben offen die Möglichkeit verlassen, dass non-Bayesian aktualisierende Regeln holländische Bücher vermeiden konnte. Hacking hat "Und weder das holländische Buchargument, noch irgendwelcher anderer im personalist Arsenal von Beweisen der Wahrscheinlichkeitsaxiome geschrieben, hat die dynamische Annahme zur Folge. Nicht man hat Bayesianism zur Folge. So verlangt der personalist, dass die dynamische Annahme Bayesian ist. Es ist wahr, dass in der Konsistenz ein personalist das Modell von Bayesian des Lernens aus der Erfahrung aufgeben konnte. Salz konnte seinen Geschmack verlieren."

Tatsächlich gibt es non-Bayesian aktualisierende Regeln, die auch holländische Bücher vermeiden (wie besprochen, in der Literatur auf der "Wahrscheinlichkeit kinematics" im Anschluss an die Veröffentlichung der Regierung von Richard C. Jeffrey, die die Regel von Buchten auf den Fall anwendet, wo die Beweise selbst eine Wahrscheinlichkeit http://plato.stanford.edu/entries/bayes-theorem/ zugeteilt werden). Die zusätzlichen Hypothesen mussten einzigartig verlangen, dass, wie man gehalten worden ist, aktualisierende Bayesian wesentlich gewesen sind, kompliziert und unbefriedigend.

Formelle Beschreibung der Schlussfolgerung von Bayesian

Definitionen

  • , Daten weisen im Allgemeinen hin. Das kann tatsächlich ein Vektor von Werten sein.
  • , der Parameter des Datenpunkt-Vertriebs, d. h. Das kann tatsächlich ein Vektor von Rahmen sein.
  • , der Hyperparameter des Parameters, d. h. Das kann tatsächlich ein Vektor von Hyperrahmen sein.
  • , eine Reihe von beobachteten Datenpunkten, d. h.
  • , neue Daten spitzen an, wessen Vertrieb vorausgesagt werden soll.

Schlussfolgerung von Bayesian

  • Der vorherige Vertrieb ist der Vertrieb des Parameters , bevor irgendwelche Daten beobachtet werden, d. h.
  • Der ausfallende Vertrieb ist der Vertrieb der beobachteten Daten, die durch seine Rahmen bedingt sind, d. h. Das wird auch die Wahrscheinlichkeit, besonders wenn angesehen, als eine Funktion des Parameters , manchmal schriftlich genannt.
  • Die Randwahrscheinlichkeit (hat manchmal auch die Beweise genannt), ist der Vertrieb der beobachteten Daten, die über den Parameter marginalisiert sind, d. h.
  • Der spätere Vertrieb ist der Vertrieb des Parameters , nachdem er die beobachteten Daten in Betracht gezogen hat. Das wird durch die Regel von Buchten bestimmt, die das Herz der Schlussfolgerung von Bayesian bildet:
:

Bemerken Sie, dass das in Wörtern ausgedrückt wird, weil "später zur vorherigen Zeitwahrscheinlichkeit", oder manchmal als "später = vorherige Zeitwahrscheinlichkeit, über Beweise" proportional ist.

Vorhersage von Bayesian

  • Der spätere prophetische Vertrieb ist der Vertrieb eines neuen Datenpunkts, der über das spätere marginalisiert ist:
:
  • Der vorherige prophetische Vertrieb ist der Vertrieb eines neuen Datenpunkts, der über das vorherige marginalisiert ist:
:

Theorie von Bayesian fordert auf, dass der Gebrauch des späteren prophetischen Vertriebs prophetische Schlussfolgerung tut, d. h. den Vertrieb eines neuen, unbemerkten Datenpunkts voraussagt. Nur dieser Weg ist der komplette spätere Vertrieb des verwendeten Parameters . Vergleichsweise schließt die Vorhersage in der frequentist Statistik häufig Entdeckung einer optimalen Punkt-Schätzung des Parameters — z.B durch die maximale Wahrscheinlichkeit oder das Maximum a posteriori Bewertung (KARTE) — und dann Einsteckens dieser Schätzung in die Formel für den Vertrieb eines Datenpunkts ein. Das hat den Nachteil, dass er für keine Unklarheit im Wert des Parameters verantwortlich ist, und folglich die Abweichung des prophetischen Vertriebs unterschätzen wird.

(In einigen Beispielen, frequentist Statistik kann um dieses Problem arbeiten. Zum Beispiel werden Vertrauensintervalle und Vorhersagezwischenräume in der frequentist Statistik, wenn gebaut, von einer Normalverteilung mit dem unbekannten bösartig und Abweichung mit einem T-Vertrieb eines Studenten gebaut. Das schätzt richtig die Abweichung, auf Grund dessen, dass (1) der Durchschnitt normalerweise verteilter zufälliger Variablen auch normalerweise verteilt wird; (2) hat der prophetische Vertrieb eines normalerweise verteilten Datenpunkts mit dem unbekannten bösartig und Abweichung, mit verbundenem oder uninformativem priors, einen T-Vertrieb eines Studenten. In der Bayesian Statistik, jedoch, kann der spätere prophetische Vertrieb immer genau — oder mindestens zu einem willkürlichen Niveau der Präzision bestimmt werden, wenn numerische Methoden verwendet werden.)

Bemerken Sie, dass beide Typen des prophetischen Vertriebs die Form eines zusammengesetzten Wahrscheinlichkeitsvertriebs haben (wie die Randwahrscheinlichkeit tut). Tatsächlich, wenn der vorherige Vertrieb ein verbundener vorheriger ist, und folglich der vorherige und spätere Vertrieb aus derselben Familie kommt, kann es leicht gesehen werden, dass sowohl vorheriger als auch späterer prophetischer Vertrieb auch aus derselben Familie des zusammengesetzten Vertriebs kommt. Der einzige Unterschied ist, dass der spätere prophetische Vertrieb die aktualisierten Werte der Hyperrahmen verwendet (Verwendung der Aktualisierungsregeln von Bayesian, die im verbundenen vorherigen Artikel gegeben sind), während der vorherige prophetische Vertrieb die Werte der Hyperrahmen verwendet, die im vorherigen Vertrieb erscheinen.

Schlussfolgerung über exklusive und erschöpfende Möglichkeiten

Wenn Beweise gleichzeitig verwendet werden, um Glauben mehr als eine Reihe exklusiver und erschöpfender Vorschläge zu aktualisieren, kann von Schlussfolgerung von Bayesian als folgend diesem Glaube-Vertrieb als Ganzes gedacht werden.

Allgemeine Formulierung

Nehmen Sie an, dass ein Prozess unabhängige und identisch verteilte Ereignisse erzeugt, aber der Wahrscheinlichkeitsvertrieb ist unbekannt. Lassen Sie den Ereignis-Raum den aktuellen Staat des Glaubens für diesen Prozess vertreten. Jedes Modell wird durch das Ereignis vertreten. Die bedingten Wahrscheinlichkeiten werden angegeben, um die Modelle zu definieren. ist der Grad des Glaubens daran. Vor dem ersten Interferenzschritt, ist eine Reihe anfänglicher vorheriger Wahrscheinlichkeiten. Diese müssen zu 1 resümieren, aber sind sonst willkürlich.

Nehmen Sie an, dass, wie man beobachtet, der Prozess erzeugt. Für jeden wird das vorherige zum späteren aktualisiert. Vom Lehrsatz von Buchten:

:

Nach der Beobachtung von weiteren Beweisen kann dieses Verfahren wiederholt werden.

Vielfache Beobachtungen

Für eine Reihe unabhängiger und identisch verteilter Beobachtungen kann es gezeigt werden, dass die wiederholte Anwendung des obengenannten zu gleichwertig

ist:Wo:

Das kann verwendet werden, um praktische Berechnungen zu optimieren.

Parametrische Formulierung

Durch das Parametrisieren des Raums von Modellen kann der Glaube an alle Modelle in einem Einzelschritt aktualisiert werden. Vom Vertrieb des Glaubens über den Musterraum kann dann als ein Vertrieb des Glaubens über den Parameter-Raum gedacht werden. Der Vertrieb in dieser Abteilung wird so dauernd, vertreten durch Wahrscheinlichkeitsdichten ausgedrückt, wie das die übliche Situation ist. Die Technik ist jedoch auf den getrennten Vertrieb ebenso anwendbar.

Lassen Sie den Vektoren den Parameter-Raum abmessen. Lassen Sie den anfänglichen vorherigen Vertrieb über sein, wo eine Reihe von Rahmen zum vorherigen selbst oder Hyperrahmen ist. Lassen Sie, eine Reihe unabhängiger und identisch verteilter Ereignis-Beobachtungen zu sein, wo alle bezüglich einiger verteilt werden. Der Lehrsatz von Buchten wird angewandt, um den späteren Vertrieb zu finden:

:\begin {richten }\aus

p (\mathbf {\\theta} | \mathbf {E}, \mathbf {\\Alpha}) &= \frac {p (\mathbf {E} | \mathbf {\\theta}, \mathbf {\\Alpha})} {p (\mathbf {E} | \mathbf {\\Alpha})} \cdot p (\mathbf {\\theta} | \mathbf {\\Alpha}) \\

&= \frac {p (\mathbf {E} | \mathbf {\\theta}, \mathbf {\\Alpha})} {\\int_\mathbf {\\theta} p (\mathbf {E} | \mathbf {\\theta}, \mathbf {\\Alpha}) p (\mathbf {\\theta} | \mathbf {\\Alpha}) \, d\mathbf {\\theta}} \cdot p (\mathbf {\\theta} | \mathbf {\\Alpha})

\end {richten }\aus

</Mathematik>Wo:

Mathematische Eigenschaften

Interpretation des Faktors

. D. h. wenn das Modell wahr wäre, würden die Beweise wahrscheinlicher sein, als es durch den aktuellen Staat des Glaubens vorausgesagt wird. Die Rückseite bewirbt sich um eine Abnahme im Glauben. Wenn sich der Glaube nicht ändert. D. h. die Beweise sind des Modells unabhängig. Wenn das Modell wahr wäre, würden die Beweise genau so wahrscheinlich durch den aktuellen Staat des Glaubens wie vorausgesagt.

Die Regierung von Cromwell

Wenn dann. Wenn, dann. Das kann interpretiert werden, um zu bedeuten, dass harte Überzeugungen gegen Gegenbeweise unempfindlich sind.

Der erstere folgt direkt vom Lehrsatz von Buchten. Die Letzteren können abgeleitet werden, indem er die erste Regel auf das Ereignis "nicht "im Platz dessen anwendet,",", "wenn, dann," tragend, von dem das Ergebnis sofort folgt.

Asymptotisches Verhalten von späteren

Denken Sie das Verhalten eines Glaube-Vertriebs, weil es eine Vielzahl von Zeiten mit unabhängigen und identisch verteilten Proben aktualisiert wird. Für genug nette vorherige Wahrscheinlichkeiten gibt der Lehrsatz von Bernstein von Mises das in der Grenze von unendlichen Proben, und das spätere läuft zu einem Vertrieb von Gaussian zusammen, der der Initiale unabhängig ist, die unter einigen Bedingungen erstens vorherig ist, entworfen und streng bewiesen von Joseph Leo Doob 1948, nämlich wenn die zufällige Variable in der Rücksicht einen begrenzten Wahrscheinlichkeitsraum hat. Die allgemeineren Ergebnisse wurden später vom Statistiker David A. Freedman erhalten, der in zwei Samenforschungsarbeiten 1963 und 1965 veröffentlicht hat, wenn und unter welchen Umständen das asymptotische Verhalten von späteren versichert wird. Seine 1963 Papiervergnügen, wie Doob (1949), der begrenzte Fall und kommen zu einem befriedigenden Beschluss. Jedoch, wenn die zufällige Variable einen unendlichen, aber zählbaren Wahrscheinlichkeitsraum hat (d. h. entsprechend einem Sterben mit dem Unendliche viele Gesichter) demonstriert das 1965-Papier, dass für eine dichte Teilmenge von priors der Lehrsatz von Bernstein von Mises nicht anwendbar ist. In diesem Fall gibt es fast sicher keine asymptotische Konvergenz. Später in den achtziger Jahren und neunziger Jahren haben Freedman und Persi Diaconis fortgesetzt, am Fall von unendlichen zählbaren Wahrscheinlichkeitsräumen zu arbeiten.

Um zusammenzufassen, kann es ungenügende Proben geben, um die Effekten der anfänglichen Wahl, und besonders für den großen (aber begrenzt) Systeme zu unterdrücken, die Konvergenz könnte sehr langsam sein.

Verbundener priors

In der Paramaterized-Form, wie man häufig annimmt, kommt der vorherige Vertrieb aus einer Familie des Vertriebs genannt verbundenen priors. Die Nützlichkeit eines verbundenen vorherigen ist, dass der entsprechende spätere Vertrieb in derselben Familie sein wird, und die Berechnung in der geschlossenen Form ausgedrückt werden kann.

Schätzungen von Rahmen und Vorhersagen

Es wird häufig gewünscht, um einen späteren Vertrieb zu verwenden, um einen Parameter oder Variable zu schätzen. Mehrere Methoden der Bewertung von Bayesian wählen Maße der Haupttendenz vom späteren Vertrieb aus.

Erstens, wenn der Parameter-Raum zwei Dimensionen oder mehr hat, dort besteht eine einzigartige Mittellinie des späteren Vertriebs. Für eindimensionale Probleme besteht eine einzigartige Mittellinie für praktische dauernde Probleme. Die spätere Mittellinie ist als ein robuster Vorkalkulator attraktiv.

Zweitens, wenn dort ein begrenzter bösartiger für den späteren Vertrieb besteht, dann ist das spätere bösartige eine Methode der Bewertung.

:

Drittens definiert die Einnahme eines Werts mit der größten Wahrscheinlichkeit jeden Satz von Schätzungen des Maximums a posteriori (MAP):

:

Es gibt Beispiele, wo kein Maximum erreicht wird, in welchem Fall der Satz von KARTE-Schätzungen leer ist.

Es gibt andere Methoden der Bewertung, die die spätere Gefahr (erwartet - späterer Verlust) in Bezug auf eine Verlust-Funktion minimieren, und diese von Interesse zur statistischen Entscheidungstheorie mit dem ausfallenden Vertrieb ("frequentist Statistik") sind.

Der spätere prophetische Vertrieb einer neuen Beobachtung (der mit vorherigen Beobachtungen austauschbar ist) wird durch bestimmt

:

Beispiele

Wahrscheinlichkeit einer Hypothese

Nehmen Sie an, dass es zwei volle Schüsseln von Plätzchen gibt. Schüssel #1 hat 10 schokoladenbraunen Span und 30 einfache Plätzchen, während Schüssel #2 20 von jedem hat. Unser Freund Fred pickt eine Schüssel aufs Geratewohl auf, und pickt dann ein Plätzchen aufs Geratewohl auf. Wir können annehmen, dass es keinen Grund gibt zu glauben, dass Fred eine Schüssel verschieden von einem anderen ebenfalls für die Plätzchen behandelt. Das Plätzchen erweist sich, ein einfaches zu sein. Wie wahrscheinlich es ist, dass Fred es aus der Schüssel #1? aufgepickt

hat

Intuitiv scheint es klar, dass die Antwort mehr als ein halber sein sollte, da es einfachere Plätzchen in der Schüssel #1 gibt. Die genaue Antwort wird durch den Lehrsatz von Buchten gegeben. Lassen Sie entsprechen zur Schüssel #1, und #2. zu bowlen

Es ist vorausgesetzt, dass die Schüsseln aus dem Gesichtspunkt von Fred so identisch sind, und sich die zwei 1 belaufen müssen, so sind beide 0.5 gleich.

Das Ereignis ist die Beobachtung eines einfachen Plätzchens. Vom Inhalt der Schüsseln wissen wir das und. Die Formel von Buchten gibt dann nach

: </Mathematik>

Bevor wir das Plätzchen beobachtet haben, war die Wahrscheinlichkeit, die wir für Fred zugeteilt haben, der Schüssel #1 gewählt hat, die vorherige Wahrscheinlichkeit, der 0.5 war. Nach dem Beobachten des Plätzchens müssen wir die Wahrscheinlichkeit dazu revidieren, der 0.6 ist.

Das Bilden einer Vorhersage

Ein Archäologe arbeitet an einer Seite, die vorgehabt ist, von der mittelalterlichen Periode zwischen dem 11. Jahrhundert zum 16. Jahrhundert zu sein. Jedoch ist es genau unsicher, als in dieser Periode die Seite bewohnt wurde. Bruchstücke von Töpferwaren werden gefunden, von denen einige verglast werden, und von denen einige geschmückt werden. Es wird erwartet, dass, wenn die Seite während der frühen mittelalterlichen Periode bewohnt würde, dann würde der 1 % der Töpferwaren verglast und 50 % seines Gebiets geschmückt, wohingegen, wenn es in der spätmittelalterlichen Periode dann bewohnt worden war, 81 % verglast würden und 5 % seines Gebiets geschmückt. Wie überzeugt kann der Archäologe im Datum von inhabitation sein, weil Bruchstücke ausgegraben werden?

Der Grad des Glaubens an die dauernde Variable (Jahrhundert) soll mit dem getrennten Satz von Ereignissen als Beweise berechnet werden. Das Annehmen geradliniger Schwankung der Politur und Dekoration mit der Zeit, und dass diese Variablen, unabhängig

sind::::

Nehmen Sie eine Uniform an, die, und das vorherig ist, Proben sind unabhängig und identisch verteilt. Wenn ein neues Bruchstück des Typs entdeckt wird, wird der Lehrsatz von Buchten angewandt, um den Grad des Glaubens für jeden zu aktualisieren:

Eine Computersimulation des sich ändernden Glaubens als 50 Bruchstücke wird ausgegraben wird auf dem Graphen gezeigt. In der Simulation wurde die Seite 1520 bewohnt, oder. Indem er das Gebiet unter dem relevanten Teil des Graphen für 50 Proben berechnet, kann der Archäologe sagen, dass es praktisch keine Chance gibt, wurde die Seite in den 11. und 12. Jahrhunderten, ungefähr 1 % Chance bewohnt, dass es während des 13. Jahrhunderts, der 63-%-Chance während des 14. Jahrhunderts und der 36 % während des 15. Jahrhunderts bewohnt wurde. Bemerken Sie, dass der Lehrsatz von Bernstein von Mises hier die asymptotische Konvergenz zum "wahren" Vertrieb behauptet, weil der Wahrscheinlichkeitsraum entsprechend dem getrennten Satz von Ereignissen begrenzt ist (sieh über der Abteilung auf dem asymptotischen Verhalten des späteren).

In der frequentist Statistik und Entscheidungstheorie

Eine mit der Entscheidung theoretische Rechtfertigung des Gebrauches der Schlussfolgerung von Bayesian wurde von Abraham Wald gegeben, der bewiesen hat, dass jedes Verfahren von Bayesian zulässig ist. Umgekehrt ist jedes zulässige statistische Verfahren entweder ein Verfahren von Bayesian oder eine Grenze von Verfahren von Bayesian.

Das Ergebnis von Wald hat auch die Annäherung von Bayesian als eine grundsätzliche Technik in solchen Gebieten der frequentist Schlussfolgerung als Punktschätzung, Hypothese-Prüfung und Vertrauensintervalle gegründet. Wald hat zulässige Verfahren als Verfahren von Bayesian (und Grenzen von Verfahren von Bayesian) charakterisiert, den Formalismus von Bayesian eine Haupttechnik in solchen Gebieten der frequentist Statistik als Parameter-Bewertung, Hypothese-Prüfung und Rechenvertrauensintervalle machend. Zum Beispiel:

  • "Unter einigen Bedingungen sind alle zulässigen Verfahren entweder Verfahren von Bayes oder Grenzen von Verfahren von Bayes (in verschiedenen Sinnen). Diese bemerkenswerten Ergebnisse, mindestens in ihrer ursprünglichen Form, sind im Wesentlichen zu Wald erwartet. Sie sind nützlich, weil das Eigentum, Bayes zu sein, leichter ist zu analysieren als Annehmbarkeit."
  • "In der Entscheidungstheorie besteht eine ziemlich allgemeine Methode, um Annehmbarkeit zu beweisen, im Ausstellen eines Verfahrens als eine einzigartige Lösung von Bayes."
  • "In den ersten Kapiteln dieser Arbeit wurde der vorherige Vertrieb mit der begrenzten Unterstützung und den entsprechenden Verfahren von Bayes verwendet, um einige der Hauptlehrsätze in Zusammenhang mit dem Vergleich von Experimenten zu gründen. Verfahren von Bayes in Bezug auf den allgemeineren vorherigen Vertrieb haben einen sehr wichtigen in der Entwicklung der Statistik einschließlich seiner asymptotischen Theorie gespielt." "Es gibt viele Probleme, wo ein flüchtiger Blick beim späteren Vertrieb, für passenden priors, sofort interessante Information nachgibt. Außerdem kann diese Technik in der folgenden Analyse kaum vermieden werden."
  • "Eine nützliche Tatsache ist, dass jede erhaltene Entscheidungsregel von Bayes durch die Einnahme eines richtigen vorherigen über den ganzen Parameter-Raum" zulässig sein muss
  • "Ein wichtiges Gebiet der Untersuchung in der Entwicklung von Annehmbarkeitsideen ist das von herkömmlichen Stichprobenerhebungstheorie-Verfahren gewesen, und viele interessante Ergebnisse sind erhalten worden."

Musterauswahl

Anwendungen

Computeranwendungen

Schlussfolgerung von Bayesian hat Anwendungen in der künstlichen Intelligenz und den Expertensystemen. Interferenztechniken von Bayesian sind ein grundsätzlicher Teil von computerisierten Muster-Anerkennungstechniken seit dem Ende der 1950er Jahre gewesen. Es gibt auch eine jemals wachsende Verbindung zwischen Methoden von Bayesian und simulierungsbasierten Techniken von Monte Carlo, da komplizierte Modelle in der geschlossenen Form durch eine Analyse von Bayesian nicht bearbeitet werden können, während eine grafische Musterstruktur effiziente Simulierungsalgorithmen wie der Gibbs berücksichtigen kann, der ausfällt und andere Algorithmus-Schemas der Metropole-Hastings. Kürzlich hat Bayesian Schlussfolgerung Beliebtheit unter der phylogenetics Gemeinschaft aus diesen Gründen gewonnen; mehrere Anwendungen erlauben vielen demografischen und evolutionären Rahmen, gleichzeitig geschätzt zu werden. In den Gebieten der Bevölkerungsgenetik und dynamischen Systemtheorie wird ungefähre Berechnung von Bayesian (ABC) auch immer populärer.

In Bezug auf die statistische Klassifikation ist Schlussfolgerung von Bayesian in den letzten Jahren verwendet worden, um Algorithmen zu entwickeln, um E-Mail spam zu identifizieren. Anwendungen, die von der Schlussfolgerung von Bayesian für die Spam-Entstörung Gebrauch machen, schließen DSPAM, Bogofilter, SpamAssassin, SpamBayes und Mozilla ein. Klassifikation von Spam wird ausführlicher im Artikel über naiven Bayes classifier behandelt.

Die induktive Schlussfolgerung von Solomonoff ist die Theorie der auf Beobachtungen gestützten Vorhersage; zum Beispiel das Voraussagen des folgenden Symbols auf einer gegebenen Reihe von Symbolen gestützt. Die einzige Annahme ist, dass die Umgebung etwas unbekanntem, aber berechenbarem Wahrscheinlichkeitsvertrieb folgt.

Es verbindet zwei gut studierte Grundsätze der induktiven Schlussfolgerung: Statistik von Bayesian und das Rasiermesser von Occam.

Die universale vorherige Wahrscheinlichkeit von Solomonoff jedes Präfixes p einer berechenbaren Folge x ist die Summe der Wahrscheinlichkeiten aller Programme (für einen universalen Computer), die etwas schätzen, mit p anfangend. In Anbetracht eines p und jedes berechenbaren, aber unbekannten Wahrscheinlichkeitsvertriebs, von dem x probiert wird, kann der Lehrsatz der universalen vorherigen und Buchten verwendet werden, um die noch ungesehenen Teile von x auf die optimale Mode vorauszusagen.

Im Gerichtssaal

Schlussfolgerung von Bayesian kann von Geschworenen verwendet werden, um die Beweise für und gegen einen Angeklagten zusammenhängend anzusammeln und zu sehen, ob, in der Gesamtheit, es ihre persönliche Schwelle für 'außer angemessenen Zweifeln' entspricht. Der Vorteil einer Annäherung von Bayesian ist, dass sie dem Geschworenen einen unvoreingenommenen, vernünftigen Mechanismus gibt, um Beweise zu verbinden. Der Lehrsatz von Buchten wird nacheinander auf den ganzen Beweis geliefert mit dem späteren von einer Bühne angewandt, die das vorherige für das folgende wird. Eine vorherige Wahrscheinlichkeit der Schuld ist noch erforderlich. Es ist darauf hingewiesen worden, dass das die Wahrscheinlichkeit vernünftig sein konnte, dass eine zufällige von der sich qualifizierenden Bevölkerung genommene Person schuldig ist. So, für ein Verbrechen, das bekannt ist, durch einen erwachsenen Mann begangen worden zu sein, der in einer Stadt lebt, die 50,000 erwachsene Männer enthält, könnte die passende vorherige Initiale 1/50,000 sein.

Es kann passend sein, den Lehrsatz von Buchten Geschworenen in der Verschiedenheitsform zu erklären, weil Wetten-Verschiedenheit weiter verstanden wird als Wahrscheinlichkeiten. Wechselweise könnte eine logarithmische Annäherung, Multiplikation durch die Hinzufügung ersetzend, für eine Jury leichter sein zu behandeln.

Der Gebrauch des Lehrsatzes von Buchten durch Geschworene ist umstritten. Im Vereinigten Königreich hat ein Verteidigungssachverständiger den Lehrsatz von Buchten zur Jury in R gegen Adams erklärt. Die Jury hat verurteilt, aber der Fall ist gegangen, um auf der Basis zu appellieren, dass keine Mittel von anwachsenden Beweisen für Geschworene zur Verfügung gestellt worden waren, die den Lehrsatz von Buchten haben nicht verwenden wollen. Das Berufungsgericht hat die Überzeugung hochgehalten, aber es hat auch die Meinung gegeben, dass, "Um den Lehrsatz von Buchten einzuführen, oder jede ähnliche Methode in eine kriminelle Probe die Jury in unpassende und unnötige Bereiche der Theorie und Kompliziertheit taucht, sie von ihrer richtigen Aufgabe ablenkend."

Gardner-Medwin behauptet, dass das Kriterium, auf dem ein Urteil in einer kriminellen Probe basieren sollte, nicht die Wahrscheinlichkeit der Schuld, aber eher die Wahrscheinlichkeit der Beweise ist, vorausgesetzt, dass der Angeklagte (verwandt mit einem frequentist P-Wert) unschuldig ist. Er behauptet, dass, wenn die spätere Wahrscheinlichkeit der Schuld durch den Lehrsatz von Buchten geschätzt werden soll, die vorherige Wahrscheinlichkeit der Schuld bekannt sein muss. Das wird vom Vorkommen des Verbrechens abhängen, das ein ungewöhnliches Stück von Beweisen ist, um in einer kriminellen Probe in Betracht zu ziehen. Denken Sie die folgenden drei Vorschläge:

:A Die bekannten Tatsachen und das Zeugnis könnten entstanden sein, wenn der Angeklagte schuldiger ist

:B Die bekannten Tatsachen und das Zeugnis könnten entstanden sein, wenn der Angeklagte unschuldiger ist

:C Der Angeklagte ist schuldig.

Gardner-Medwin behauptet, dass die Jury sowohl A als auch nicht-B glauben sollte, um zu verurteilen. A und bezieht nicht-B die Wahrheit von C ein, aber die Rückseite ist nicht wahr. Es ist möglich, dass B und C beide wahr sind, aber in diesem Fall behauptet er, dass eine Jury erfüllen sollte, wenn auch sie wissen, dass sie einige schuldige Menschen frei werden gehen lassen. Siehe auch das Paradox von Lindley.

Anderer

  • Die wissenschaftliche Methode wird manchmal als eine Anwendung der Schlussfolgerung von Bayesian interpretiert. In dieser Ansicht, die Regel-Führer von Buchten (oder sollte führen), das Aktualisieren von Wahrscheinlichkeiten über Hypothesen, die durch neue Beobachtungen oder Experimente bedingt sind.
  • Suchtheorie von Bayesian wird verwendet, um nach verlorenen Gegenständen zu suchen.
  • Schlussfolgerung von Bayesian in phylogeny
  • Werkzeug von Bayesian für die methylation Analyse

Bayes und Schlussfolgerung von Bayesian

Das Problem, das von Bayes im Vorschlag 9 seines Aufsatzes, "Ein Aufsatz zum Beheben eines Problems in der Doktrin von Chancen betrachtet ist", ist der spätere Vertrieb für den Parameter (die Erfolg-Rate) vom binomischen Vertrieb.

Was "Bayesian" über den Vorschlag 9 ist, ist, dass Bayes es als eine Wahrscheinlichkeit für den Parameter präsentiert hat. D. h. nicht nur einer kann Wahrscheinlichkeiten für experimentelle Ergebnisse, sondern auch für den Parameter schätzen, der sie regelt, und dieselbe Algebra verwendet wird, um Schlussfolgerungen jeder Art zu machen. Interessanterweise setzt Bayes wirklich seine Frage in einem Weg fest, der die Idee machen könnte, einen Wahrscheinlichkeitsvertrieb einem zu einem frequentist schmackhaften Parameter zuzuteilen. Er nimmt an, dass ein Billardball aufs Geratewohl auf einen Billardtisch geworfen wird, und dass die Wahrscheinlichkeiten p und q die Wahrscheinlichkeiten sind, dass nachfolgende Billardbälle oben oder unter dem ersten Ball fallen werden. Indem er den binomischen Parameter von einem zufälligen Ereignis abhängen lässt, entkommt er klug einem philosophischen Sumpf, der ein Problem war, dessen er am wahrscheinlichsten nicht sogar bewusst war.

Geschichte

Der Begriff Bayesian bezieht sich auf Thomas Bayes (1702-1761), wer einen speziellen Fall dessen bewiesen hat, was jetzt den Lehrsatz von Bayes genannt wird. Jedoch war es Pierre-Simon Laplace (1749-1827), wer eine allgemeine Version des Lehrsatzes eingeführt hat und ihn verwendet hat, um sich Problemen in himmlischer Mechanik, medizinischer Statistik, Zuverlässigkeit und Rechtskunde zu nähern. Frühe Bayesian Schlussfolgerung, die Uniform priors im Anschluss an den Grundsatz von Laplace des ungenügenden Grunds verwendet hat, wurde "umgekehrte Wahrscheinlichkeit" genannt (weil es umgekehrt von Beobachtungen bis Rahmen, oder von Effekten bis Ursachen ableitet). Nach den 1920er Jahren, "wurde umgekehrte Wahrscheinlichkeit" durch eine Sammlung von Methoden größtenteils verdrängt, die gekommen sind, um frequentist Statistik genannt zu werden.

Im 20. Jahrhundert wurden die Ideen von Laplace weiter in zwei verschiedenen Richtungen entwickelt, objektive und subjektive Ströme in der Praxis von Bayesian verursachend. Im objektiven oder "nichtinformativen" Strom hängt die statistische Analyse nur vom Modell angenommen, die analysierten Daten ab. und die Methode, die das vorherige zuteilt, das sich von einem objektivem Bayesian bis einen anderen objektiven Bayesian unterscheidet. Im subjektiven oder "informativen" Strom hängt die Spezifizierung des vorherigen vom Glauben ab (d. h. Vorschläge, auf denen die Analyse bereit ist zu handeln), der Information von Experten, früheren Studien usw. zusammenfassen kann.

In den 1980er Jahren gab es ein dramatisches Wachstum in der Forschung und den Anwendungen von Methoden von Bayesian, die größtenteils der Entdeckung der Kette von Markov Methoden von Monte Carlo zugeschrieben sind, die viele der rechenbetonten Probleme und ein zunehmendes Interesse an umgangssprachlichen, komplizierten Anwendungen entfernt haben. Trotz des Wachstums der Forschung von Bayesian basiert der grösste Teil des Studentenunterrichtens noch auf der frequentist Statistik. Dennoch werden Methoden von Bayesian weit akzeptiert und, solcher bezüglich des Beispiels im Feld des Maschinenlernens verwendet.

Zeichen

  • Kasten, G.E.P. und Tiao, G.C. (1973) Bayesian Schlussfolgerung in der Statistischen Analyse, Wiley, internationalen Standardbuchnummer 0-471-57428-7
  • Jaynes E.T. (2003) Wahrscheinlichkeitstheorie: Die Logik der Wissenschaft, TASSE. Internationale Standardbuchnummer 978-0-521-59271-0 (Verbinden sich zur Fragmentarischen Ausgabe des Märzes 1996).

Weiterführende Literatur

Elementar

Die folgenden Bücher werden in aufsteigender Reihenfolge der probabilistic Kultiviertheit verzeichnet:

  • Bolstad, William M. (2007) Einführung in die Bayesian Statistik: Die Zweite Ausgabe, internationale Standardbuchnummer von John Wiley 0-471-27020-2
  • Winkler, Robert L, Einführung in die Bayesian Schlussfolgerung und Entscheidung, 2. internationale Standardbuchnummer der Ausgabe (2003) 0-9647938-4-9
  • Lee, Peter M Bayesian Statistics: Eine Einführung. Die zweite Ausgabe. (1997). Internationale Standardbuchnummer 0-340-67785-6.

Zwischenglied oder vorgebracht

  • DeGroot, Morris H., Optimale Statistische Entscheidungen. Klassiker-Bibliothek von Wiley. 2004. (Ursprünglich veröffentlicht (1970) durch den McGraw-Hügel.) internationale Standardbuchnummer 0 471 68029 X.
  • Jaynes, E.T. (1998) Wahrscheinlichkeitstheorie: Die Logik der Wissenschaft.
  • O'Hagan, A. und Forster, J. (2003) die Fortgeschrittene Theorie von Kendall der Statistik, Bands 2B: Bayesian Schlussfolgerung. Arnold, New York. Internationale Standardbuchnummer 0-340-52922-9.
  • Glenn Shafer und Pearl, Judea, Hrsg. (1988) Schließen mit Unsicherheiten in Intelligenten Systemen, San Mateo, Kalifornien: Morgan Kaufmann.

Links


Der Lehrsatz von Buchten / Rowdytum
Impressum & Datenschutz