Pythagoreische Erwartung

Pythagoreische Erwartung ist eine von Bill James erfundene Formel, um zu schätzen, wie viele Spiele eine Baseball-Mannschaft gestützt auf der Zahl von Läufen gewonnen haben sollte, die sie eingekerbt haben und erlaubt haben. Das Vergleichen eines wirklichen und Pythagoreischen gewinnenden Prozentsatzes einer Mannschaft kann verwendet werden, um zu bewerten, wie glücklich, dass Mannschaft war (indem sie die Schwankung zwischen den zwei Gewinnen-Prozentsätzen untersucht hat). Der Begriff wird aus der Ähnlichkeit der Formel mit dem Pythagoreischen Lehrsatz abgeleitet.

Die grundlegende Formel ist:

:

wo Win das durch die Formel erzeugte Gewinnen-Verhältnis ist. Die erwartete Zahl von Gewinnen würde das erwartete gewinnende Verhältnis sein, das mit der Zahl von gespielten Spielen multipliziert ist.

Empirischer Ursprung

Empirisch entspricht diese Formel ziemlich gut dem, wie Baseball-Mannschaften wirklich leisten. Jedoch haben Statistiker seit der Erfindung dieser Formel gefunden, dass es einen ziemlich alltäglichen Fehler, allgemein ungefähr 3 Spiele davon hatte. Zum Beispiel, 2002, haben die New Yorker Yankees eingekerbt 897 Läufe gezählt, 697 Läufe erlaubend. Gemäß James ursprünglicher Formel sollten die Yankees 62.35 % ihrer Spiele gewonnen haben.

:

Gestützt auf einer 161 Spieljahreszeit sollten die Yankees 100.38 Spiele gewonnen haben. Die 2002-Yankees sind wirklich 103-58 gegangen.

In Anstrengungen, diesen Fehler zu befestigen, haben Statistiker zahlreiche Suchen durchgeführt, um die ideale Hochzahl zu finden.

Wenn das Verwenden einer einzelnen Zahl-Hochzahl, 1.83, und diejenige am genauesten ist, die durch baseball-reference.com, die Hauptwebsite für die Baseball-Statistik über Mannschaften und Zeit verwendet ist. Die aktualisierte Formel liest deshalb wie folgt:

:

Am weitesten bekannt ist die Formel von Pythagenport, die durch Ton der Davenport der Baseball-Broschüre entwickelt ist:

:

Er hat beschlossen, dass die Hochzahl von einer gegebenen Mannschaft berechnet werden sollte, die von von eingekerbtem (R) der Läufe der Mannschaft, Läufen erlaubt (RA) und Spielen (G) gestützt ist. Indem er die Hochzahl auf eine einzelne Zahl für Mannschaften in jeder Jahreszeit nicht reduziert worden ist, ist der Davenport im Stande gewesen, einen 3.9911 Effektivwert-Fehler im Vergleich mit einem 4.126 Effektivwert-Fehler für eine Hochzahl 2 auszugeben.

Weniger weithin bekannt, aber ebenso (wenn nicht mehr) wirksam ist die Formel von Pythagenpat, die von David Smyth entwickelt ist.

:

Der Davenport hat seine Unterstützung für diese Formel ausgedrückt, sagend:

Nach der weiteren Rezension bin ich (Ton) zum Beschluss gekommen, dass die so genannte Smyth/Patriot Methode, auch bekannt als Pythagenpat, ein besserer passender sind. Darin, X = ((rs + ra)/g), obwohl es etwas Windungszimmer für die Unstimmigkeit in der Hochzahl gibt. Irgendwie ist diese Gleichung einfacher, eleganter, und bekommt die bessere Antwort über eine breitere Reihe von Läufen, die eingekerbt sind als Pythagenport, einschließlich des obligatorischen Werts von 1 an 1 rpg.

Diese Formeln sind nur notwendig, wenn, sich mit äußersten Situationen befassend, in denen die durchschnittliche Zahl von pro Spiel eingekerbten Läufen entweder sehr hoch oder sehr niedrig ist. Für die meisten Situationen einfach Quadrieren gibt jede Variable genaue Ergebnisse nach.

Es gibt einige systematische statistische Abweichungen zwischen dem wirklichen gewinnenden Prozentsatz und hat angenommen, Prozentsatz zu gewinnen, die Qualität der Baracke für Holzfäller und Glück einschließen. Außerdem neigt die Formel zur Rückwärtsbewegung zum bösartigen, weil Mannschaften, die viele Spiele gewinnen, dazu neigen, durch die Formel unterrepräsentiert zu sein (das Meinen, dass sie weniger Spiele gewonnen haben sollten), und Mannschaften, die viele Spiele verlieren, dazu neigen, übervertreten zu werden (sie sollten mehr gewonnen haben).

"Zweite Ordnung" und Gewinne "der dritten Ordnung"

In ihrem Angepassten Stehbericht bezieht sich Baseball-Broschüre auf verschiedene "Ordnungen" von Gewinnen für eine Mannschaft. Die grundlegende Ordnung von Gewinnen ist einfach die Zahl von Spielen, die sie gewonnen haben. Jedoch, weil eine Aufzeichnung einer Mannschaft sein wahres Talent wegen des Glücks nicht widerspiegeln kann, wurden verschiedene Maßnahmen eines Talents einer Mannschaft entwickelt.

Gewinne der ersten Ordnung, die auf dem reinen Lauf-Differenzial gestützt sind, sind die Zahl von erwarteten durch die "pythagenport" Formel erzeugten Gewinnen (sieh oben). Außerdem, um weiter die Verzerrungen des Glücks herauszufiltern, kann sabermetricians auch erwartete Läufe einer Mannschaft berechnen, die eingekerbt und über eine Lauf-Gleichung des geschaffenen Typs (das genaueste am Mannschaft-Niveau erlaubt sind, das Grundläufe ist). Diese Formeln laufen auf die erwartete Zahl der Mannschaft von Läufen gegeben ihr beleidigender und defensiver stats hinaus (Gesamtsinglen, verdoppelt sich, Spaziergänge, usw.), der hilft, den Glück-Faktor der Ordnung zu beseitigen, in der die Erfolge und Spaziergänge der Mannschaft innerhalb eines Innings gekommen sind. Mit diesen stats kann sabermetricians rechnen, wie viele Läufe eine Mannschaft eingekerbt haben oder erlaubt haben sollte.

Durch die Verstopfung dieser erwarteten Läufe hat eingekerbt und hat in die pythagoreische Formel erlaubt, man kann Gewinne der zweiten Ordnung, die Zahl von Gewinnen erzeugen, die eine Mannschaft gestützt auf der Zahl von Läufen verdient, die sie eingekerbt haben und gegeben ihre defensive und beleidigende Teilstatistik erlaubt haben sollten. Gewinne der dritten Ordnung sind Gewinne der zweiten Ordnung, die für die Kraft der Liste (die Qualität des Aufstellens und des Schlagens des Gegners) angepasst worden sind. Zweit - und dritte Ordnung, Prozentsatz gewinnend, ist gezeigt worden, zukünftige wirkliche Mannschaft vorauszusagen, die Prozentsatz besser gewinnt sowohl als der wirkliche gewinnende Prozentsatz als auch als die erste Ordnung, Prozentsatz gewinnend.

Theoretische Erklärung

Am Anfang war die Korrelation zwischen der Formel und dem wirklichen gewinnenden Prozentsatz einfach eine experimentelle Beobachtung. 2003 hat Hein Hundal eine ungenaue Abstammung der Formel zur Verfügung gestellt und hat gezeigt, dass die Pythagoreische Hochzahl etwa 2 / (σ π war), wo σ die Standardabweichung von Läufen war, die von allen Mannschaften eingekerbt sind, die durch die durchschnittliche Zahl von eingekerbten Läufen geteilt sind. 2006 hat Professor Steven J. Miller eine statistische Abstammung der Formel unter einigen Annahmen über Baseball-Spiele zur Verfügung gestellt: Wenn Läufe für jede Mannschaft einem Vertrieb von Weibull folgen und die Läufe, die eingekerbt und pro Spiel erlaubt sind, statistisch unabhängig sind, dann gibt die Formel die Wahrscheinlichkeit des Gewinnens.

Riesen gegen die Ranger-2010-Anwendung

2010 haben die San Francisco Riesen die Ranger von Texas in der MLB Weltreihe gespielt. Während beide Mannschaften die Weltreihe mit derselben Aufzeichnung erreicht haben, waren die Ranger über den Kurs der Jahreszeit systematisch glücklicher. Indem wir die erwarteten Gewinne der Riesen (wie berechnet, durch die Pythagoreische Theorie mit einer Hochzahl 1.83) vergleichen, sehen wir, dass die Aufzeichnung der Riesen durchweg weniger Gewinne hatte als erwartet, sogar zu vier Spielen tiefer fallend, als erwartet zwischen am 7. Juli und am 18. Juli 2010. Die Ranger hatten jedoch eine Better-Expected-Gewinn-Verlust-Aufzeichnung vom 8. Mai bis zum 30. Juni.

Grafische Darstellung des Vergleichs zwischen dem gezeigten an dieser Verbindung: Riesen gegen die Ranger-2010-Vergegenwärtigung Dieser Graph wurden mit den Aufzeichnungen des Gewinn-Verlustes der beider Mannschaften im Laufe der Jahreszeit berechnet. Die Linien zeigen den Unterschied zwischen der wirklichen Zahl von Gewinnen und der erwarteten Zahl von Gewinnen. Wenn eine Mannschaft eine Aufzeichnung 10-5 hat und eine erwartete Aufzeichnung 11-4 hat, würde der Graph einen Punkt an-1 an diesem Datum zeigen. Deshalb zeigen irgendwelche Punkte über der Nulllinie eine glückliche Mannschaft, während unter der Linie, eine Mannschaft ausgleicht, die verloren hat, als es sich gezeigt haben sollte. Die Läufe sind über den Kurs der Jahreszeit kumulativ.

Verwenden Sie im Basketball

Amerikanischer Sportmanager Daryl Morey war erst, um James Pythagoreische Erwartung an den Berufsbasketball während ein Forscher an STATS, Inc anzupassen.. Er hat gefunden, dass das Verwenden 13.91 für die Hochzahlen ein annehmbares Modell zur Verfügung gestellt hat, um gewonnen - verlorene Prozentsätze vorauszusagen:

:

Der "Modifizierte Pythagoreische Lehrsatz von Daryl" wurde zuerst in der STATS Basketball-Anzeigetafel, 1993-94 veröffentlicht.

Bekannter Basketball-Analytiker Dean Oliver hat auch James Pythagoreische Theorie auf den Berufsbasketball angewandt. Das Ergebnis war ähnlich.

Ein anderer bekannter Basketball-Statistiker, John Hollinger, verwendet eine ähnliche Pythagoreische Formel außer mit 16.5 als die Hochzahl.

Verwenden Sie im pro Fußball

Die Formel ist auch im pro Fußball durch den Fußball stat Website und Herausgeber-Fußballaußenseiter verwendet worden, wo es als Pythagoreischer Vorsprung bekannt ist. Die 2011-Ausgabe von Fußballaußenseiter-Almanach-Staaten, "Von 1988 bis 2004, wurden 11 von 16 Superschüsseln von der Mannschaft gewonnen, die den NFL in Pythagoreischen Gewinnen geführt hat, während nur sieben ein durch die Mannschaft mit den am meisten wirklichen Siegen waren. Superschüssel-Meister, die die Liga in Pythagoreischen Gewinnen, aber nicht wirklichen Gewinnen geführt haben, schließen die 2004-Patrioten, 2000 Raben, 1999 Widder und 1997 Wilden Pferde ein."

Obwohl Fußballaußenseiter-Almanach zugibt, dass die Formel - erfolgreich in der Auswahl von Superschüssel-Teilnehmern von 2005-2008 weniger gewesen war, hat es sich 2009 und 2010 wieder behauptet. Außerdem "ist [t] er Pythagoreischer Vorsprung auch noch ein wertvoller Prophet der Verbesserung des Jahres-zu-jährig. Mannschaften, die ein Minimum eines vollen Spiels mehr gewinnen als ihr Pythagoreischer Vorsprung, neigen zur Rückwärtsbewegung im nächsten Jahr; Mannschaften, die ein Minimum eines vollen Spiels weniger gewinnen als ihr Vorsprung von Pythagoerean, neigen dazu, sich im nächsten Jahr besonders zu verbessern, wenn sie an oder oben.500 trotz waren, dass sie unter Niveau bleiben. Zum Beispiel, 2008 Heilige von New Orleans sind 8-8 trotz 9.5 Pythagoreischer Gewinne gegangen, von der Verbesserung andeutend, die mit der Meisterschaft-Jahreszeit des nächsten Jahres gekommen ist."

Siehe auch

Sabermetrics
  • Fußballaußenseiter

Referenzen

Links


Liber Linteus / Gerichtsbarkeitsschlag
Impressum & Datenschutz