Das Paradox von Simpson

In der Wahrscheinlichkeit und Statistik ist das Paradox von Simpson (oder die Wirkung des Weihnachtsfestes-Simpson) ein Paradox, in dem eine Korrelationsgegenwart in verschiedenen Gruppen umgekehrt wird, wenn die Gruppen verbunden werden. Auf dieses Ergebnis wird häufig in der Sozialwissenschaft und Statistik der medizinischen Wissenschaft gestoßen, und verwechselt besonders wenn Frequenz

Daten werden kausale Interpretationen übermäßig gegeben. Das Paradox von Simpson verschwindet, wenn kausale Beziehungen in die Rücksicht gebracht werden (sieh Implikationen zum Entscheidungsbilden).

Obwohl es laypeople größtenteils unbekannt ist, ist das Paradox von Simpson Statistikern weithin bekannt, und es wird in einigen einleitenden Statistikbüchern beschrieben. Viele Statistiker glauben, dass das Hauptströmungspublikum über die gegenintuitiven Ergebnisse in der Statistik wie das Paradox von Simpson informiert werden sollte.

Edward H. Simpson hat zuerst dieses Phänomen in einer technischen Zeitung 1951, beschrieben

aber die Statistiker Karl Pearson, u. a. 1899,

und Udny Weihnachtsfest 1903 hatte ähnliche Effekten früher erwähnt.

Der Name das Paradox von Simpson wurde von Colin R. Blyth 1972 eingeführt.

Seitdem Edward Simpson nicht wirklich entdeckt hat, dass dieses statistische Paradox, einige Schriftsteller, statt dessen das unpersönliche Namenumkehrungsparadox und Fusionsparadox im Verweisen dazu verwendet hat, was jetzt das Paradox von Simpson und die Wirkung des Weihnachtsfestes-Simpson genannt wird.

Beispiele

Gesetz der Bürgerlichen Rechte von 1964

Ein wahres Beispiel ist der Durchgang des Gesetzes der Bürgerlichen Rechte von 1964 in den Vereinigten Staaten. Insgesamt hat ein größerer Bruchteil von republikanischen Gesetzgebern für das Gesetz gestimmt als Demokraten. Jedoch, wenn die Kongressdelegationen von den nördlichen und südlichen Staaten getrennt, ein größerer Bruchteil von Demokraten betrachtet werden, die für die Tat in beiden Gebieten gewählt sind. Das ist entstanden, weil Regionalverbindung ein sehr starker Hinweis dessen ist, wie ein Kongressabgeordneter oder Senator gestimmt haben, aber Parteiverbindung ist ein schwacher Hinweis.

Nierenstein-Behandlung

Das ist ein anderes wahres Beispiel von einer medizinischen Studie, die die Erfolg-Raten von zwei Behandlungen für Nierensteine vergleicht.

Der Tisch zeigt die Erfolg-Raten und Zahlen von Behandlungen für Behandlungen, die mit sowohl kleinen als auch großen Nierensteinen verbunden sind, wo Behandlung A alle offenen Verfahren einschließt und Behandlung B percutaneous nephrolithotomy ist:

Der paradoxe Beschluss besteht darin, dass Behandlung A, wenn verwendet, auf kleinen Steinen, und auch wenn verwendet, auf großen Steinen wirksamer ist, noch ist Behandlung B wirksamer, wenn sie beide Größen zur gleichen Zeit denkt. In diesem Beispiel, wie man vorher bekannt, war die "versteckte" Variable (oder das Verwechseln der Variable) der Steingröße nicht wichtig, bis seine Effekten eingeschlossen wurden.

Welche Behandlung besser betrachtet wird, wird durch eine Ungleichheit zwischen zwei Verhältnissen (Erfolge / ganz) bestimmt. Die Umkehrung der Ungleichheit zwischen den Verhältnissen, die das Paradox von Simpson schafft, geschieht, weil zwei Effekten zusammen vorkommen:

  1. Die Größen der Gruppen, die verbunden werden, wenn die versteckte Variable ignoriert wird, sind sehr verschieden. Ärzte neigen dazu, die strengen Fälle (große Steine) die bessere Behandlung (A) und die milderen Fälle (kleine Steine) die untergeordnete Behandlung (B) zu geben. Deshalb werden die Summen von Gruppen drei und zwei, und nicht von den zwei viel kleineren Gruppen ein und vier beherrscht.
  2. Die versteckte Variable hat eine große Wirkung auf die Verhältnisse, d. h. die Erfolg-Rate ist stärker unter Einfluss der Strenge des Falls als durch die Wahl der Behandlung. Deshalb tut die Gruppe von Patienten mit großen Steinen mit der Behandlung (Gruppe drei) schlechter als die Gruppe mit kleinen Steinen, selbst wenn die Letzteren die untergeordnete Behandlung B (Gruppe zwei) verwendet haben.

Geschlecht von Berkeley beeinflusst Fall

Eines der am besten bekannten echten Lebensbeispiele des Paradoxes von Simpson ist vorgekommen, als die Universität Kaliforniens, Berkeley auf die Neigung gegen Frauen verklagt wurde, die sich um Aufnahme beworben hatten, um Schulen dort in Grade einzuteilen. Die Aufnahme-Zahlen für den Fall 1973 haben gezeigt, dass Männer, die sich wenden, wahrscheinlicher waren als Frauen, eingelassen zu werden, und der Unterschied so groß war, dass es kaum wegen der Chance sein konnte.

Aber als es die individuellen Abteilungen untersucht hat, ist es geschienen, dass keine Abteilung gegen Frauen bedeutsam beeinflusst wurde. Tatsächlich hatten die meisten Abteilungen eine "kleine, aber statistisch bedeutende Neigung für Frauen." Die Daten von den sechs größten Abteilungen werden unten verzeichnet.

Die Forschungsarbeit durch Bickel, u. a. geschlossen, dass Frauen dazu geneigt haben, sich für Wettbewerbsabteilungen mit niedrigen Zinssätzen der Aufnahme sogar unter qualifizierten Bewerbern (solcher als in der englischen Abteilung) zu wenden, wohingegen Männer dazu geneigt haben, sich für weniger - Wettbewerbsabteilungen mit hohen Raten der Aufnahme unter den qualifizierten Bewerbern (solcher als in der Technik und Chemie) zu wenden. Die Bedingungen, unter denen die Frequenzdaten der Bekenntnisse von spezifischen Abteilungen eine richtige Verteidigung gegen Anklagen von einsetzen

Urteilsvermögen wird im Buch Kausalität durch die Perle formuliert.

Niedriges Geburtsgewicht-Paradox

Das niedrige Geburtsgewicht-Paradox ist eine anscheinend paradoxe Beobachtung in Zusammenhang mit den Geburtsgewichten und der Sterblichkeit von Tabakrauchmüttern geborenen Kindern. Als eine übliche Praxis sind Babys, die weniger als einen bestimmten Betrag wiegen (der sich zwischen verschiedenen Ländern ändert), klassifiziert worden als, niedrig Geburtsgewicht zu haben. In einer gegebenen Bevölkerung haben Babys mit niedrigen Geburtsgewichten eine bedeutsam höhere Säuglingssterblichkeitsziffer gehabt als andere. Jedoch ist es bemerkt worden, dass Babys von niedrigen rauchenden Müttern geborenen Geburtsgewichten eine niedrigere Sterblichkeitsziffer haben als die Babys von niedrigen Geburtsgewichten von Nichtrauchern.

Durchschnittsleistungen

Ein allgemeines Beispiel des Paradoxes von Simpson schließt die Durchschnittsleistungen von Spielern im Berufsbaseball ein. Es ist für einen Spieler möglich, für eine höhere Durchschnittsleistung zu schlagen als ein anderer Spieler während eines gegebenen Jahres, und so wieder während des nächsten Jahres zu tun, aber eine niedrigere Durchschnittsleistung zu haben, wenn die zwei Jahre verbunden werden. Dieses Phänomen kann vorkommen, wenn es große Unterschiede in der Zahl an den Fledermäusen zwischen den Jahren gibt. (Dieselbe Situation gilt für das Rechnen von Durchschnittsleistungen für die erste Hälfte der Baseball-Jahreszeit, und während der zweiten Hälfte und dann des Kombinierens von allen Daten für die Durchschnittsleistung der Jahreszeit.)

Ein wahres Beispiel wird von Ken Ross zur Verfügung gestellt und schließt die Durchschnittsleistung von zwei Baseball-Spielern, Derek Jeter und David Justice, während der Baseball-Jahre 1995 und 1996 ein:

Sowohl 1995 als auch 1996 hatte Justiz eine höhere Durchschnittsleistung (im kühnen Typ) als Jeter hat. Jedoch, wenn die zwei Baseball-Jahreszeiten verbunden werden, zeigt Jeter eine höhere Durchschnittsleistung als Justiz. Gemäß Ross würde dieses Phänomen über so pro Jahr unter den möglichen Paaren von interessanten Baseball-Spielern beobachtet. In diesem besonderen Fall kann das Paradox von Simpson noch beobachtet werden, wenn das Jahr 1997 auch in Betracht gezogen wird:

Auf das Jeter und Justiz-Beispiel des Paradoxes von Simpson wurde in der "Komplott Theorie" Episode der Fernsehreihe Numb3rs verwiesen, obwohl eine gezeigte Karte einige der Daten weggelassen hat, und die 1996-Durchschnitte als 1995 verzeichnet hat.

Beschreibung

Nehmen Sie zwei Menschen, Lisa und Bart an, jeder editiert Dokumentenartikel seit zwei Wochen. In der ersten Woche verbessert sich Lisa um 60 % der 100 Artikel, die sie editiert hat, und sich Bart um 90 % von 10 Artikeln verbessert, die er editiert hat. In der zweiten Woche verbessert Lisa gerade 10 % von 10 Artikeln, die sie editiert hat, während sich Bart um 30 % von 100 Artikeln verbessert, hat er editiert.

Der Baronet der beider Male hat einen höheren Prozentsatz von Artikeln verbessert als Lisa, aber die wirkliche Zahl von Artikeln war jeder editiert (die unterste Zahl ihrer Verhältnisse, auch bekannt als die Beispielgröße) nicht dasselbe für sie beide jede Woche. Wenn die Summen seit den zwei Wochen zusammen hinzugefügt werden, können Baronet und die Arbeit von Lisa von einer gleichen Beispielgröße, d. h. derselben Zahl von von jedem editierten Artikeln beurteilt werden. Geschaut auf auf diese genauere Weise ist das Verhältnis von Lisa höher und deshalb ihr Prozentsatz auch. Auch wenn die zwei Tests mit einem gewogenen Mittelwert insgesamt verbunden werden, hat Lisa einen viel höheren Prozentsatz verbessert als Baronet, weil der Qualitätsmodifikator einen bedeutsam höheren Prozentsatz hatte. Deshalb, wie andere Paradoxe, scheint es nur, ein Paradox wegen falscher Annahmen, unvollständiger oder unangebrachter Information oder eines Mangels daran zu sein, ein besonderes Konzept zu verstehen.

Dieses vorgestellte Paradox wird verursacht, wenn der Prozentsatz zur Verfügung gestellt wird, aber nicht das Verhältnis. In diesem Beispiel, wenn nur die 90 % in der ersten Woche für den Baronet zur Verfügung gestellt wurde, aber nicht das Verhältnis (9:10), würde es die Information verdrehen, die das vorgestellte Paradox verursacht. Wenn auch der Prozentsatz des Baronets für die erste und zweite Woche höher ist, wenn zwei Wochen von Artikeln verbunden werden, hatte gesamte Lisa ein größeres Verhältnis, 55 % der 110 Gesamtartikel verbessert. Die proportionale Summe von Lisa von verbesserten Artikeln überschreitet die Summe des Baronets.

Hier sind einige Notationen:

  • In der ersten Woche

:* - Lisa hat sich um 60 % der vielen Artikel verbessert, die sie editiert hat.

:* - Baronet hatte eine 90-%-Erfolg-Rate während dieser Zeit.

: Erfolg wird mit dem Baronet vereinigt.

  • In der zweiten Woche

:* - Lisa hat 10 % in ihrem beschäftigten Leben geführt.

:* - Baronet hat eine 30-%-Erfolg-Rate erreicht.

: Erfolg wird mit dem Baronet vereinigt.

Bei beiden Gelegenheiten editiert Bart waren erfolgreicher als Lisa. Aber wenn wir die zwei Sätze verbinden, sehen wir dass Lisa und Bart sowohl editiert 110 Artikel, als auch:

  • - Lisa hat 61 Artikel verbessert.
  • - Baronet hat nur 39 verbessert.
  • - Erfolg wird jetzt mit Lisa vereinigt.

Baronet ist für jeden Satz besser, aber insgesamt schlechter.

Das Paradox stammt von der Intuition, dass Bart kein besserer Redakteur auf jedem Satz, aber schlechter insgesamt vielleicht sein konnte. Perle hat bewiesen, wie das möglich ist, wenn "der bessere Redakteur" im gegensachlichen Sinn genommen wird: "Waren Bart, um alle Sachen in einem Satz zu editieren, den er besser tun würde, als Lisa auf jenen denselben Sachen würde". Klar können Frequenzdaten nicht diesen Sinn des "besseren Redakteurs unterstützen," weil er uns nicht erzählt, wie Bart auf Sachen leisten würde, die von Lisa, und umgekehrt editiert sind. Hinter unserer Meinung aber nehmen wir an, dass die Artikel aufs Geratewohl Bart und Lisa, einer Annahme zugeteilt wurden, die (für eine große Probe) die gegensachliche Interpretation des "besseren Redakteurs unterstützen würde." Jedoch, unter zufälligen Anweisungsbedingungen, sind die in diesem Beispiel gegebenen Daten unwahrscheinlich, der für unsere Überraschung verantwortlich ist, wenn er der Rate-Umkehrung gegenübersteht.

Die arithmetische Basis des Paradoxes ist unverfänglich. Wenn und wir finden, dass das größer sein muss als. Jedoch, wenn verschiedene Gewichte verwendet werden, um die gesamte Kerbe für jede Person dann zu bilden, kann dieses Gefühl enttäuscht sein. Hier wird der erste Test für Lisa und für den Baronet beschwert, während die Gewichte auf dem zweiten Test umgekehrt werden.

Durch die mehr äußerste Wiedergewichtung kann die gesamte Kerbe von Lisa zu 60 % und Baronet unten zu 30 % hochgeschoben werden.

Lisa ist ein besserer Redakteur durchschnittlich, weil ihre gesamte Erfolg-Rate höher ist. Aber es ist möglich, die Geschichte in einem Weg erzählt zu haben, der es offensichtlich würde scheinen lassen, dass Baronet fleißiger ist.

Das Paradox von Simpson zeigt uns ein äußerstes Beispiel der Wichtigkeit vom Umfassen von Daten über mögliche Verwechseln-Variablen, wenn es versucht, kausale Beziehungen zu berechnen. Genaue Kriterien, um eine Reihe von "Verwechseln-Variablen," auszuwählen

(d. h., Variablen, die richtige kausale Beziehungen, wenn eingeschlossen, in die Analyse nachgeben),

wird in Pearl gegeben, der kausale Graphen verwendet.

Während sich das Paradox von Simpson häufig auf die Analyse von Tischen der Zählung, wie gezeigt, in diesem Beispiel bezieht, kommt es auch mit dauernden Daten vor: Zum Beispiel, wenn man getrennte Linien des rückwärts Gehens durch zwei Sätze von Daten passt, können die zwei Linien des rückwärts Gehens eine positive Tendenz zeigen, während eine Linie des rückwärts Gehens, die durch alle Daten zusammen geeignet ist, eine negative Tendenz, wie gezeigt, auf dem Bild oben zeigen wird.

Vektor-Interpretation

Das Paradox von Simpson kann auch mit dem 2-dimensionalen Vektorraum illustriert werden. Eine Erfolg-Rate dessen kann durch einen Vektoren, mit einem Hang dessen vertreten werden. Wenn zwei Raten und verbunden werden, weil in den Beispielen, die oben angeführt sind, das Ergebnis durch die Summe der Vektoren vertreten werden kann und, der gemäß der Parallelogramm-Regel der Vektor mit dem Hang ist.

Das Paradox von Simpson sagt, dass, selbst wenn ein Vektor (im Blau in der Zahl) einen kleineren Hang hat als ein anderer Vektor (im Rot), und einen kleineren Hang hat als, kann die Summe der zwei Vektoren (angezeigt durch "+" in der Zahl) noch einen größeren Hang haben als die Summe der zwei Vektoren, wie gezeigt, im Beispiel.

Implikationen zum Entscheidungsbilden

Die praktische Bedeutung des Paradoxes von Simpson erscheint in Entscheidungsbilden-Situationen, wo es das folgende Dilemma aufstellt: Welche Daten sollten wir in der Auswahl einer Handlung, des angesammelten oder des verteilten befragen? Im Nierenstein-Beispiel oben ist es klar, dass, wenn man mit "Kleinen Steinen" diagnostiziert wird oder, "Große Steine" die Daten für die jeweilige Subbevölkerung befragt werden sollten und Behandlung A der Behandlung B bevorzugt würde. Aber und wenn ein Patient nicht diagnostiziert wird, und die Größe des Steins nicht bekannt ist; würde es passend sein, die angesammelten Daten zu befragen und Behandlung B zu verwalten? Das würde gegen den gesunden Menschenverstand stehen; eine Behandlung, die sowohl unter einer Bedingung als auch unter seiner Ablehnung bevorzugt wird, sollte auch bevorzugt werden, wenn die Bedingung unbekannt ist.

Andererseits, wenn die verteilten Daten a priori bevorzugt werden sollen, was hält ein davon ab, die Daten in willkürliche Unterkategorien zu verteilen (sagen Sie gestützt auf der Augenfarbe oder dem Postbehandlungsschmerz) künstlich gebaut, um falsche Wahlen von Behandlungen nachzugeben? Pearl zeigt, dass, tatsächlich, in vielen Fällen es das angesammelte, nicht die verteilten Daten ist, der die richtige Wahl der Handlung gibt. Schlechter noch, in Anbetracht desselben Tisches, sollte man manchmal dem verteilten und manchmal den angesammelten Daten abhängig von der Geschichte hinter den Daten folgen; mit jeder Geschichte, die seine eigene Wahl diktiert. Pearl denkt, dass das das echte Paradox hinter der Umkehrung von Simpson ist.

Betreffs, warum, und wie eine Geschichte, nicht Daten, Wahlen diktieren sollte, die Antwort ist, dass es die Geschichte ist, die die kausalen Beziehungen unter den Variablen verschlüsselt. Sobald wir diese Beziehungen herausziehen und sie in einem Graphen genannt ein kausales Netz von Bayesian vertreten, das wir algorithmisch prüfen können, ob eine gegebene Teilung, das Verwechseln von Variablen vertretend, die richtige Antwort gibt. Der Test, genannt "Hintertür", verlangt, dass wir überprüfen, ob die Knoten entsprechend den Verwechseln-Variablen bestimmte Pfade im Graphen abfangen. Das reduziert das Paradox von Simpson auf eine Übung in der Graph-Theorie.

Die Psychologie des Paradoxes von Simpson

Das psychologische Interesse am Paradox von Simpson sucht zu

erklären Sie, warum Leute Zeichen-Umkehrung halten, um zu sein

unmöglich zuerst, verletzt durch die Idee

dass eine Behandlung beiden Männern nützen konnte

und Frauen und Schaden die Bevölkerung als Ganzes.

Die Frage besteht darin, wo Leute diesen bekommen

starke Intuition von, und wie es in der Meinung verschlüsselt wird.

Das Paradox von Simpson demonstriert, dass diese Intuition nicht sein kann

unterstützt durch die Wahrscheinlichkeitsrechnung allein, und so geführte Philosophen

nachzusinnen, dass es durch einen angeborenen kausalen unterstützt wird

Logik, die Leute im Denken über Handlungen führt

und ihre Folgen.

Das "sichere Ding des Wilden Grundsatz"

ist ein Beispiel dessen, was solche Logik zur Folge haben kann.

Eine qualifizierte Version des des Wilden

sicheres Ding Grundsatz kann tatsächlich abgeleitet werden

von Pearl - Rechnung

und liest:

"Eine Handlung, die die Wahrscheinlichkeit eines Ereignisses in vergrößert

jede Subbevölkerung dessen muss auch die Wahrscheinlichkeit vergrößern

in der Bevölkerung als Ganzes, vorausgesetzt, dass die Handlung

ändert den Vertrieb der Subbevölkerungen nicht."

Das weist dass Kenntnisse über Handlungen und Folgen darauf hin

wird in einer Form versorgt, die Kausalen Bayesian Netzen ähnelt.

Wie ist wahrscheinlich das Paradox von Simpson?

Wenn 2 × 2 × 2 Tisch, solcher als im

Nierenstein-Beispiel,

wird aufs Geratewohl ausgewählt, die Wahrscheinlichkeit ist ungefähr / das

Das Paradox von Simpson wird rein zufällig vorkommen.

Referenzen

Verweisungen

Links

,

Das Paradox von Russell / Grüne Partei
Impressum & Datenschutz