Korrelation bezieht Verursachung nicht ein

"Korrelation deutet nicht an, dass Verursachung" (verbunden mit dem "Ignorieren eines häufigen Grundes" und zweifelhafter Ursache) ein Ausdruck ist, der in der Wissenschaft und Statistik verwendet ist, um zu betonen, dass die Korrelation zwischen zwei Variablen nicht automatisch andeutet, dass man den anderen verursacht (obwohl Korrelation für die geradlinige Verursachung ohne jedes Drittel und das Ausgleichen begründender Variable notwendig ist, und mögliche Ursachen oder Gebiete für die weitere Untersuchung anzeigen kann; mit anderen Worten ist Korrelation ein Hinweis).

Der entgegengesetzte Glaube, Korrelation beweist Verursachung, ist ein logischer Scheinbeweis durch der zwei Ereignisse kommen die vor zusammen werden gefordert, eine Beziehung der Ursache und Wirkung zu haben. Der Scheinbeweis ist auch bekannt als cum hoc ergo propter hoc (Latein für "damit, deshalb wegen dessen") und falsche Ursache. Es ist ein allgemeiner Scheinbeweis, in dem es angenommen wird, dass, weil zwei Dinge oder Ereignisse zusammen vorkommen, man die Ursache vom anderen sein muss. Im Vergleich, der Scheinbeweis eilen dahin hoc ergo propter verlangt hoc, dass ein Ereignis vor ander vorkommt und so als ein zusammenhängender Scheinbeweis betrachtet werden kann.

In einem weit studierten Beispiel haben zahlreiche epidemiologische Studien gezeigt, dass Frauen, die vereinigte Hormonersatztherapie (HRT) auch nahmen, einen wenigeren als im Durchschnitt Vorkommen der ischämischen Herzkrankheit (CHD), Hauptärzte hatten, um vorzuschlagen, dass HRT gegen CHD Schutz-war. Aber kontrollierte Proben von randomized haben gezeigt, dass HRT eine kleine, aber statistisch bedeutende Zunahme in der Gefahr von CHD verursacht hat. Die neue Darlegung der Daten von den epidemiologischen Studien hat gezeigt, dass Frauen, die HRT übernehmen, mit größerer Wahrscheinlichkeit von höheren sozioökonomischen Gruppen (ABC1), mit besser sein konnten als durchschnittliche Diät und Übungsregierungen. Der Gebrauch von HRT und das verminderte Vorkommen der ischämischen Herzkrankheit waren zusammenfallende Effekten eines häufigen Grundes (d. h. die Vorteile, die mit einem höheren sozioökonomischen Status vereinigt sind), aber nicht Ursache und Wirkung, wie angenommen hatte.

Gebrauch

In der Logik "bezieht" der technische Gebrauch des Wortes "ein" bedeutet, "ein genügend Umstand zu sein". Das ist die von Statistikern beabsichtigte Bedeutung, wenn sie sagen, dass Verursachung nicht sicher ist. Tatsächlich deutet p an, dass q die technische Bedeutung der logischen Implikation hat: wenn p dann q symbolisiert als p  q. Das ist, "wenn Umstand p wahr ist, dann folgt q notwendigerweise." In diesem Sinn ist es immer richtig, um zu sagen, dass "Korrelation Verursachung nicht einbezieht".

Jedoch, im zufälligen Gebrauch, "deutet" das Wort lose "an", dass Mittel andeutet aber nicht verlangt. Die Idee, dass Korrelation und Verursachung verbunden werden, ist sicher wahr; wo es Verursachung gibt, wird es wahrscheinlich Korrelation geben. Tatsächlich wird Korrelation verwendet, wenn man Verursachung ableitet; der wichtige Punkt ist, dass solche Schlussfolgerungen nicht immer richtig sind, weil es andere Möglichkeiten, wie erklärt, später in diesem Artikel gibt.

Edward Tufte, in einer Kritik der Kürze der "Korrelation bezieht Verursachung nicht ein" missbilligt der Gebrauch dessen, soll Korrelation und Verursachung verbinden (weil in der "Korrelation nicht Verursachung" ist), seine Ungenauigkeit als unvollständig zitierend. Während es nicht der Fall ist, dass Korrelation Verursachung ist, einfach feststellend, dass ihre Nichtgleichwertigkeit Information über ihre Beziehung weglässt. Tufte schlägt vor, dass die kürzeste wahre Behauptung, die über die Kausalität und Korrelation gemacht werden kann, einer des folgenden ist:

  • "Empirisch beobachteter covariation ist ein notwendiger, aber nicht genügend Bedingung für die Kausalität."
  • "Korrelation ist nicht Verursachung, aber es sicher ist ein Hinweis."

Allgemeines Muster

Der cum hoc ergo propter hoc logischer Scheinbeweis kann wie folgt ausgedrückt werden:

  1. Ein Vorkommen in der Korrelation mit B.
  2. Deshalb, Ursachen B.

In diesem Typ des logischen Scheinbeweises macht man einen Frühbeschluss über die Kausalität nach dem Beobachten nur einer Korrelation zwischen zwei oder mehr Faktoren. Allgemein, wenn, wie man beobachtet, ein Faktor (A) nur mit einem anderen Faktor (B) aufeinander bezogen wird, wird es manchmal als selbstverständlich betrachtet, dass A B verursacht, selbst wenn keine Beweise es unterstützen. Das ist ein logischer Scheinbeweis, weil es mindestens fünf Möglichkeiten gibt:

  1. Ein Können, die Ursache von B sein.
  2. B kann die Ursache von A sein.
  3. ein unbekannter dritter Faktor C kann wirklich die Ursache sowohl von A als auch von B sein.
  4. es kann eine Kombination der obengenannten drei Beziehungen geben. Zum Beispiel kann B die Ursache zur gleichen Zeit sein, weil A die Ursache von B ist (widersprechend, dass die einzige Beziehung zwischen A und B dass Ursachen B ist). Das beschreibt ein Selbstverstärkungssystem.
  5. die "Beziehung" ist ungefähr ein Zufall kompliziert oder indirekt, dass es einen Zufall effektiver genannt wird (d. h. zwei Ereignisse, die zur gleichen Zeit vorkommen, die keine direkte Beziehung zu einander außer der Tatsache haben, dass sie zur gleichen Zeit vorkommen). Eine größere Beispielgröße hilft, die Chance eines Zufalls zu reduzieren, wenn es keinen systematischen Fehler im Experiment gibt.

Mit anderen Worten kann es keinen Beschluss geben, der bezüglich der Existenz oder der Richtung einer Beziehung der Ursache und Wirkung nur von der Tatsache gemacht ist, dass A und B aufeinander bezogen werden. Bestimmung, ob es eine wirkliche Beziehung der Ursache und Wirkung gibt, verlangt weitere Untersuchung, selbst wenn die Beziehung zwischen A und B statistisch bedeutend ist, wird eine große Wirkungsgröße beobachtet, oder ein großer Teil der Abweichung wird erklärt.

Beispiele, unlogisch Verursachung aus der Korrelation abzuleiten

B verursacht (Rückverursachung)

Wie man

beobachtet, ist:The mehr Feuerwehrmänner, die mit einem Feuer, das größere das Feuer kämpfen.

:Therefore-Feuerwehrmänner verursachen Feuer.

In diesem Beispiel deutet die Korrelation zwischen der Zahl von Feuerwehrmännern an einer Szene und der Größe des Feuers nicht an, dass die Feuerwehrmänner das Feuer verursachen. Feuerwehrmänner werden gemäß der Strenge des Feuers gesandt, und wenn es ein großes Feuer gibt, eine größere Zahl von Feuerwehrmännern werden gesandt; deshalb ist es eher, dass Feuer Feuerwehrmänner veranlasst, die Szene zu erreichen. So ist der obengenannte Beschluss falsch.

Ursachen B und B verursacht (bidirektionale Verursachung)

:Increased-Druck wird mit der vergrößerten Temperatur vereinigt.

:Therefore-Druck verursacht Temperatur.

Das ideale Gasgesetz beschreibt die direkte Beziehung zwischen Druck und Temperatur (zusammen mit anderen Faktoren), um zu zeigen, dass es eine direkte Korrelation zwischen den zwei Eigenschaften gibt. Für ein festes Volumen und Masse von Benzin wird eine Zunahme in der Temperatur eine Zunahme im Druck verursachen; ebenfalls wird vergrößerter Druck eine Zunahme in der Temperatur verursachen. Das demonstriert bidirektionale Verursachung. Der Beschluss, dass Druck Temperatur verursacht, ist wahr, aber wird durch die Proposition nicht logisch versichert.

Der dritte Faktor C (die allgemein-kausale Variable) verursacht sowohl A als auch B

Alle diese Beispiele befassen sich mit einer versteckten Variable, die einfach eine verborgene dritte Variable ist, die beide Ursachen der Korrelation betrifft; zum Beispiel, die Tatsache, dass es Sommer im Beispiel 3 ist. Eine Schwierigkeit entsteht häufig auch, wovon der dritte Faktor, obwohl im Wesentlichen verschieden, von A und B, so nah mit A und/oder B verbunden ist, um mit ihnen verwirrt oder um sehr schwierig zu sein, sich ihnen wissenschaftlich loszulösen (sieh Beispiel 4).

Beispiel 1

:Sleeping mit jemandes Schuhen darauf wird damit stark aufeinander bezogen, mit einem Kopfweh aufzuwachen.

:Therefore, mit jemandes Schuhen auf Ursache-Kopfweh schlafend.

Das obengenannte Beispiel begeht den Scheinbeweis "Korrelation bezieht Verursachung ein", weil es vorzeitig dass beschließt, mit jemandes Schuhen auf Ursache-Kopfweh schlafend. Eine plausiblere Erklärung besteht darin, dass beide durch einen dritten Faktor verursacht werden, in diesem Fall betrunken ins Bett gehend, der dadurch eine Korrelation verursacht. So ist der Beschluss falsch.

Beispiel 2

:Young-Kinder, die mit dem Licht darauf schlafen, werden viel mit größerer Wahrscheinlichkeit Kurzsichtigkeit im späteren Leben entwickeln.

:Therefore, mit dem Licht auf Ursache-Kurzsichtigkeit schlafend.

Das ist ein wissenschaftliches Beispiel, das sich aus einer Studie an der Universität Pennsylvaniens Medizinisches Zentrum ergeben hat. Veröffentlicht im Problem am 13. Mai 1999 der Natur hat die Studie viel Einschluss zurzeit in der populären Presse erhalten. Jedoch hat eine spätere Studie an der Ohio Staatlichen Universität dass Säuglings nicht gefunden, die mit dem Licht auf den verursachten die Entwicklung der Kurzsichtigkeit schlafen. Es hat wirklich eine starke Verbindung zwischen elterlicher Kurzsichtigkeit und der Entwicklung der Kinderkurzsichtigkeit gefunden, auch bemerkend, dass kurzsichtige Eltern mit größerer Wahrscheinlichkeit ein Licht auf im Schlafzimmer ihrer Kinder verlassen konnten. In diesem Fall ist die Ursache von beiden Bedingungen elterliche Kurzsichtigkeit, und der oben erwähnte Beschluss ist falsch.

Beispiel 3

:As-Eis-Umsatzsteigerung, die Rate von ertrinkenden Todesfällen nimmt scharf zu.

:Therefore, Eis-Verbrauch verursacht Ertrinken.

Das oben erwähnte Beispiel scheitert, die Wichtigkeit der Zeit und Temperatur in der Beziehung zu Eis-Verkäufen anzuerkennen. Eis wird während der heißen Sommermonate an einer viel größeren Rate verkauft als während kälterer Zeiten, und es ist während dieser heißen Sommermonate, die Leute mit größerer Wahrscheinlichkeit in Tätigkeiten verpflichten werden, die mit Wasser wie das Schwimmen verbunden sind. Der vergrößerte ertrinkende Tod wird einfach durch mehr Aussetzung von wasserbasierten Tätigkeiten, nicht Eis herbeigeführt. Der festgesetzte Beschluss ist falsch.

Beispiel 4

:A hypothetische Studie zeigt eine Beziehung zwischen Testangst-Hunderten und Scheuheitshunderten, mit einem statistischen R-Wert (Kraft der Korrelation) von +.59.

:Therefore, es kann einfach beschlossen werden, dass Scheuheit, in einem Teil, kausal Testangst beeinflusst.

Jedoch, wie gestoßen, in vielen psychologischen Studien, einer anderen Variable, wird eine "Befangenheitskerbe," entdeckt, der eine schärfere Korrelation (+.73) mit der Scheuheit hat. Das deutet ein mögliches "drittes variables" Problem jedoch an, wenn drei solche nah zusammenhängenden Maßnahmen gefunden werden, weist es weiter darauf hin, dass jeder bidirektionale Tendenzen haben kann (sieh "bidirektionale Variable," oben), eine Traube von aufeinander bezogenen Werten jedes Beeinflussen von einander einigermaßen seiend. Deshalb kann der einfache Beschluss oben falsch sein.

Beispiel 5

:Since die 1950er Jahre, sowohl das atmosphärische CO Niveau als auch die Beleibtheitsniveaus haben scharf zugenommen.

:Hence, atmosphärischer CO verursacht Beleibtheit.

Als Autoumsatzsteigerung, Kohlendioxyd-Niveau-Zunahme sowie Beleibtheit weil tun Leute weniger Wandern und das Radeln.

Beispiel 6

:HDL ("gutes") Cholesterin wird mit dem Vorkommen des Herzanfalls negativ aufeinander bezogen.

:Therefore, Medikament nehmend, um HDL zu erheben, wird die Chance vermindern, einen Herzanfall zu haben.

Weitere Forschung hat diesen Beschluss in Zweifel gezogen. Statt dessen kann es sein, dass andere zu Grunde liegende Faktoren, wie Gene, Diät und übt aus, betrifft sowohl HDL Niveaus als auch die Wahrscheinlichkeit, einen Herzanfall zu haben; es ist möglich, dass Arzneimittel den direkt messbaren Faktor, die HDL Niveaus betreffen können, ohne die Chance des Herzanfalls zu betreffen.

Zufall

:With eine Abnahme in der Zahl von Piraten, es hat eine Zunahme in der Erderwärmung im Laufe derselben Periode gegeben.

:Therefore, Erderwärmung wird durch einen Mangel an Piraten verursacht.

Dieses Beispiel wird satirisch durch die Parodie-Religion Pastafarianism verwendet, um den logischen Scheinbeweis des Annehmens zu illustrieren, dass Korrelation Verursachung gleichkommt.

Bestimmung der Verursachung

David Hume hat behauptet, dass Kausalität auf der Erfahrung und ähnlich gestützten Erfahrung basiert in der Annahme, dass die zukünftigen Modelle die Vergangenheit, die nur der Reihe nach auf der Erfahrung - das Führen zu kreisförmiger Logik basieren kann. Im Beschluss hat er behauptet, dass Kausalität auf dem wirklichen Denken nicht basiert: Nur Korrelation kann wirklich wahrgenommen werden.

Intuitiv scheint Verursachung, nicht nur eine Korrelation, aber eine gegensachliche Abhängigkeit zu verlangen. Nehmen Sie an, dass ein Student schlecht auf einem Test geleistet hat und glaubt, dass die Ursache sein nicht das Studieren war. Um das zu beweisen, denkt man an das gegensachliche - derselbe Student, der denselben Test unter denselben Verhältnissen schreibt, aber die Nacht vorher studiert hat. Wenn man Geschichte zurückspulen, und nur ein kleines Ding ändern konnte (die Studentenstudie für die Prüfung machend), dann konnte Verursachung (durch das Vergleichen der Version 1 mit der Version 2) beobachtet werden. Weil man Geschichte und Wiederholungsspiel-Ereignisse nach dem Vornehmen kleiner kontrollierter Änderungen nicht zurückspulen kann, kann Verursachung nur abgeleitet, nie genau bekannt werden. Das wird das Grundsätzliche Problem der Kausalen Schlussfolgerung genannt - es ist unmöglich, kausale Effekten direkt zu beobachten.

Eine Hauptabsicht von wissenschaftlichen Experimenten und statistischen Methoden ist, so am besten näher zu kommen, wie möglich dem gegensachlichen Staat der Welt. Zum Beispiel konnte man ein Experiment auf identischen Zwillingen führen, die, wie man bekannt, dieselben Ränge auf ihren Tests durchweg bekommen haben. Ein Zwilling wird gesandt, um seit sechs Stunden zu studieren, während der andere an den Vergnügungspark gesandt wird. Wenn ihre Testhunderte plötzlich durch einen großen Grad abweichen würden, würde das starke Beweise sein, dass das Studieren (oder das Gehen zum Vergnügungspark) eine kausale Wirkung auf Testhunderte hatten. In diesem Fall würde die Korrelation zwischen Studieren- und Testhunderten fast sicher Verursachung einbeziehen.

Gut bestimmte experimentelle Studien ersetzen Gleichheit von Personen als im vorherigen Beispiel durch die Gleichheit von Gruppen. Das wird durch randomization der Themen zwei oder mehr Gruppen erreicht. Obwohl nicht ein vollkommenes System, sich die Wahrscheinlichkeit, in allen Aspekten gleich zu sein, mit der Zahl von Themen gelegt zufällig in die Gruppen der Behandlung/Suggestionsmittels erhebt. Von der Bedeutung des Unterschieds der Wirkung der Behandlung gegen das Suggestionsmittel kann man die Wahrscheinlichkeit der Behandlung schließen, die eine kausale Wirkung auf die Krankheit hat. Diese Wahrscheinlichkeit kann in statistischen Begriffen durch den P-Wert gemessen werden.

Wenn experimentelle Studien unmöglich sind und nur vorher existierende Daten verfügbar sind, wie gewöhnlich der Fall zum Beispiel in der Volkswirtschaft ist, kann Regressionsanalyse verwendet werden. Faktoren außer der potenziellen begründenden Variable von Interesse werden für durch das Umfassen von ihnen als regressors zusätzlich zum regressor das Darstellen der Variable von Interesse kontrolliert. Falsche Schlussfolgerungen der Verursachung, die erwartet ist, Verursachung (oder falsche Schätzungen des Umfangs der Verursachung umzukehren, erwartet die Anwesenheit der bidirektionalen Verursachung) können durch das Verwenden explanators (regressors) vermieden werden, die notwendigerweise exogenous, wie physischer explanators wie Niederschlag-Betrag (als eine Determinante von, sagen wir, Terminware-Preisen) sind, hat Variablen isoliert, deren Werte bestimmt wurden, bevor der Wert der abhängigen Variable, instrumentale Variablen für den explanators (gewählt gestützt auf ihrem bekannten exogeneity) bestimmt wurde, Sieh usw. Causality#Economics. Unechte Korrelation wegen des gegenseitigen Einflusses von einer dritten, allgemeinen, begründenden Variable, ist härter zu vermeiden: Das Modell muss solch angegeben werden, dass es einen theoretischen Grund gibt zu glauben, dass keine solche zu Grunde liegende begründende Variable aus dem Modell weggelassen worden ist; insbesondere zu Grunde liegende Zeittendenzen sowohl der abhängigen Variable als auch der unabhängigen (potenziell begründenden) Variable müssen für durch das Umfassen der Zeit als eine andere unabhängige Variable kontrolliert werden.

Siehe auch

Links


Charles I von Naples / Jan Bos
Impressum & Datenschutz