Das Dilemma des Gefangenen

Das Dilemma des Gefangenen ist ein kanonisches Beispiel eines Spiels, das in der Spieltheorie analysiert ist, die zeigt, warum zwei Personen nicht zusammenarbeiten könnten, selbst wenn es scheint, dass es in ihrem besten Interesse ist, so zu tun. Es wurde von Merrill Flood und Melvin Dresher ursprünglich eingerahmt, der an RAND 1950 arbeitet. Albert W. Tucker hat das Spiel mit Gefängnisstrafe-Belohnungen formalisiert und hat ihm das Dilemma des "Gefangenen" Name (Poundstone, 1992) gegeben. Ein klassisches Beispiel des Dilemmas des Gefangenen (PD) wird wie folgt präsentiert:

:Two-Männer werden angehalten, aber die Polizisten besitzen genug Information für eine Überzeugung nicht. Im Anschluss an die Trennung der zwei Männer das Polizeiangebot (desertiert) sowohl ein ähnliches Geschäft — wenn man gegen seinen Partner aussagt/verrät), als auch der andere bleibt still (arbeitet zusammen/hilft), der Verräter geht frei, und der Mitarbeiter erhält den vollen Jahressatz. Wenn beide still bleiben, beide zu nur einem Monat im Gefängnis für eine geringe Anklage verurteilt werden. Wenn jeder 'Ratten' der andere, jeder einen dreimonatigen Satz erhält. Jeder Gefangene muss beschließen, entweder zu verraten oder still zu bleiben; die Entscheidung von jedem wird ruhig verhalten. Was sollten sie tun?

Wenn es hier annimmt, dass jeder Spieler mit nur dem Nachlassen seiner Zeit mit dem Gefängnis beschäftigt ist, wird das Spiel ein Nichtnullsumme-Spiel, wo die zwei Spieler entweder helfen oder den anderen verraten können. Im Spiel scheint die alleinige Sorge der Gefangenen, seine eigene Belohnung zu vergrößern. Die interessante Symmetrie dieses Problems ist, dass die logische Entscheidung jeden dazu bringt, den anderen zu verraten, wenn auch ihr individueller 'Preis' größer sein würde, wenn sie zusammenarbeiten würden.

In der regelmäßigen Version dieses Spiels wird Kollaboration durch den Verrat, und infolgedessen beherrscht, das einzige mögliche Ergebnis des Spiels ist für beide Gefangenen, um den anderen zu verraten. Unabhängig wovon der andere Gefangene wählt, wird man immer eine größere Belohnung gewinnen, indem man den anderen verraten wird. Weil Verrat immer vorteilhafter ist als Zusammenarbeit, würden alle objektiven Gefangenen den anderen anscheinend verraten.

Im verlängerten Form-Spiel wird das Spiel immer wieder, und folglich gespielt, beide Gefangenen haben unaufhörlich eine Gelegenheit, anderen für die vorherige Entscheidung zu bestrafen. Wenn die Zahl von Zeiten das Spiel wird gespielt, bekannt ist, bedeutet der begrenzte Aspekt des Spiels, dass durch die rückwärts gerichtete Induktion die zwei Gefangenen einander wiederholt verraten werden.

Im zufälligen Gebrauch kann das Etikett "das Dilemma des Gefangenen" auf Situationen nicht ausschließlich das Zusammenbringen der formellen Kriterien der klassischen oder wiederholenden Spiele, zum Beispiel, derjenigen angewandt werden, in denen zwei Entitäten wichtige Vorteile des Zusammenarbeitens gewinnen oder unter dem Misserfolg leiden konnten, so zu tun, aber es bloß schwierig oder teuer, nicht notwendigerweise unmöglich zu finden, ihre Tätigkeiten zu koordinieren, um Zusammenarbeit zu erreichen.

Strategie für das Dilemma der klassischen Gefangenen

Das normale Spiel wird unten gezeigt:

Hier unabhängig davon, was der andere entscheidet, bekommt jeder Gefangene eine höhere Belohnung, indem er den anderen verrät. Zum Beispiel kann Gefangener A (gemäß den Belohnungen oben) stellen fest, dass, egal was Gefangener B wählt, Gefangener A von 'ratting er' besser ist (desertierend) als bleibend still (das Zusammenarbeiten).

Infolgedessen, gestützt auf den Belohnungen oben, sollte Gefangener A ihn logisch verraten. Das Spiel ist symmetrisch, so sollte Gefangener B auf die gleiche Weise handeln, Da sich beide vernünftig dafür entscheiden zu desertieren, erhält jeder eine niedrigere Belohnung, als wenn beide ruhig bleiben sollten. Traditionelle Spieltheorie läuft auf beide Spieler hinaus, die daran schlechter sind, als wenn jeder beschlossen hat, den Satz seines Komplizen auf Kosten des Verbringens von mehr Zeit im Gefängnis selbst zu vermindern.

Verallgemeinerte Form

Die Struktur des Dilemmas der traditionellen Gefangenen kann durch das Entfernen seiner ursprünglichen Gefangener-Einstellung analysiert werden. Nehmen Sie an, dass die zwei Spieler durch Farben vertreten, rot und blau werden, und dass jeder Spieler beschließt, entweder "Zusammenzuarbeiten" oder "Zu desertieren".

Wenn beide Spieler spielen, "arbeiten Zusammen" sie beide bekommen die Belohnung A. Wenn Blaue Spiele "Defekt", während Rote Spiele dann Blau "Zusammenarbeiten", kommen, bekommt B, während Rot, C. Symmetrisch, wenn Blaue Spiele "Zusammenarbeiten", während Rote Spiele dann Blauer "Defekt" kommen, bekommt Belohnung C, während Rot, Belohnung B. Wenn beide Spieler "Defekt" spielen, bekommen sie beide die Belohnung D.

In Bezug auf allgemeine Punkt-Werte:

Um ein Dilemma eines Gefangenen zu sein, muss der folgende wahr sein:

B> A> D> C

Die Tatsache, dass A> D andeutet, dass "Beide" Ergebnis Zusammenarbeiten, wird dem "Beidem Defekt" Ergebnis "sozial" bevorzugt (die Summe von Belohnungen ist größer), während B> A und D> C der Reihe nach andeuten, dass der "Beider Defekt" Ergebnis derjenige ist, der wirklich resultieren wird.

Es ist für ein Dilemma eines Gefangenen nicht notwendig, als im obengenannten Beispiel bloß ausschließlich symmetrisch zu sein, dass die Wahlen, die individuell optimal (und stark dominierend sind) auf ein Gleichgewicht hinauslaufen, das sozial untergeordnet ist.

Das Dilemma der wiederholten Gefangenen

Wenn zwei Spieler das Dilemma von Gefangenen mehr spielen als einmal in der Folge und sie sich an vorherige Handlungen ihres Gegners erinnern und ihre Strategie entsprechend ändern, wird das Spiel das Dilemma von wiederholten Gefangenen genannt.

Zusätzlich zur allgemeinen Form oben verlangt die wiederholende Version auch dass 2A> B + C, um Wechselzusammenarbeit und Lossagung zu verhindern, die eine größere Belohnung gibt als gegenseitige Zusammenarbeit.

Das Dilemma-Spiel der wiederholten Gefangenen ist für bestimmte Theorien der menschlichen Zusammenarbeit und des Vertrauens grundsätzlich. In der Annahme, dass das Spiel Transaktionen zwischen zwei Menschen modellieren kann, die Vertrauen verlangen, kann das kooperative Verhalten in Bevölkerungen durch ein Mehrfachabspiellaufwerk, wiederholt, Version des Spiels modelliert werden. Es hat folglich viele Gelehrte im Laufe der Jahre fasziniert. 1975 haben Grofman und Pool die Zählung von wissenschaftlichen Artikeln geschätzt, die ihm an mehr als 2,000 gewidmet sind. Das Dilemma der wiederholten Gefangenen ist auch das "Friedenskriegsspiel" genannt geworden.

Wenn das Spiel genau N Zeiten gespielt wird und beide Spieler das wissen, dann ist es immer Spiel, das theoretisch optimal ist, um in allen Runden zu desertieren. Das einzige mögliche Gleichgewicht von Nash soll immer desertieren. Der Beweis ist induktiv: Man könnte ebenso auf der letzten Umdrehung desertieren, da der Gegner keine Chance haben wird, den Spieler zu bestrafen. Deshalb werden beide auf der letzten Umdrehung desertieren. So könnte der Spieler ebenso auf der zweiten-zu-letzt Umdrehung desertieren, da der Gegner auf dem letzten desertieren wird, egal was und so weiter getan wird. Dasselbe gilt, wenn die Spiellänge unbekannt ist, aber eine bekannte obere Grenze hat.

Verschieden vom Dilemma der Standardgefangenen im Dilemma der wiederholten Gefangenen ist die Lossagungsstrategie gegenintuitiv und scheitert schlecht, das Verhalten von menschlichen Spielern vorauszusagen. Innerhalb der Standardwirtschaftstheorie aber ist das die einzige richtige Antwort. Die supervernünftige Strategie im Dilemma der wiederholten Gefangenen mit festem N soll gegen einen supervernünftigen Gegner, und in der Grenze von großem N zusammenarbeiten, experimentelle Ergebnisse auf Strategien stimmen mit der supervernünftigen Version, nicht der spieltheoretischen vernünftigen überein.

Für die Zusammenarbeit, um zwischen dem Spiel theoretische vernünftige Spieler zu erscheinen, muss die Gesamtzahl von Runden N zufällig, oder mindestens den Spielern unbekannt sein. In diesem Fall immer kann Defekt eine ausschließlich dominierende Strategie, nur ein Gleichgewicht von Nash nicht mehr sein. Unter Ergebnissen, die von Robert Aumann in einer 1959-Zeitung gezeigt sind, können vernünftige Spieler, die wiederholt für unbestimmt lange Spiele aufeinander wirken, das kooperative Ergebnis stützen.

Strategie für das Dilemma der wiederholten Gefangenen

Das Interesse am Dilemma von wiederholten Gefangenen (IPD) wurde von Robert Axelrod in seinem Buch Die Evolution der Zusammenarbeit (1984) entzündet. Darin berichtet er über ein Turnier, das er des N-Schritt-Gefangener-Dilemmas organisiert hat (mit N befestigt), in dem Teilnehmer ihre gegenseitige Strategie immer wieder wählen, und Gedächtnis ihrer vorherigen Begegnungen haben müssen. Axelrod hat akademische Kollegen überall auf der Welt eingeladen, Computerstrategien auszudenken, sich in einem IPD Turnier zu bewerben. Die Programme, in die geändert weit in der algorithmischen Kompliziertheit, anfänglichen Feindschaft, Kapazität für die Vergebung und so weiter eingegangen wurde.

Axelrod hat entdeckt, dass, als diese Begegnungen im Laufe eines langen Zeitraumes der Zeit mit vielen Spielern, jedes mit verschiedenen Strategien wiederholt wurden, gierige Strategien dazu geneigt haben, sehr schlecht im langen Lauf zu tun, während altruistischere Strategien besser, wie beurteilt, rein durch den Eigennutz getan haben. Er hat das verwendet, um einen möglichen Mechanismus für die Evolution des altruistischen Verhaltens von Mechanismen zu zeigen, die durch die Zuchtwahl am Anfang rein egoistisch sind.

Wie man

fand, war die beste deterministische Strategie Auge um Auge, Zahn um Zahn, den Anatol Rapoport entwickelt hat und ins Turnier eingetreten ist. Es war von jedem eingegangenen Programm am einfachsten, nur vier Linien von GRUNDLEGENDEN enthaltend, und hat den Streit gewonnen. Die Strategie ist einfach, auf der ersten Wiederholung des Spiels zusammenzuarbeiten; danach tut der Spieler, was sein oder ihr Gegner auf der vorherigen Bewegung getan hat. Abhängig von der Situation kann eine ein bisschen bessere Strategie "Auge um Auge, Zahn um Zahn mit der Vergebung sein." Wenn die Gegner-Defekte, auf der folgenden Bewegung, der Spieler manchmal irgendwie, mit einer kleinen Wahrscheinlichkeit (ungefähr 1-5 %) zusammenarbeitet. Das berücksichtigt gelegentliche Wiederherstellung davon, in einem Zyklus von Lossagungen gefangen zu werden. Die genaue Wahrscheinlichkeit hängt von der Aufstellung von Gegnern ab.

Indem

er die spitzeneinkerbenden Strategien analysiert hat, hat Axelrod mehrere für eine Strategie notwendige Bedingungen festgesetzt, erfolgreich zu sein.

Nett: Die wichtigste Bedingung besteht darin, dass die Strategie "nett" sein muss, d. h. wird sie nicht desertieren, bevor sein Gegner tut (das wird manchmal einen "optimistischen" Algorithmus genannt). Fast alle spitzeneinkerbenden Strategien waren nett; deshalb wird eine rein egoistische Strategie auf seinem Gegner aus rein selbstsüchtigen Gründen zuerst nicht "betrügen".

Sich rächend: Jedoch hat Axelrod gekämpft, die erfolgreiche Strategie muss kein blinder Optimist sein. Es muss sich manchmal rächen. Ein Beispiel einer sich nichträchenden Strategie ist Immer arbeiten Zusammen. Das ist eine sehr schlechte Wahl, weil "scheußliche" Strategien solche Spieler unbarmherzig ausnutzen werden.

Das Verzeihen: Erfolgreiche Strategien müssen auch versöhnlich sein. Obwohl sich Spieler rächen werden, werden sie wieder zum Zusammenarbeiten zurückweichen, wenn der Gegner nicht fortsetzt zu desertieren. Das hört lange Läufe der Rache und Gegenrache auf, Punkte maximierend.

Nichtneidisch: Die letzte Qualität ist nichtneidisch, der sich nicht müht, mehr zu zählen, als der Gegner (bemerken Sie, dass eine "nette" Strategie mehr nie zählen kann als der Gegner).

Die optimale (Punkte maximierende) Strategie für das ehemalige PD Spiel ist einfach Lossagung; wie erklärt, oben ist das wahr, was auch immer die Zusammensetzung von Gegnern sein kann. Jedoch, im wiederholten-PD spielen die optimale Strategie hängt von den Strategien von wahrscheinlichen Gegnern ab, und wie sie auf Lossagungen und Zusammenarbeiten reagieren werden. Denken Sie zum Beispiel eine Bevölkerung, wo jeder jedes Mal, abgesehen von einer einzelnen Person im Anschluss an Auge um Auge, Zahn um Zahn Strategie desertiert. Diese Person ist an einem geringen Nachteil wegen des Verlustes auf der ersten Umdrehung. In solch einer Bevölkerung ist die optimale Strategie für diese Person, jedes Mal zu desertieren. In einer Bevölkerung mit einem bestimmten Prozentsatz von Immer-Abtrünnigen und dem Rest, der Auge um Auge, Zahn um Zahn Spieler ist, hängt die optimale Strategie für eine Person vom Prozentsatz, und auf der Länge des Spiels ab.

Eine Strategie genannt Pavlov (ein Beispiel des Aufenthalts Gewinn, Verlieren-Schalters) arbeitet bei der ersten Wiederholung zusammen, und wann auch immer der Spieler und Co-Spieler bei der vorherigen Wiederholung dasselbe gemacht haben; Defekte von Pavlov, als der Spieler und Co-Spieler verschiedene Sachen bei der vorherigen Wiederholung gemacht haben. Für eine bestimmte Reihe von Rahmen schlägt Pavlov alle anderen Strategien, indem er Bevorzugung Co-Spielern gibt, die Pavlov ähneln.

Das Abstammen der optimalen Strategie wird allgemein auf zwei Weisen getan:

  1. Bayesian Nash Equilibrium: Wenn der statistische Vertrieb von gegenüberliegenden Strategien bestimmt werden kann (z.B 50 % Auge um Auge, Zahn um Zahn, arbeiten 50 % immer zusammen) eine optimale Gegenstrategie kann analytisch abgeleitet werden.
  2. Simulationen von Monte Carlo von Bevölkerungen sind gemacht worden, wo Personen mit niedrigen Hunderten wegsterben, und sich diejenigen mit hohen Hunderten (ein genetischer Algorithmus vermehren, für eine optimale Strategie zu finden). Die Mischung von Algorithmen in der Endbevölkerung hängt allgemein von der Mischung in der anfänglichen Bevölkerung ab. Die Einführung der Veränderung (zufällige Schwankung während der Fortpflanzung) vermindert die Abhängigkeit von der anfänglichen Bevölkerung; empirische Experimente mit solchen Systemen neigen dazu, Auge um Auge, Zahn um Zahn Spieler zu erzeugen (sieh zum Beispiel Schach 1988), aber es gibt keinen analytischen Beweis, dass das immer vorkommen wird.

Obwohl Auge um Auge, Zahn um Zahn betrachtet wird, die robusteste grundlegende Strategie zu sein, hat eine Mannschaft von der Southampton Universität in England (geführt von Professor Nicholas Jennings http://www.ecs.soton.ac.uk/~nrj und aus Rajdeep-Spur, Sarvapali Ramchurn, Alex Rogers, Perukrishnen Vytelingum bestehend), eine neue Strategie auf der Dilemma-Konkurrenz von wiederholten Gefangenen des 20. Jahrestages eingeführt, die sich erwiesen hat, erfolgreicher zu sein, als Auge um Auge, Zahn um Zahn. Diese Strategie hat sich auf die Zusammenarbeit zwischen Programmen verlassen, um die höchste Zahl von Punkten für ein einzelnes Programm zu erreichen. Die Universität hat 60 Programme der Konkurrenz vorgelegt, die entworfen wurden, um einander durch eine Reihe von fünf bis zehn Bewegungen am Anfang anzuerkennen. Sobald diese Anerkennung gemacht wurde, würde ein Programm immer zusammenarbeiten, und der andere würde immer desertieren, die maximale Zahl von Punkten für den Abtrünnigen sichernd. Wenn das Programm begriffe, dass es einen non-Southampton Spieler spielte, würde es unaufhörlich in einem Versuch desertieren, die Kerbe des sich bewerbenden Programms zu minimieren. Infolgedessen hat diese Strategie damit geendet, die drei ersten Positionen in der Konkurrenz, sowie mehrere Positionen zum Boden zu nehmen.

Diese Strategie nutzt die Tatsache aus, dass vielfachen Einträgen in dieser besonderen Konkurrenz erlaubt wurde, und dass die Leistung einer Mannschaft von diesem des im höchsten Maße zählenden Spielers gemessen wurde (das Meinen, dass der Gebrauch von aufopferungsvollen Spielern eine Form von minmaxing war). In einer Konkurrenz, wo man Kontrolle nur eines einzelnen Spielers Auge um Auge, Zahn um Zahn hat, ist sicher eine bessere Strategie. Wegen dieser neuen Regel hat diese Konkurrenz auch wenig theoretische Bedeutung, wenn sie einzelne Reagenz-Strategien verglichen mit dem Samenturnier von Axelrod analysiert. Jedoch hat es das Fachwerk zur Verfügung gestellt, um zu analysieren, wie man kooperative Strategien im Mehrreagenz-Fachwerk besonders in Gegenwart vom Geräusch erreicht. Tatsächlich, lange bevor dieses Turnier der neuen Regeln, Richard Dawkins in seinem Buch gespielt wurde Das Egoistische Gen hat auf die Möglichkeit solchen Strategie-Gewinnens hingewiesen, wenn vielfachen Einträgen erlaubt wurde, aber hat bemerkt, dass am wahrscheinlichsten Axelrod ihnen nicht erlaubt hätte, wenn sie vorgelegt worden wären. Es verlässt sich auch auf das Überlisten von Regeln über das Dilemma der Gefangenen, in dem es keine zwischen den zwei Spielern erlaubte Kommunikation gibt. Wenn die Programme von Southampton in einer Öffnung "zehn Bewegungstanz" verpflichten, einander anzuerkennen, verstärkt das nur gerade, wie wertvolle Kommunikation in der Verschiebung des Gleichgewichtes des Spiels sein kann.

Das Dilemma der dauernden wiederholten Gefangenen

Der grösste Teil der Arbeit am Dilemma der wiederholten Gefangenen hat sich auf den getrennten Fall konzentriert, in dem Spieler entweder zusammenarbeiten oder Defekt, weil dieses Modell relativ einfach ist zu analysieren. Jedoch haben einige Forscher auf Modelle des Dilemmas der dauernden wiederholten Gefangenen geschaut, in dem Spieler im Stande sind, einen variablen Beitrag dem anderen Spieler zu leisten. Le und Boyd haben gefunden, dass in solchen Situationen Zusammenarbeit viel härter ist sich zu entwickeln als im Dilemma der getrennten wiederholten Gefangenen. Die grundlegende Intuition für dieses Ergebnis ist aufrichtig: In einem Dilemma der dauernden Gefangenen, wenn eine Bevölkerung in einem nichtkooperativen Gleichgewicht, Spieler anfängt, die nur geringfügig mehr Konsumverein sind, als Nichtmitarbeiter wenig Vorteil des Passens miteinander bekommen. Im Vergleich, in einem Dilemma der getrennten Gefangenen, Auge um Auge, Zahn um Zahn bekommen Mitarbeiter eine große Belohnungszunahme davon, miteinander in einem nichtkooperativen Gleichgewicht hinsichtlich Nichtmitarbeiter zu passen. Da Natur wohl mehr Gelegenheiten für die variable Zusammenarbeit aber nicht eine strenge Zweiteilung der Zusammenarbeit oder Lossagung anbietet, kann das Dilemma der dauernden Gefangenen helfen zu erklären, warum wahre Beispiele Auge um Auge, Zahn um Zahn der Zusammenarbeit in der Natur äußerst selten sind (ab. Hammerstein), wenn auch Auge um Auge, Zahn um Zahn robust in theoretischen Modellen scheint.

Wahre Beispiele

Diese besonderen Beispiele, Gefangene und Tasche einbeziehend, die und so weiter umschaltet, können erfunden scheinen, aber es gibt tatsächlich viele Beispiele in der menschlichen Wechselwirkung sowie den Wechselwirkungen in der Natur, die dieselbe Belohnungsmatrix haben. Das Dilemma des Gefangenen ist deshalb zu den Sozialwissenschaften wie Volkswirtschaft, Politik und Soziologie, sowie zu den biologischen Wissenschaften wie Ethologie und Entwicklungsbiologie von Interesse. Viele natürliche Prozesse sind in Modelle abstrahiert worden, in denen Wesen mit endlosen Spielen des Dilemmas des Gefangenen beschäftigt sind. Diese breite Anwendbarkeit des PD gibt dem Spiel seine wesentliche Wichtigkeit.

In Umweltstudien

In Umweltstudien ist der PD in Krisen wie globale Klimaveränderung offensichtlich. Alle Länder werden aus einem stabilen Klima einen Nutzen ziehen, aber jedes einzelne Land ist häufig zögernd, um Emissionen zu zügeln. Wie man wahrnimmt, ist der unmittelbare Vorteil für ein einzelnes Land, um aktuelles Verhalten aufrechtzuerhalten, größer als der schließliche Vorteil für alle Länder, wenn Verhalten geändert wurde, deshalb die aktuelle Sackgasse bezüglich der Klimaveränderung erklärend.

In der Psychologie

In der Hingabe-Forschungsvolkswirtschaft / Verhaltensvolkswirtschaft weist George Ainslie darauf hin, dass Hingabe als ein zwischenzeitliches PD Problem zwischen den gegenwärtigen und zukünftigen Selbst des Süchtigen geworfen werden kann. In diesem Fall bedeutet das Desertieren zurückzufallen, und es ist leicht zu sehen, dass sowohl heute als auch in der Zukunft zu nicht desertieren, bei weitem das beste Ergebnis ist, und dass das Desertieren sowohl heute als auch in der Zukunft das schlechteste Ergebnis ist. Der Fall, wo man sich heute enthält, aber in der Zukunft zurückfällt, ist klar ein schlechtes Ergebnis — in einem fühlen, dass die Disziplin und Selbstaufopferung, die am Enthalten heute beteiligt ist, "vergeudet" worden sind, weil der zukünftige Rückfall bedeutet, dass der Süchtige rechter Rücken ist, wo er angefangen hat und über wird anfangen müssen (der ganz demoralisiert, und das Starten über den schwierigeren macht). Der Endfall, wo man sich mit dem suchterzeugenden Verhalten heute beschäftigt, während man sich "Morgen" enthält, wird für jeden vertraut sein, der mit einer Hingabe gekämpft hat. Das Problem hier besteht darin, dass (als in anderem PDs) es einen offensichtlichen Vorteil für das Desertieren "heute" gibt, aber Morgen wird man demselben PD gegenüberstehen, und derselbe offensichtliche Vorteil dann da sein wird, schließlich zu einer endlosen Reihe von Lossagungen führend.

In der Volkswirtschaft

Werbung wird manchmal als ein echtes Lebensbeispiel des Dilemmas des Gefangenen zitiert. Als Zigarettenwerbung in den Vereinigten Staaten gesetzlich war, mussten konkurrierende Zigarettenhersteller wie viel Geld entscheiden, um für die Werbung auszugeben. Die Wirksamkeit des Unternehmens Werbe-A wurde durch die Werbung teilweise bestimmt, die vom Unternehmen B geführt ist. Ebenfalls ist der Gewinn auf Werbung für das Unternehmen B zurückzuführen gewesen wird durch die Werbung betroffen, die vom Unternehmen A geführt ist. Wenn sowohl Unternehmen A als auch Unternehmen B beschlossen haben, während einer gegebenen Periode zu inserieren, annulliert die Werbung, Quittungen bleiben unveränderlich, und Ausgaben nehmen wegen der Kosten der Werbung zu. Beide Unternehmen würden aus der Verminderung der Werbung einen Nutzen ziehen. Jedoch soll Unternehmen B beschließen nicht zu inserieren, Unternehmen A konnte außerordentlich durch die Werbung Vorteil haben. Dennoch hängt der optimale Betrag der Werbung durch ein Unternehmen ab, wie viel Werbung der andere übernimmt. Da die beste Strategie davon abhängig ist, was das andere Unternehmen wählt, gibt es keine dominierende Strategie, und das ist nicht ein Dilemma eines Gefangenen, aber ist eher ein Beispiel einer Herrenjagd. Das Ergebnis ist aber in diesen beiden ähnlich, von denen Unternehmen besser sein würden, waren sie, um weniger zu inserieren, als im Gleichgewicht. Manchmal erscheinen kooperative Handlungsweisen wirklich in Geschäftssituationen. Zum Beispiel haben Zigarettenhersteller die Entwicklung von Gesetzen gutgeheißen, die Zigarettenwerbung verbieten, verstehend, dass das Kosten und Zunahme-Gewinne über die Industrie reduzieren würde. Diese Analyse wird wahrscheinlich in vieler anderer Geschäftssituationsbeteiligen-Werbung sachdienlich sein.

Ein anderes Beispiel des Dilemmas des Gefangenen in der Volkswirtschaft ist Konkurrenz-orientierte Ziele. Wenn Unternehmen der Tätigkeiten ihrer Mitbewerber bewusst sind, neigen sie dazu, Policen zu verfolgen, die entworfen werden, um ihre Mitbewerber im Vergleich mit der Maximierung der Leistung des Unternehmens zu vertreiben. Diese Annäherung behindert das Unternehmen davon, an seiner maximalen Kapazität zu fungieren, weil es das Spielraum der von den Unternehmen verwendeten Strategien beschränkt.

Ohne durchsetzbare Abmachungen werden Mitglieder eines Kartells auch an (Mehrfachabspiellaufwerk) das Dilemma von Gefangenen beteiligt. 'Das Zusammenarbeiten' bedeutet normalerweise, Preise an einem vorabgestimmten minimalen Niveau zu behalten. 'Das Desertieren' bedeutet, unter diesem minimalen Niveau zu verkaufen, sofort Geschäft (und Gewinne) von anderen Kartell-Mitgliedern stehlend. Kartellbehörden wollen, dass potenzielle Kartell-Mitglieder gegenseitig desertieren, die niedrigstmöglichen Preise für Verbraucher sichernd.

Im Gesetz

Der theoretische Beschluss von PD ist ein Grund, warum, in vielen Ländern, das Entschuldigungshandeln verboten wird. Häufig genau gilt das PD Drehbuch: Es ist im Interesse von beiden Verdächtigen, zu gestehen und gegen den anderen Gefangenen/Verdächtigen unabhängig von der wirklichen Schuld auszusagen.

Mehrfachabspiellaufwerk-Dilemmas

Viele wahre Dilemmas beziehen vielfache Spieler ein. Obwohl metaphorisch, kann die Tragödie von Hardin des Unterhauses als ein Beispiel einer Mehrfachabspiellaufwerk-Generalisation des PD angesehen werden: Jeder Dorfbewohner macht eine Wahl für den persönlichen Gewinn oder die Selbstbeherrschung. Die gesammelte Belohnung für den einmütigen (oder sogar häufig) Lossagung ist sehr niedrige Belohnungen (die Zerstörung des "Unterhauses" vertretend). Das Unterhaus wird nicht immer ausgenutzt: William Poundstone, in einem Buch über das Dilemma des Gefangenen (sieh Verweisungen unten), beschreibt eine Situation in Neuseeland, wo Zeitungskästen unverschlossen verlassen werden. Es ist für Leute möglich, eine Zeitung zu nehmen, ohne (das Desertieren) zu zahlen, aber sehr wenige tun, dass findend, wenn sie dann nicht zahlen weder andere werden, das System zerstörend. Die nachfolgende Forschung durch Elinor Ostrom, Sieger des Sveriges Riksbank 2009-Preises in Wirtschaftswissenschaften im Gedächtnis von Alfred Nobel, hat Hypothese aufgestellt, dass die Tragödie des Unterhauses mit dem negativen Ergebnis unter Einfluss Außeneinflüsse grob vereinfacht wird. Ohne Druck zu komplizieren, teilen Gruppen mit und führen das Unterhaus unter sich für ihren gegenseitigen Vorteil, soziale Normen geltend machend, um die Quelle zu bewahren und den maximalen Nutzen für die Gruppe, ein Beispiel zu erreichen, das beste Fall-Ergebnis für PD zu bewirken.

Zusammenhängende Spiele

Austausch der geschlossenen Tasche

Hofstadter hat einmal vorgeschlagen, dass Leute häufig Probleme wie das PD Problem leichter finden zu verstehen, wenn es in der Form eines einfachen Spiels oder Umtausch illustriert wird. Eines von mehreren Beispielen, die er verwendet hat, war "geschlossener Tasche-Austausch":

: Zwei Menschen entsprechen und tauschen geschlossene Taschen mit dem Verstehen aus, dass einer von ihnen Geld enthält, und der andere einen Kauf enthält. Entweder Spieler kann beschließen, das Geschäft zu beachten, indem er in seine oder ihre Tasche stellt, was er oder sie abgestimmt hat, oder er oder sie desertieren kann, indem er eine leere Tasche übergibt.

In diesem Spiel ist Lossagung immer der beste Kurs, andeutend, dass vernünftige Agenten nie spielen werden. Jedoch in diesem Fall geben beide Spieler, die zusammenarbeiten, und beide Spieler, die wirklich desertieren, dasselbe Ergebnis, annehmend, dass es keine Gewinne vom Handel gibt, so sind Chancen der gegenseitigen Zusammenarbeit, sogar in wiederholten Spielen, wenige.

Freund oder Feind?

Freund oder Feind? ist eine Quizsendung, die von 2002 bis 2005 im Quizsendungsnetz in den Vereinigten Staaten gelüftet hat. Es ist ein Beispiel des Dilemma-Spiels des Gefangenen, das von echten Leuten, aber in einer künstlichen Einstellung geprüft ist. Auf der Quizsendung bewerben sich drei Paare von Leuten. Da jedes Paar beseitigt wird, spielt es ein dem Dilemma des Gefangenen ähnliches Spiel, um zu bestimmen, wie das Gewinnen gespalten wird. Wenn sie beide (Freund) zusammenarbeiten, teilen sie das Gewinnen 50-50. Wenn man zusammenarbeitet und die anderen Defekte (Feind), bekommt der Abtrünnige das ganze Gewinnen, und der Mitarbeiter bekommt nichts. Wenn beider Defekt, beide Erlaubnis mit nichts. Bemerken Sie, dass die Belohnungsmatrix von der normalen ein bisschen verschieden ist, die oben gegeben ist, weil die Ausschüttungen für "sowohl Defekt" als auch "zusammenarbeiten, während die Gegner Defekte" Fälle identisch sind. Das macht den "beiden Defekt" Fall ein schwaches Gleichgewicht, im Vergleich dazu ein strenges Gleichgewicht im Dilemma des Standardgefangenen zu sein. Wenn Sie wissen, dass Ihr Gegner dabei ist, Feind zu wählen, dann betrifft Ihre Wahl Ihr Gewinnen nicht. Im gewissen Sinne haben Freund oder Feind ein Belohnungsmodell zwischen dem Dilemma des Gefangenen und dem Spiel des Huhnes.

Die Belohnungsmatrix ist

Diese Belohnungsmatrix ist auch auf den britischen Fernsehprogrammen verwendet worden Vertrauen Mir, Shafted, Dem Bankjob und den Goldenen Bällen. Die letzte Show ist von einer Mannschaft von Wirtschaftswissenschaftlern analysiert worden. Sieh: Spalt oder Diebstahl? Kooperatives Verhalten, Wenn die Anteile Groß sind.

Wiederholte Schneewehe

Eine modifizierte Version des PD modifiziert die Belohnungsmatrix, um die Gefahr der Zusammenarbeit im Fall von der Partnerlossagung zu reduzieren. Das kann echte Weltdrehbücher besser widerspiegeln: "Zum Beispiel würden zwei Wissenschaftler, die an einem Bericht zusammenarbeiten, wenn anderes bearbeitetes härteres Vorteil haben. Aber wenn Ihr Mitarbeiter keine Arbeit tut, ist es wahrscheinlich für Sie besser, die ganze Arbeit selbst zu tun. Sie werden noch mit einem vollendeten Projekt enden."

Siehe auch

Referenzen

  • Robert Aumann, "Annehmbare Punkte in allgemeinen kooperativen N-Person-Spielen", in R. D. Luce und A. W. Tucker (Hrsg.). Beiträge zur Theorie 23 von Spielen IV, Annalen der Mathematik-Studie 40, 287-324, Universität von Princeton Presse, Princeton NJ.
  • Axelrod, R. (1984). Die Evolution der Zusammenarbeit. Internationale Standardbuchnummer 0-465-02121-2
  • Bicchieri, Cristina (1993). Vernunft und Koordination. Universität von Cambridge Presse.
  • Kenneth Binmore, Spaß und Spiele.
  • David M. Chess (1988). Das Simulieren der Evolution des Verhaltens: das Dilemma-Problem der wiederholten Gefangenen. Komplizierte Systeme, 2:663-670.
  • Dresher, M. (1961). Die Mathematik von strategischen Spielen: Theorie und Anwendungsprentice-Saal, Englewood Klippen, New Jersey
  • Überschwemmung, M.M. (1952). Einige experimentelle Spiele. Forschungsvermerk RM-789. RAND Corporation, Santa Monica, Kalifornien
  • Kaminski, Marek M. (2004) Spielgefangener-Spiel Universität von Princeton Presse. Internationale Standardbuchnummer 0-691-11721-7
  • Poundstone, W. (1992) das Dilemma des Gefangenen Doubleday, NY NY.
  • Greif, A. (2006). Einrichtungen und der Pfad zur modernen Wirtschaft: Lehren vom mittelalterlichen Handel. Universität von Cambridge Presse, Cambridge, das Vereinigte Königreich.
  • Rapoport, Anatol und Albert M. Chammah (1965). Das Dilemma des Gefangenen. Universität der Michiganer Presse.
  • S. Le und R. Boyd (2007) "Entwicklungsdynamik des Dilemmas des Dauernden Wiederholten Gefangenen" Zeitschrift der Theoretischen Biologie, Bands 245, 258-267. Voller Text
  • A. Rogers, R. K. Dash, S. D. Ramchurn, P. Vytelingum und N. R. Jennings (2007) "Koordinieren-Mannschaft-Spieler innerhalb eines Dilemma-Turniers eines lauten wiederholten Gefangenen" Theoretische Informatik 377 (1-3) 243-259.
  • M.J. van den Assem, D. van Dolder und R.H. Thaler (2010). "Spalt oder Diebstahl? Kooperatives Verhalten, Wenn die Anteile" Groß
sind

Weiterführende Literatur

  • Bicchieri, Cristina und Mitchell Green (1997) "Symmetrie-Argumente für die Zusammenarbeit im Dilemma des Gefangenen", in G. Holmstrom-Hintikka und R. Tuomela (Hrsg.). zeitgenössische Handlungstheorie: Die Philosophie und Logik der Bürgerinitiative, Kluwer.
  • Die Dilemma-Bibliografie-Webverbindungen des wiederholten Gefangenen, Juli 2005.
  • Plous, S. (1993). Das Dilemma des Gefangenen oder Perceptual Dilemma? Zeitschrift der Friedensforschung, Vol. 30, Nr. 2, 163-179.

Links

Eine andere Version des Dilemma-Spiels des wiederholten Gefangenen

John McCain / Leichtathletik (Sport)
Impressum & Datenschutz