Der folgende Kurzvortrag ist eine 10-Minütige für Nicht-Mathematiker gedachte Einführung in die Spieltheorie

Einleitung

Betrachten wir folgende Szenarios

Diese sehr unterschiedlichen Situationen haben alle eine Gemeinsamkeit: In jedem Szenario konkurrieren viele Individuen um eine Ressource und versucht mittels möglichst geschickter Strategie ein möglichst gutes Ergebnis zu erzielen. Die Qualität der eigenen Strategie ist dabei abhängig von den Strategien der konkurrierenden Individuen, die ebenfalls ihren Profit maximieren wollen.

Genau solche Situationen werden in der Spieltheorie betrachtet. Dabei abstrahiert Spieltheorie die konkreten Situationen zu einem mathematischen Modell, bestehend aus:

Das Gefangenendilemma

Ein bekanntes Beispiel ist das Gefangenendilemma: Sam und Bob werden beschuldigt, einen Bankraub begangen zu haben. Sie sind in getrennten Zellen inhaftiert und können nicht miteinander kommunizieren. Beide werden nun von der Polizei verhört und haben die Möglichkeiten mit der Polizei zusammenzuarbeiten (zu reden) oder zu schweigen.

Ziel von Sam und Bob ist es, die eigene Haftstrafe zu minimieren. Da im Mathematischen Modell der Payoff maximiert werden soll, definieren wir die negativen Haftstrafen als Payoff. Dieses Modell ist in der folgenden tabellarischen Form dargestellt:

Payoffmatrix des Gefangenendilemmas
Sam
schweigen (kooperieren) reden (defektieren)
Bob schweigen (kooperieren) (-2, -2) (-15, 0)
reden (defektieren) (0, -15) (-10, -10)

Der erste Eintrag in einer Zelle ist der Payoff für den Zeilenspieler (Bob), der zweite Eintrag der Payoff für den Spaltenspieler (Sam). Bei dem Eintrag (-15, 0) erhält somit Bob einen Payoff von -15, Sam einen Payoff von 0.

Das Dilemma

Was wäre eine optimale Strategie für Bob?

Es ist für Bob somit in jedem Fall besser, zu reden (Die Strategie "Reden" ist eine {strikt dominante Strategie). Dasselbe gilt analog für Sam. Also werden beide reden und jeweils eine Haftstrafe von 10 Jahren verhängt bekommen. Hätten jedoch abgesprochen beide geschwiegen, wären sie nur 2 Jahre inhaftiert worden.

Man bezeichnet die Strategiekombination (Reden / Reden) als \textit{Nash-Gleichgewicht}. Kein Spieler kann seinen Payoff erhöhen, indem er alleine von dieser Situation seine Strategie ändert. Es spielt somit jeder Spieler eine optimale Antwort auf seine Konkurrenten.

Die im Gefangenendilemma beschriebene Situationen tritt in der Gesellschaft häufig auf. Daher hat man den beiden Strategien feste Namen gegeben. Die Strategie, die für beide das beste wäre (schweigen), wird als "kooperieren" bezeichnet, die Strategie die beide aus Egoismus wählen (reden) mit "defektieren".

Bereits unter den zu Beginn erwähnten Situationen ist ein Gefangenendilemma: Zwei Unternehmen konkurrieren in einem Produkt. Ein Unternehmen überlegt, eine Rabattaktion zu starten. Falls das andere Unternehmen die Preise nicht senkt, wird das erste Unternehmen durch die niedrigen Preise große Nachfrage und somit mehr Gewinn erhalten, das zweite Unternehmen Nachfrage verlieren. Somit muss das zweite Unternehmen die Preise ebenfalls senken, wodurch durch die niedrigere Gewinnspanne das beide Unternehmen weniger Gewinn machen, als wenn sie bei den ursprünglich höheren Preisen geblieben wären. Kooperation entspricht einem Gleichbleiben der Preise, Defektion einer Preisreduzierung.

Adam Smith stellt in der Begründung des Kapitalismus die These auf, dass durch das Streben eines jeden Individuums nach Profit das beste für die Gesellschaft erreicht wird. Das Gefangenendilemma zeigt jedoch seinen Irrtum auf: Durch streben nach eigenem Vorteil wird nicht zwangsläufig die für die Gesellschaft beste Situation erreicht.

Wiederholtes Gefangenendilemma

Beim einfachen Gefangenendilemma kann ein Spieler nicht auf die Handlung seines Gegenspielers reagieren, ihn für ein mögliches defektieren nicht bestrafen. Daher ist die Situation des wiederholten Gefangenendilemmas interessant. Zwei Spieler spielen z.B. 10 mal hintereinander das Gefangenendilemma und möchten am Ende einen Möglichst guten Payoff erhalten haben. Der Begriff Gefangendilemma wird von nun an als Synonym für solche Situationen bezeichnet, es muss nicht mehr die konkrete, oben Geschilderte Situation vorliegen.

In dieser Situation kann ein defektieren des einen Spielers in der darauffolgenden Runde durch ein defektieren des anderen bestraft werden. Darum lohnt sich defektieren nicht zwangsläufig, da man in diesem Spiel höheren Payoff erzielt, den Gegner jedoch dazu verleitet, im nächsten Spiel ebenfalls zu defektieren und somit dort niedrigeren Payoff erhält.

Es gibt aber ein Problem: Welche Strategie sollte Bob hat im letzten Spiel wählen? Er hat keine Bestrafung von Sam für ein Defektieren mehr zu befürchten, da kein weiteres Spiel folgt. Somit lohnt sich - wie im einfachen Gefangenendilemma - defektieren für Bob auf jeden Fall. Natürlich weiß Sam dieses bereits im vorletzten Spiel. Er muss also nicht kooperieren um eine Kooperation aufrecht zu erhalten, kann daher bereits im vorletzten Spiel defektieren. Mit derselben Überlegung wird Bob bereits im vorvorletzten Spiel defektieren usw.

So absurd es erscheinen Mag: Wenn beide Spieler beliebig weit in die Zukunft und streng rational denken, werden sie niemals anfangen zu kooperieren sondern immer defektieren. Das defektieren eines jeden Spiels ist das einzige Nash-Gleichgewicht, d.h. die einzige Konstellation, in der kein Spieler durch Veränderung seiner Strategie seinen Payoff erhöhen kann.

Iteriertes Gefangenendilemma

Im oberen Beispiel sind wir von einer festen Anzahl von Wiederholungen ausgegangen, die beiden Spieler bekannt ist. In der Realität ist jedoch meist die Anzahl der Wiederholungen nicht bekannt. Was ist in diesem Fall eine gute Strategie?

Offensichtlich ist dauerhaftes Kooperieren das Bestmögliche. Im Gegensatz zu dem wiederholten Gefangenendilemma mit fester Anzahl kann aber kein Spieler defektieren in dem Wissen, dass es kein weiteres Spiel gibt in dem er dafür bestraft wird. Es ist somit keine Rückwärtsinduktion möglich, die dazu führt das beide Spieler immer defektieren.

Was ist nun eine optimale Strategie?

Ein Beispiel für das wiederholte Gefangenendilemma ist ebenfalls zu Beginn erwähnt worden: Im kalten Krieg rüsteten die UDSSR und die USA auf, investierten also beide viel Geld in Rüstung ohne einen militärischen Vorteil zu erlangen. Hätten beide nicht aufgerüstet wären die Machtverhältnisse gleich geblieben, beide Staaten hätten jedoch Geld gespart. Nun kann man jeden einzelnen Aufrüstungsschritt als ein Gefangendilemma ansehen. Es hat sich bis zum Ende keine Kooperation eingestellt.

Fragen

Als Diskussionsgrundlage dienen folgende Fragen

Besucher seit Juli 2000:
1051427
Letzte Änderung:
12.05.2004
Richtlinien:
Valid CSS 2.0
Valid XHTML 1.1
WCAG AA
Zum Seitenanfang