Vangin dilemma
Vangin dilemma on yksi tavallisimpia peliteorian käsittelemiä valintatilanteita. Sen kehittivät Merrill Flood ja Melvin Dresher vuonna 1950 toimiessaan Rand Corporationissa. Tosin he eivät puhuneet tästä pelistä sen nykyisellä nimellä, vaan kutsuivat sitä peliteoriaksi. Pelin kansantajuisti vangin dilemmaksi Albert Tucker.
Asetelma
[muokkaa | muokkaa wikitekstiä]Kaksi henkilöä on tehnyt rikoksen ja jäänyt siitä kiinni, joten heitä uhkaa vankeus. He ovat kuitenkin sopineet yhteisen tavan toimia: olla puhumatta kuulustelijoille mitään. Kuulustelujen alettua vangit eivät voi viestiä keskenään. Kuulustelijat tarjoavat vasikoijalle hyvitystä ja uhkaavat hiljaisena pysyvää kovalla rangaistuksella. Jos molemmat pysyvät hiljaa, kumpikin saa rangaistukseksi vuoden vankeutta. Jos molemmat vasikoivat, kumpikin saa kaksi vuotta vankeutta. Jos vain toinen vasikoi, hän pääsee vapaaksi ja vaiti pysynyt saa kolmen vuoden vankeusrangaistuksen.[1]
Asetelmassa mainittujen rangaistusvuosien tarkka lukumäärä ei ole merkityksellinen, vaan niiden suuruusjärjestys ratkaisee.
Tulostaulukko
[muokkaa | muokkaa wikitekstiä]A vasikoi | A vaikenee | |||
---|---|---|---|---|
B vasikoi | A | 2 vuotta | A | 3 vuotta |
B | 2 vuotta | B | vapautuu | |
Yhteensä | 4 vuotta | Yhteensä | 3 vuotta | |
B vaikenee | A | vapautuu | A | 1 vuotta |
B | 3 vuotta | B | 1 vuotta | |
Yhteensä | 3 vuotta | Yhteensä | 2 vuotta |
Tulkinta
[muokkaa | muokkaa wikitekstiä]Pulma on siinä, että mitä tahansa toinen valitseekin, itselle parempi vaihtoehto on valita vasikointi. Yhteisen edun mukaista olisi kuitenkin molempien vaieta. Jos vanki A on vaiennut kuten sovittu, B saa vaikenemalla vuoden vankeutta, kun vasikoimalla pääsee vapaaksi. Jos A on vasikoinut, B saa vaikenemalla kolme vuotta vankeutta ja vasikoimalla vain kaksi. Tavallisesti itsekäs ja omaa etua ajatteleva valitsisi siis vasikoinnin ja varmistaisi lyhyemmän vankilatuomion mieluummin, kuin jos olisi vaiti toisen tunnustaessa. Kuitenkin yhteistuloksena tämä on huonompi kuin yhteistyöllä saavutettu tulos.[1] Nashin tasapaino saavutetaan tilanteessa, jossa molemmat vangit vasikoivat.[2]
Tapauksesta tekee siis dilemman se, että ratkaisu, jossa molemmat tunnustavat, on pareto-inferiorinen. Tämä tarkoittaa, että ratkaisu on vankien yhteenlasketun kokonaishyödyn kannalta heikompi vaihtoehto kuin ratkaisu, jossa molemmat vaikenevat.
Toimijoiden luottamus vaihtelee
[muokkaa | muokkaa wikitekstiä]Jos vankien välillä on vakaa luottamus ja aikomus toimia yhdessä, pelin summatulos (kummankin vangin yhteenlaskettu rangaistus) on paras mahdollinen: kumpikin saa vuoden vankeutta. Peliteorian mukaan tämä tilanne ei toteudu,selvenn�� mikäli peli pelataan vain kerran.
Vangin dilemman strategian piirteet tulevat esiin vasta toistuvalla vangin dilemmalla, jossa peliä pelataan toistuvasti saman kumppanin kanssa.
Vangin dilemman oletukset
[muokkaa | muokkaa wikitekstiä]Vangin dilemma on matemaattinen malli, jossa muiden tekijöiden kuin vankien päätöksenteon oletetaan olevan muuttumattomia. Malli ei siis vastaa tosielämää. Kyseisessä mallissa esimerkiksi oletetaan vangeilta luottamusta vasikoinnin etujen toteutumiseen. Kyseinen malli saisi aivan toisen luonteen jos vankien luottamus toisen paljastamisesta saatavaan palkintoon olisi heikko.
Katso myös
[muokkaa | muokkaa wikitekstiä]Lähteet
[muokkaa | muokkaa wikitekstiä]- ↑ a b Barron, E. N.: Game theory: An introduction, s. 118–119. Hoboken, N.J.: John Wiley & Sons, 2013. ISBN 9781118547175 (englanniksi)
- ↑ Siegfried, Tom.: John Nash, peliteoria ja luonnon koodi, s. 67. Helsinki: Terra Cognita, 2008. 231197819 Virhe: Virheellinen ISBN-tunniste Teoksen verkkoversio.
Aiheesta muualla
[muokkaa | muokkaa wikitekstiä]- Kuvia tai muita tiedostoja aiheesta Vangin dilemma Wikimedia Commonsissa