Zmagovalna strategija v življenju – Milo za drago!

Pravijo, da je dobrota v življenju vedno sirota. Pa vendar je neka zelo zanimiva študija pokazala, da to še zdaleč ni res.

Pa pojdimo po vrsti …

V neki raziskavi so si za cilj zadali, da bodo našli zmagovalno strategijo v življenju. A ker je življenje nekako težko spraviti pod lupo in v laboratorij, so se odločili, da bodo življenje (in njega življenjske strategije preživetja) opazovali skozi igro.

Vse mušketirske taktike

Res vsi za enega in eden za vse?

Če stvari malce poenostavimo, bi lahko rekli, da obstajata v življenju (v našem primeru v igri) dva primarna odziva: bodisi da z drugim sodelujemo ali pa ne sodelujemo.

V seriji podobnih situacij bi tako vsak subjekt lahko poljubno kombiniral te odzive v nekakšen poseben vzorec akcij – reakcij ali povedano krajše: v osebno strategijo.

Najbolj enostavni strategiji bi tako bili:

  • nekdo, ki vedno sodeluje,
  • nekdo, ki nikoli z nikomer ne sodeluje.

Z malce kombinatorike, pa lahko nastane tudi vse, ‘kar je vmes’:

  • lahko na primer večino časa sodelujem, po naključju pa me v 10 odstotkih primerov nekaj piči in odklonim sodelovanje,
  • strategija je lahko odvisna tudi od izidov prejšnjih iger. Takšen primer bi bil npr. ‘zamerljivec’, ki si dobro zapomni obraze, in čeprav načeloma vedno z vsakomer sodeluje, si zapomni igralca, ki z njim kdaj ni hotel sodelovati, in potem tudi on nikoli več ne sodeluje z njim,
  • spet kdo drug lahko npr. spada v podobno, a bolj blago obliko, ki je lahko bolj pomirljiva, tako da zamera sicer traja, a nikakor ne traja večno,
  • … možnih kombinacij je praktično neomejeno …

Ključno vprašanje pri vsem skupaj je: Katera strategija je najboljša?

Poker z dvema kartama

… ali kakšno vedenje se v življenju najbolj izplača?

In ker se je natanko s tem vprašanjem ukvarjal tudi profesor političnih študij Robert Axelrod, bomo v nadaljevanju povzeli njegovo študijo Evolucija kooperativnosti, ki je v svojem bistvu le variacija pred njo že obstoječe teorije t.i. zaporniške dileme.

No, Axelrod se je namreč domislil posebne računalniške igre – nekakšnega poenostavljenega, računalniškega ‘poker – turnirja’!

Raznoraznim strokovnjakom za teorijo igre je predlagal, naj v njem sodelujejo s svojimi strategijami – torej nekakšnimi vnaprej programiranimi pravili vedenja, ki so jih nato zapisali kar v računalniško obliko, da jih je profesor lahko enostavno vnesel v računalniški program.

Na tem prvem turnirju je tako sodelovalo vsega skupaj 15 strategij, vsaka se je pomerila z vsako, tako da se je turnir končal z 15 x 15 oz. 225 dvoboji. Ko je vsaka igra dosegla 200 ponovitev, je profesor le še seštel rezultate vseh iger in razglasil zmagovalca. Za uspeh posamezne strategije tako ni bilo pomembno, kako se je obnesla v vsakem posameznem dvoboju, temveč katera je po vseh 15 dvobojih zbrala največ točk.

Še nekaj ‘dolgočasnih’ podrobnosti

… ki jih, če vas ne zanimajo, lahko tudi preskočite!

Da boste bolje razumeli to nenavadno študijo, naj vendarle povemo, da so se točke delile po naslednjem ključu:

  • 3 točke je strategija dobila za medsebojno sodelovanje,
  • 5 točk za skušnjavo nesodelovanja (ko strategija na sodelovanje drugega odgovori z nesodelovanjem – tako zase iztrži največ točk, sotekmovalca pa prinese naokoli in ga pusti praznih rok),
  • 1 točko za obojestransko nesodelovanje (ker nobeden od obeh ne želi sodelovati, je izkupiček temu primerno slab),
  • in najslabša od vseh možnosti: 0 točk kot kazen za naivnost (se zgodi, ko strategija ponudi sodelovanje, drugi pa nanj odgovori z nesodelovanjem).

Najvišji možni rezultat bi bil tako (200 ponovitev x 15 dvobojev x 5 maksimalnih točk) 15.000 točk, najmanjši možni rezultat pa bi bil lahko tudi 0 točk.

A zanimivo, da nobena strategija ni dosegla niti najvišjega niti najmanjšega možnega izkupička. V resnici je namreč lahko vsaka strategija upala na kvečjemu 600 točk iz posameznega dvoboja. Toliko bi jih namreč dobila, če bi obe strategiji v vseh 200 ponovitvah posameznega dvoboja sodelovali in si tako vsakič prislužili po 3 točke.

Če bi katera od strategij podlegla skušnjavi nesodelovanja, bi na koncu verjetno iztržila manj kot 600 točk, kajti večina sodelujočih strategij je imela vgrajeno takšno ali drugačno vrsto maščevanja za nesodelovanje.

… izsledke v nadaljevanju pa le preberite do konca!

Zmagovalka je bila presenečenje

Presenetljivo se je na koncu izkazalo, da je bila zmagovalna strategija še najbolj preprosta in na prvi pogled najmanj bistra (beri: zvita).

Imenovala se je ‘milo za drago’, prispeval pa jo je profesor Anatol Rapoport, znani psiholog in matematik iz Toronta.

Milo za drago je bila strategija, ki je v prvi potezi vedno izbrala karto sodeluj, v nadaljevanju pa le ponovila karto, ki jo je v prejšnji potezi izigral nasprotnik.

Značilnosti zmagovalne strategije ‘milo za drago’ bi lahko povzeli tako:

  • nikoli ne poskuša izkoriščati drugih,
  • vrne ‘isto z istim’, kadar jo skuša kdo izkoristiti,
  • a je tudi prizanesljiva, ima kratek spomin in ne kuha dolgo zamer.

V igri bi to izgledalo nekako takole:

  • če bi ‘milo za drago’ igral proti samemu sebi, bi to pomenilo, da bi v prvi potezi oba avtomatično potegnila karto sodeluj, v naslednji potezi pa bi drugi ponovil karto, ki jo je v prejšnji izbral nasprotnik, torej sodeluj. To bi nato ponovila še 198-krat in dvoboj končala s 600 točkami,
  • če pa bi ‘milo za drago’ igralo proti npr. strategiji ‘naključni izzivalec’, ki bi naključno vsake toliko potegnil karto ‘ne sodeluj’ in poskušal tako doseči maksimalen dobitek 5 točk skušnjave nesodelovanja. ‘Milo za drago’ bi seveda takšno potezo že v naslednji ponovitvi vrnilo z istim, torej z ‘ne sodeluj’. A ker se je v naslednji rundi ‘naključni izzivalec’ že vrnil nazaj na ‘sodeluj’, je bil tako tokrat on tisti, ki je potegnil ‘takratko’ in dobil 0 točk, ‘milo za drago’ pa je iztržilo 5 točk. Če bi se maščevalnost zdaj nadaljevala tudi s strani ‘naključnega izzivalca’, bi do konca igre obe strategiji dobivali enkrat po 0 in enkrat po 5 točk, torej v povprečju 2,5 pri vsaki ponovitvi. Njun izkupiček bi bil tako manjši kot prej, ko sta ob vzajemnem sodelovanju vsakič dobila po 3 točke (in to je tudi razlog, zakaj mora biti povprečje najvišjega in najnižjega dobitka manjše od nagrade za sodelovanje).
  • in če bi slučajno igral ‘naključni izzivalec’ sam s sabo, bi bil rezultat zanj celo še nekoliko slabši, saj bi se niz maščevalnih potez verjetno začel že veliko prej …

Kaj torej odlikuje zmagovalca?

… kakorkoli že, Axelrod, je po koncu tega nenavadnega turnirja analiziral nekaj najboljših strategij in našel nekaj njihovih skupnih značilnosti:

… je prijazna

za najbolj pomemben pogoj se je izkazalo, da mora biti strategija dobra oz. optimistično naravnana, kar pomeni, da ne bo nikoli prva odklonila sodelovanja,

… zmerno maščevalna

… pa vendar uspešna strategija ne sme biti slepo optimistična. Včasih se mora za zlorabo zaupanja tudi maščevati. Popolnoma nemaščevalno strategijo (torej tisto, ki ne glede na karkoli vedno sodeluje) bodo namreč ‘izkoriščevalske’ strategije brezkompromisno izkoristile in jo tako povsem uničile,

… ne preveč zamerljiva

torej, čeprav se strategija maščuje za zlorabo zaupanja, pa mora znati tudi odpuščati in poskušati ponovno sodelovati z nasprotnikom, če morda le ne obstaja možnost, da ta potem, ko je bil kaznovan, ne bo več skušal zlorabljati njeno zaupanje (t.i. ‘skesanec’). V interesu obeh strategij je namreč ustavitev serije maščevanj in protimaščevanj, ki prinašata precej manj točk.

… in nezavistna

strategiji ne sme biti že v štartu pomembno, da v posamezni igri doseže več točk kot njen nasprotnik (za dobre strategije je to tako in tako nemogoče, saj imajo dobre strategije v boju s slabimi vedno malce slabši izkupiček, se pa izkupiček še kako ‘popravi’ v končnem seštevku iz vseh dvestotih ponovitev).

Dobro na koncu vedno zmaga!

Temu prvemu turnirju, so nato sledili novi, s še bolj številčnimi in še bolj izdelanimi strategijami, na presenečenje vseh, pa so se vsakič znova boljše odrezale dobre strategije. Na prvih petnajstih mestih le ena strategija ni bila dobra, na zadnjih petnajstih mestih pa samo ena ni bila grda. In vedno znova se je v samem vrhu znašla najbolj preprosta, a tudi načelna: ‘milo za drago’!

Zanimivo, ne?

Tiste, ki smo jih s prispevkom vsaj malo zintrigirali, naj še povemo, da si lahko več o vsem skupaj preberejo tudi v knjigi Sebični gen Richarda Dawkinsa.

Nataša Zupanc