2010年1月4日

科學論道29

二十九、囚徒困境
  
   現代的博弈理論,最為人熟知要數納什(John Nash)的經典故事“囚徒的困境”。故事是這樣的:
  警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證據指控二人入罪。於是警方分開囚禁嫌疑犯,分別和二人見面,並向雙方提供以下相同的選擇:
  
    若一人認罪並作證指控對方(相關術語稱“背叛”對方),而對方保持沉默,此人將即時獲釋,對方將判監十年。
    若二人都沉默(相關術語稱互相“合作”),則二人同樣判監一年。
   若二人都互相檢舉(互相“背叛”),則二人同樣判監五年。
  
  囚徒困境的故事有一個前提,就是假定每個參與者(即“囚徒”)都是利己的,即都尋求最大的自身利益,而不關心另一參與者的利益。那麼,在本例中,囚徒到底應該選擇哪一項策略,才能將自己個人的刑期縮至最短?兩名囚徒由於隔絕監禁,並不知道對方選擇;而即使他們能交談,還是未必能夠完全相信對方的決定。從個人利益角度出發來選擇,檢舉背叛對方所得刑期,總比沉默要來得低。試設想困境中兩名理性囚徒會如何作出選擇:
  
   若對方沉默,背叛會讓我獲釋,所以會選擇背叛。
   若對方背叛指控我,我也要指控對方才能得到較低的刑期,所以也是會選擇背叛。
  
  二人面對的情況一樣,所以二人的思考都會得出相同的結論——選擇背叛。背叛是雙方經過理性思考得出的最佳選擇。因此,這場博弈中唯一的結果就是雙方參與者都背叛對方,結果二人同樣服刑五年。這種策略就叫做納什均衡。1994年,納什因這一理論獲得了諾貝爾經濟學獎。
  
  這場博弈的納什均衡,雖然是個體從各自利益最大化的角度經過仔細衡量得出的結果,然而以整體利益而言,卻不是最好的選擇。如果兩個參與者都合作保持沉默,兩人都只會被判刑一年,無論是個體利益還是整體利益,都要高於基於自私前提下的理性選擇。個體出於自私的角度考慮,卻得出並不是最有利於自己的結果,這就是“困境”所在。
  
  那麼有沒有一種思路可以得到更好的結果呢?我們可以結合老子思想來看看。老子道德經所闡述的道,其主要原理就在於“反者道之動”。也就是說,我們要順應這種規律去思維和行動,就是符合道的規律,是最正確的選擇。老子在道德經第三十六章中詳細的描述了這種思維方法:“將欲歙之,必固張之;將欲弱之,必固強之;將欲廢之,必固興之;將欲奪之,必固與之。是謂微明。柔弱勝剛強”。意思是說,想要收斂它,必先擴張它,想要削弱它,必先加強它,想要廢去它,必先抬舉它,想要奪取它,必先給予它。這就叫做雖然微妙而又顯明,柔弱勝過剛強。
  
   那麼,現在假設囚徒困境中的兩位囚徒都深明老子思想的道理,那他們會作何選擇呢?他們會這麼考慮:
  若希望獲得最有利的結果,也就是要只服刑一年的話,必須按照得到最壞的結果的方向來指導行動。也就是說,若對方背叛,我保持沉默是最壞的結果,所以選擇沉默。若對方沉默,我也保持沉默,仍然比選擇背叛的結果更壞。所以選擇沉默。這樣,雙方經過同樣的老子式思維後,都選擇了沉默,結果兩人都只獲刑一年,而這個結果無論對於個體還是集體而言,都是最好的結果。
  
  用老子的思維方法,得到了最優的結果。這似乎給我們一些啟示,即,當我們都是自私的理性人時,大家在一起博弈的最終結果往往是兩敗俱傷,雙方都得不到最佳的利益。反之,如果我們大家都可以以老子之道來指導行動,那麼出發點是利他的,但結果卻會是自利利他,是最優的結果。這種利他的思維,與儒家的觀點也非常的契合。如孔子主張“已欲立而立人,已欲達而達人”、“ 已所不欲,勿施於人”等等,這種推己及人的思維方式,可以很好的破解“囚徒困境”的困局,使個人和社會都得到最大的利益。儒家思想無疑是古人對社會矛盾進行深入思索後的智慧結晶,雖歷千年而歷久彌堅,值得今人仔細的回味。
  
  嚴格的來說,用老子的思維方式運用於“囚徒困境”的狀況並不合適。因為老子所言的道,是一種綜合式的最優解決方案。也就是說,老子之道,是對現實社會所有各種博弈情況的總體規律的總結。現實的人,不會像“囚徒困境”中假定的那樣,一定是自私的理性人。現實的人,除了有自私的囚徒心理之外,還有各種各樣的非理性心理,人的行為,往往是各種心理綜合影響後的結果。
  
  在現實世界中,人除了受自私的理性思維支配自己的行動之外,還受一種很重要的非理性的思維——感性思維支配自己的行為。比如囚徒困境的局面如果發生在現實中,兩個囚徒有可能是關系很好的朋友,彼此都信任對方。或者,彼此都在為對方的利益在考慮,那麼,他們很可能都會選擇沉默而不是背叛,這樣他們都可以獲得最好的結果。在現實之中,沒有一個人是孤立的,每個人都多少與別人有著親疏遠近的關系,人與人就因這種關系而形成了復雜的社會和群體。我們每個人的行為,或多或少都會受到這種關系的影響,這種關系可以是基於理性思維的利益關系,也可以是基於感性思維的情感關系。舉個例子,在婆婆和媳婦之間,如何做好丈夫與兒子的角色,就是一種基於感性思維的博弈局面。如果不能在母親與妻子之間找到微妙的“納什平衡點”,家庭的關系就會顯得混亂而無序。
  
  博弈雙方之間的信任關系有時會出現崩潰,這就是失信行為。失信行為有時是主動的,有時是被動的。比如各種騙子的行為都是主動的失信行為。而企業之間的合同以及債務糾紛,往往都是被動失信行為,是因為各種客觀條件而導致信用喪失。無論是主動失信行為還是被動失信行為,都會對均衡的博弈狀況造成破壞。
  
  除了上述的理性思維和感性思維兩種主要的思維心理外,還有一種賭徒心理,在社會大眾中普遍存在。所謂賭徒心理,就是為了獲得最大的利益,會對自己不清楚的局面或事態作出非理性的判斷和預測。一些常去賭場的賭徒,就快輸光自己的家當了,可是仍然自我安慰:說不定最後一把就能贏回來。而這種情況下,往往都是輸得更加徹底。其實我們每個人多少都會有這樣的賭徒心理,完全做到理性思維的人非常少。比如各種彩票,大家都清楚,中獎的概率很小,一定是輸多贏少,但多數人都會忍不住想試一試自己的運氣。又比如股市,股市是一種零和博弈,參與博弈的各方所爭奪的利益總和為零。也就是說,有人掙錢了,必然有人輸了同樣多的錢。那麼,在現如今全民炒股的年代,大家都去炒股,那麼大家是在掙誰的錢呢?實際上,無論有多少人參與炒股,獲利的總是少部分,而虧損的總是大部分。這就是所謂的“二八法則”。如果大家都明白這個道理,再進入股市就會理性得多。然而大多數人進入股市都是希望自己成為那少部分人,這就是一種賭徒的心理。

沒有留言: