什麼是囚徒困境

時間 2021-09-06 01:46:23

1樓:叔梅胥俏

囚徒困境(prison

dilemma)是博弈論的非零和博弈中具代表性的例子,反映個人最佳選擇並非團體最佳選擇。雖然困境本身只屬模型性質,但現實中的**競爭、環境保護等方面,也會頻繁出現類似情況。

單次發生的囚徒困境,和多次重複的囚徒困境結果不會一樣。

在重複的囚徒困境中,博弈被反覆地進行。因而每個參與者都有機會去「懲罰」另一個參與者前一回合的不合作行為。這時,合作可能會作為均衡的結果出現。

欺騙的動機這時可能被受到懲罰的威脅所克服,從而可能導向一個較好的、合作的結果。作為反覆接近無限的數量,納什均衡趨向於帕累托最優。

囚徒困境的主旨為,囚徒們雖然彼此合作,堅不吐實,可為全體帶來最佳利益(無罪開釋),但在資訊不明的情況下,因為出賣同夥可為自己帶來利益(縮短刑期),也因為同夥把自己招出來可為他帶來利益,因此彼此出賣雖違反最佳共同利益,反而是自己最大利益所在。但實際上,執法機構不可能設立如此情境來誘使所有囚徒招供,因為囚徒們必須考慮刑期以外之因素(出賣同夥會受到報復等),而無法完全以執法者所設立之利益(刑期)作考量。

經典的囚徒困境

[編輯本段]

2023年,由就職於蘭德公司的梅里爾·弗勒德(merrill

flood)和梅爾文·德雷希爾(melvin

dresher)擬定出相關困境的理論,後來由顧問艾伯特·塔克(albert

tucker)以囚徒方式闡述,並命名為「囚徒困境」。經典的囚徒困境如下:

**逮捕甲、乙兩名嫌疑犯,但沒有足夠證據指控二人入罪。於是**分開囚禁嫌疑犯,分別和二人見面,並向雙方提供以下相同的選擇:

若一人認罪並作證檢控對方(相關術語稱「背叛」對方),而對方保持沉默,此人將即時獲釋,沉默者將判監10年。

若二人都保持沉默(相關術語稱互相「合作」),則二人同樣判監半年。

若二人都互相檢舉(互相「背叛」),則二人同樣判監2年。

用**概述如下:

甲沉默(合作)

甲認罪(背叛)

乙沉默(合作)

二人同服刑半年

甲即時獲釋;乙服刑10年

乙認罪(背叛)

甲服刑10年;乙即時獲釋

二人同服刑2年

2樓:茹淑珍哈丙

囚徒困境是博弈論中非零和博弈的代表性的例子,反映個人最佳選擇並非團體最佳選擇。雖然困境本身只屬模型性質,但現實中囚徒困境的例子屢見不鮮。

囚徒困境是2023年美國蘭德公司的梅里爾·弗勒德(merrill

flood)和梅爾文·德雷希爾(melvin

dresher)擬定出相關困境的理論,後來由顧問艾伯特·塔克(albert

tucker)以囚徒方式闡述,並命名為"囚徒困境"。兩個共謀犯罪的人被關入監獄,不能互相溝通情況。

如果兩個人都不揭發對方,則由於證據不確定,每個人都坐牢一年;若一人揭發,而另一人沉默,則揭發者因為立功而立即獲釋,沉默者因不合作而入獄十年;若互相揭發,則因證據確實,二者都判刑八年。由於囚徒無法信任對方,因此傾向於互相揭發,而不是同守沉默。最終導致納什均衡僅落在非合作點上的博弈模型。

囚徒困境(prisoner's

dilemma

):兩個**的囚徒之間的一種特殊博弈,說明為什麼甚至在合作對雙方都有利時,保持合作也是困難的。囚徒困境是博弈論的非零和博弈中具代表性的例子,反映個人最佳選擇並非團體最佳選擇。

雖然困境本身只屬模型性質,但現實中的**競爭、環境保護、人際關係等方面,也會頻繁出現類似情況。

3樓:易書科技

一件嚴重的縱火案發生後,警察在現場抓到兩個犯罪嫌疑人。事實上,正是他們一起放火燒了這座倉庫。但是,**沒有掌握足夠的證據,只得把他們隔離囚禁起來,要求他們坦白交代。

在這種情形下,兩個囚犯都可以做出自己的選擇:或者供出他的同夥——即與警察合作,從而背叛他的同夥;或者保持沉默——也就是與他的同夥合作,而不是與警察合作。這兩個囚犯都知道,如果他倆都能保持沉默的話,就都會被釋放,因為只要他們拒不承認,**無法給他們定罪。

但**也很明白這一點,所以就決定對兩個囚犯來點刺激:如果他們都承認縱火,每人將被判入獄3年;如果他們都不承認,每人將因為缺乏證據而都被釋放:如果一個抵賴而另一個坦白並且願意出來作證,那麼抵賴的將被判入獄5年,還要對他施以罰款,而坦白者將被寬大處理——釋放,同時還可以得到一筆獎金。

那麼,這兩個囚犯該怎麼辦呢?是選擇互相合作還是互相背叛?

從表面上看,他們應該互相合作,保持沉默,因為這樣他們倆都能得到最好的結果:自由。但他們不得不仔細考慮對方可能採取什麼選擇。

a犯不是個傻子,他根本無法相信同夥不會向**提供對他不利的證據,然後帶著一筆豐厚的獎賞出獄而去,讓他獨自坐牢。這種想法的**力實在太大了。但他也意識到,他的同夥也不是傻子,也會同樣來這樣設想他。

所以a犯的結論是,唯一理性的選擇就是背叛同夥,把一切都告訴**,因為如果他的同夥笨得只會保持沉默,那麼他就會是那個帶獎出獄的幸運者了。而如果他的同夥也根據這個邏輯向**交代了,那麼,a犯反正也得服審,起碼他不必服最重的刑。

一番博弈的結果就是。這兩個囚犯按照自己的邏輯做出行動,雙雙坐牢。

上面的故事反應了人們的一種博弈心理,它在心理學上被稱作「囚徒困境」,最早是由美國普林斯頓大學的數學家增克於2023年提出來的。他當時創造出這樣一個故事是為了向美國斯坦福大學的一群心理學家們解釋什麼是博弈論。後來,「囚徒困境」演繹出許多版本,成為博弈論中最著名的案例。

「囚徒困境」告訴我們,在一個存在著相互作用的博弈中,最好的策略直接取決於對方採用的策略,特別是取決於這個策略為發展雙方合作留出多大的餘地。

在大家都非常熟悉的國內的家電大戰中,雖然不是兩個對手之間的博弈,但由於在眾多對手當中,每一方的市場份額都很大,每一個主體人的行為後果受對手行為的影響都很大,因此,其情景大概也是如此。

因而,如果清楚這種前景,雙方勾結或合作起來,都實行比較高的**,那麼雙方都可以因為避免**大戰而獲得較高的利潤。有人把這樣一種合作的做法,叫做「雙贏對局」。而這樣的結果,往往雙方將都是「雙贏對局」的贏家。

可惜這些聯盟也往往處於利益驅動的「囚徒困境」。而雙贏也就成為泡影。五花八門的**聯盟總是非常短命,道理就在這裡。

在囚徒困境中,雙方不約而同地選擇背叛而坐牢,一方面的原因是與同夥合作的懲罰遠遠高於所得到的報酬,另一方面也由於這是在資訊不透明的情況下進行的一次性決策,不存在更多的後果或者後續的博弈。

舉例來說,在公共汽車上,兩個陌生人會為一個座位爭吵,如果他們認識,可能就會相互謙讓。在夜市地攤、車站和旅遊景點等人群流動性大的地方,不但商品和服務質量最差,而且假冒偽劣橫行,因為在商家和顧客之間沒有後續的博弈,顧客不大可能因為飯菜可口而再次光臨。既然是一錘子買賣,不賺白不賺。

也正是這種心理所驅使,如果一廂情願地選擇合作就要受到懲罰。約翰遜**在向一群商業界頭面人物說明需要大量資金同前蘇聯進行導彈競賽時,曾經通過下面這個故事來說明這個道理:

2023年,一位得克薩斯州人離家前去參加南軍士兵陣營。他告訴他的鄰居他很快就會回來,這場戰爭不會費力:「因為我們能用掃帚柄揍這些北方佬。」兩年後,他才重返故里,少了一條腿。

他的鄰居向這位神情悲慘、衣衫襤褸的傷兵詢問到底發生了什麼事:「你不是說過戰爭不費力,你們能用掃帚柄揍這些北方佬嗎?」

這位士兵回答:「我們當然能,但是麻煩在於北方佬不用掃帚打仗。」

可是在生活中的大部分情境中,人與人之間都會存在一些後續的接觸和博弈。那麼在這種情況下,我們又應該如何決策呢?

顯然,一味地以德報怨不可取,因為這樣只是將別人的人生成本轉嫁到自己頭上;而一味地以怨報德也不可取,因為這樣將慢慢失去大多數的博弈夥伴和機會。

所以,最好的決策方法還是囚徒困境教給我們的:以德報德、以怨報怨的反射決策。

事實上,這也是日常生活中多數人的理性選擇,也是一個很具適應性的規則。它的有效是由於其他規則預料到它的存在,並且被設計得與它很好相處。因為要和「反射決策」很好相處,就必須採取合作態度,即使那些伺機佔便宜而不被懲罰的規則,也很快改變,因為任何想佔「反射決策」便宜的規則最終將傷害自己。

要使這一決策方式發生作用,必須滿足以下條件:

特徵是顯著而且容易識別的;

一旦被識別出來,就必須使對方明白會對一切背叛進行報復,並且使對方很難解脫。

數學家約翰·馮諾依曼曾說過:「在一個存在著相互作用的博弈中,最好的策略直接取決於對方採用的策略,特別是取決於這個策略為發展雙方合作留出多大的餘地。」

總之,反射決策能夠贏得競賽不是靠打擊對方,而是靠從對方引出使雙方都有好處的行為。

4樓:偶凝海

應該是形容和囚徒一樣的困境,沒有自由

5樓:匿名使用者

連續看了幾天了,可以的兄弟

6樓:匿名使用者

不知道說的對不對。

其實現實最有可能發生的情況是兩人都坦白,都坐三年牢。

假設我是囚徒,我如果不坦白,我面臨的情況無非兩種:

1我的同夥坦白,我要5年牢

2我的同夥不坦白,我們都被釋放

我如果坦白,我面i臨的情況也有兩種:

1我的同夥坦白,我坐3年牢

2我的同夥不坦白,我被釋放,還有錢拿

雙方都是希望對方不坦白的,所以「我」會坦白,因為這樣有錢拿還會被釋放。在這種情況下達成互相信任考驗人性,可能性極低。那麼兩種情況下,可能性更高的就是坐牢的結果。

3年還是5年牢,哪一個邊際成本更讓人容易接受?肯定是3年。

所以最有可能的就是兩個人都坐3年牢。

什麼是囚徒困境

7樓:柳絮迎風飄搖

囚徒困境是博弈論中非零和博弈的代表性的例子,反映個人最佳選擇並非團體最佳選擇。雖然困境本身只屬模型性質,但現實中囚徒困境的例子屢見不鮮。

囚徒困境是2023年美國蘭德公司的梅里爾·弗勒德(merrill flood)和梅爾文·德雷希爾(melvin dresher)擬定出相關困境的理論,後來由顧問艾伯特·塔克(albert tucker)以囚徒方式闡述,並命名為"囚徒困境"。兩個共謀犯罪的人被關入監獄,不能互相溝通情況。

如果兩個人都不揭發對方,則由於證據不確定,每個人都坐牢一年;若一人揭發,而另一人沉默,則揭發者因為立功而立即獲釋,沉默者因不合作而入獄十年;若互相揭發,則因證據確實,二者都判刑八年。由於囚徒無法信任對方,因此傾向於互相揭發,而不是同守沉默。最終導致納什均衡僅落在非合作點上的博弈模型。

囚徒困境(prisoner's dilemma ):兩個**的囚徒之間的一種特殊博弈,說明為什麼甚至在合作對雙方都有利時,保持合作也是困難的。囚徒困境是博弈論的非零和博弈中具代表性的例子,反映個人最佳選擇並非團體最佳選擇。

雖然困境本身只屬模型性質,但現實中的**競爭、環境保護、人際關係等方面,也會頻繁出現類似情況。

囚犯博弈論,博弈論中囚徒的困境大致內容

囚徒困境的故事講的是,兩個嫌疑犯作案後被警察抓住,分別關在不同的屋子裡接受審訊。警察知道兩人有罪,但缺乏足夠的證據。警察告訴每個人 如果兩人都抵賴,各判刑一年 如果兩人都坦白,各判八年 如果兩人中一個坦白而另一個抵賴,坦白的放出去,抵賴的判十年。於是,每個囚徒都面臨兩種選擇 坦白或抵賴。然而,不管同...

為什麼困境是上帝送給人類最好的禮物

易書科技 人的一生就好像是一艘在時間的海洋裡航行的航船。當你的船兒即將打造完畢,沐浴著金色的陽光下海遠行時,你是否明白,人生的意義其實就在於去戰勝一個又一個困難,駛過一片又一片險灘,最終到達勝利的彼岸。馬克思先生曾說過 為了不在空虛的苟且偷生中生活碌碌無為,來吧,讓我們一起走向坎坷不平地的遙遠征程。...

你認為什麼時候是人生最大的困境?

異地戀,我們一個在黑龍江,一個在煙臺,畢竟是大學生,沒有足夠的資金不能總見面,所以想他的時候總是很難過,有時候也怕堅持不下去,但又捨不得。感覺高中那時候,最大的困境就是快高考了,還有一堆知識點不會,一大堆卷子沒有解決,家裡還催促著自己學習,每天都要早起,這可能是最絕望的事兒了。家人病了,卻拿不出足夠...