納什均衡點是什麼,怎麼求,納什均衡點,應怎樣理解

2023-01-15 04:11:02 字數 6045 閱讀 2033

1樓:給寂寞點歌

納什均衡的定義:在博弈g={s1,…,sn:u1,…,un}中,如果由各個博弈方的各一個策略組成的某個策論組合(s1*,…,sn*)中,任一博弈方i的策論si*,都是對其餘博弈方策略的組合(s1*,…s*i-1,s*i+1,…,sn*)的最佳對策,也即ui(s1*,…s*i-1, si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1, sij*,s*i+1,…,sn*)對任意sij∈si都成立,則稱(s1*,…,sn*)為g的一個納什均衡。

假設有兩個小偷a和b聯合犯事、私入民宅被警察抓住。**將兩人分別置於不同的兩個房間內進行審訊,對每一個犯罪嫌疑人,**給出的政策是:如果一個犯罪嫌疑人坦白了罪行,交出了贓物,於是證據確鑿,兩人都被判有罪。

如果另一個犯罪嫌疑人也作了坦白,則兩人各被判刑8年;如果另一個犯罪嫌人沒有坦白而是抵賴,則以妨礙公務罪(因已有證據表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則**因證據不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年.關於案例,顯然最好的策略是雙方都抵賴,結果是大家都只被判1年。

但是由於兩人處於隔離的情況,首先應該是從心理學的角度來看,當事雙方都會懷疑對方會出賣自己以求自保、其次才是亞當·斯密的理論,假設每個人都是「理性的經濟人」,都會從利己的目的出發進行選擇。這兩個人都會有這樣一個盤算過程:假如他坦白,我抵賴,得坐10年監獄,坦白最多才8年;他要是抵賴,我就可以被釋放,而他會坐10年牢。

綜合以上幾種情況考慮,不管他坦白與否,對我而言都是坦白了划算。兩個人都會動這樣的腦筋,最終,兩個人都選擇了坦白,結果都被判8年刑期。

納什均衡達成時,並不意味著博弈雙方都處於不動的狀態,在順序博弈中這個均衡是在博弈者連續的動作與反應中達成的。

2樓:水瀨_穸

納什均衡點一般是最大化收益函式。每個參與者的效用函式之間都有相互制約的引數,可以通過迭代的方法(形如第n+1次迭代得到的x1的值=u(第n次迭代得到的x1值)),求出使每個參與者收益函式最大的一組策略。

像證明收斂性、納什均衡存在性及唯一性這種數學證明很難。反正我是沒有仔細去看這些。

納什均衡點,應怎樣理解

3樓:自治區區

納什平衡,又稱為非合作賽局平衡,是博弈論的一個重要概念,以約翰·納什命名。

4樓:

……一開始我也以為是說史蒂夫納什……進來才發現不是……

5樓:匿名使用者

經典的例子就是囚徒困境,囚徒困境是一個非零和博弈。 大意是:一個案子的兩個嫌疑犯被分開審訊,警官分別告訴兩個囚犯,如果你招供,而對方不招供,則你將被判刑一年,而對方將被判刑十年;如果兩人均招供,將均被判刑五年。

於是,兩人同時陷入招供還是不招供的兩難處境。如果兩人均不招供,將最有利,只被判刑三年。 但兩人無法溝通,於是從各自的利益角度出發,都依據各自的理性而選擇了招供, 這種情況就稱為納氏均衡點。

這時,個體的理性利益選擇是與整體的理性利益選擇不一致的。 囚犯甲的博弈矩陣 囚犯甲 招供 不招供 囚犯乙 招供 判刑五年 甲判刑十年;乙判刑一年 不招供 甲判刑一年;乙判刑十年 甲判刑三年 基於經濟學中rational agent的前提假設,兩個囚犯符合自己利益的選擇是坦白招供,原本對雙方都有利的策略不招供從而均被判刑三年就不會出現。事實上,這樣兩人都選擇坦白的策略以及因此被判五年的結局被是「納什均衡」(也叫非合作均衡),換言之,在此情況下,無一參與者可以「獨自行動」(即單方面改變決定)而增加收穫。

6樓:匿名使用者

steve nash打球很全面哈

就這麼理解

什麼是納什均衡?

7樓:

納什均衡是指納什平衡,納什平衡(nash equilibrium),又稱為非合作博弈均衡,是博弈論的一個重要術語,以約翰·納什命名。

在一個博弈過程中,無論對方的策略選擇如何,當事人一方都會選擇某個確定的策略,則該策略被稱作支配性策略。如果兩個博弈的當事人的策略組合分別構成各自的支配性策略,那麼這個組合就被定義為納什平衡。

8樓:一副臭皮囊

納什均衡也就是納什平衡(nash equilibrium),又稱為非合作博弈均衡,是博弈論的一個重要術語,以約翰·納什命名。

在一個博弈過程中,無論對方的策略選擇如何,當事人一方都會選擇某個確定的策略,則該策略被稱作支配性策略。如果兩個博弈的當事人的策略組合分別構成各自的支配性策略,那麼這個組合就被定義為納什平衡。

一個策略組合被稱為納什平衡,當每個博弈者的平衡策略都是為了達到自己期望收益的最大值,與此同時,其他所有博弈者也遵循這樣的策略。

9樓:大寶貝小寧

納什平衡,又稱為非合作博弈均衡,是博弈論的一個重要術語,以約翰·納什命名。在一個博弈過程中,無論對方的策略選擇如何,當事人一方都會選擇某個確定的策略,則該策略被稱作支配性策略。

如果兩個博弈的當事人的策略組合分別構成各自的支配性策略,那麼這個組合就被定義為納什平衡。

一個策略組合被稱為納什平衡,當每個博弈者的平衡策略都是為了達到自己期望收益的最大值,與此同時,其他所有博弈者也遵循這樣的策略。

擴充套件資料

經典案例:囚徒困境

假設有兩個小偷a和b聯合犯事、私入民宅被警察抓住。**將兩人分別置於不同的兩個房間內進行審訊,對每一個犯罪嫌 疑人,**給出的政策是:

如果一個犯罪嫌疑人坦白了罪行,交出了贓物,於是證據確鑿,兩人都被判有罪。如果另一個犯罪嫌疑人也作了坦白,則兩人各被判刑8年。

如果另一個犯罪嫌人沒有坦白而是抵賴,則以妨礙公務罪(因已有證據表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。

如果兩人都抵賴,則**因證據不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。

10樓:戀月

通俗地說,納什均衡的含義就是:給定你的策略,我的策略是最好的策略;給定我的策略,你的策略也是你最好的策略。即雙方在對方給定的策略下不願意調整自己的策略。

在納什均衡中,每一個理性的參與者都不會有單獨改變策略的衝動。

處類似「囚徒困境」這樣的博弈中,背叛是兩種策略之中的支配性策略。因此,這場博弈中唯一可能達到的納什均衡結果,就是雙方參與者都背叛對方。

試想一個簡單的博弈,張三和李四這兩個員工都想要加薪。假如只有一個員工要求加薪,老闆會答應:但要是兩個人都要求加薪,老闆就會生氣,並把兩個人統統開除。

這場博弈有兩個納什均衡,一個是隻有張三要求加薪,另一個是隻有李四要求加薪。兩個員工都不要求加薪並不是納什均衡,因為當兩個人知道對方沒有提出要求時,就會後悔自己的選擇。兩個人都要求加薪也不是納什均衡,因為兩個人事後都會後悔自己被開除。

穩定而自私的結果,就是一個納什均衡。

什麼是納什均衡法則?

11樓:易書科技

阿蔣和小姬是一對正泡在蜜月中的小兩口,週六到了,安排什麼節目好呢?週六晚上,中國足球隊要在世界盃小組賽中和巴西隊比賽。阿蔣天生就是個超級球迷,國內的甲級聯賽他從不肯放過,何況是國家隊和心目中的偶像巴西隊的比賽?

無巧不成書,也正好是這個週六的晚上,俄羅斯一個著名芭蕾舞劇團蒞臨該市演出芭蕾舞劇《胡桃夾子》。而小姬非常喜歡鋼琴、芭蕾這樣的高雅藝術,對俄羅斯的歌劇和芭蕾更是崇拜得五體投地,她怎麼肯放過正宗俄羅斯的芭蕾舞劇呢?

怎麼辦?其實這事也不難解決:一個在自己家裡看電視轉播的足球賽,一個去劇院看芭蕾舞演出。

但是,問題在於他們是熱戀中的情侶,分開度過難得的週六,是他們最不樂意的事情。這樣一來,他們真是面臨了一場「博弈」。

我們不妨這樣給阿蔣和小姬的「滿意程度」賦值:如果阿蔣看球,讓小姬一個人去看芭蕾,雙方的滿意度都為0;若是兩個人一起去看足球,阿蔣的滿意度為2,小姬的滿意度1;兩個人一起去看芭蕾,阿蔣的滿意程度為1;小姬的滿意程度為2;應該不會有小姬獨自看球而阿蔣獨自去看芭蕾的可能,不過,人們還是把這寫出來,設想雙方的滿意程度都是-1。

在這個博弈中,雙方之間不存在「囚徒困境」中那樣的最佳策略,但是他們總會做出一個較好的選擇,因他們是蜜月中的夫妻。因此面對的是一種策略優勢不那麼明顯的博弈,而這種博弈的結局,恰恰是納什均衡研究的物件。

策略優勢不明顯,指的是雙方都沒有「不論對方採取什麼策略,我採取這個策略總比採取任何別的策略更好」的嚴格優勢策略,因此,他們只需尋找一種雙方「相對優勢策略」的組合。雙方都去看足球,或者雙方都去看芭蕾。就是我們所說的相對優勢策略的組合,一旦處於這樣的位置,雙方都不想單獨改變策略,因為單獨改變沒有好處。

比方說兩人一起看足球,阿蔣得2,小姬得1。如果阿蔣改變主意單獨去看足球,變成雙方都得0,沒有好處;如果小姬改變主意單獨去看芭蕾,也變成雙方都是0,也沒有好處,所以兩人一起去看足球是穩定的結局。同樣,兩人去看芭蕾也是穩定的結局。

這種穩定的結局就是「納什均衡」,在情侶博弈中,雙方都去看足球,或者雙方都去看芭蕾,是博弈的兩個納什均衡。形象地說,納什均衡實際上就是一種「僵局」,給定別人不改變策略的情況下,沒有人有興趣單獨改變策略,而且,這種單獨改變不會給他們帶來好處。

在這種博弈中,如果一方知道了對方的策略以後,就可以做出對自己最有利的選擇。因此,保證策略的隨機性是十分必要的。

這個概念是由普林斯頓大學數學家約翰·納什於2023年建立的。由於對博弈論做出奠基性的貢獻,他在2023年榮獲諾貝爾經濟學獎。

如果用科學的語言來描述納什均衡,指的是在一策略組合中,所有的參與者面臨這樣的一種情況:當其他人不改變策略時,他此時的策略是最好的。也就是說,此時如果他改變策略,他的支付將會降低。

在納什均衡點上,每一個理性的參與者都不會有單獨改變策略的衝動。

聽起來很拗口,而且難以理解,但卻是不折不扣的科學,而且備受經濟學家們的青睞。諾貝爾經濟學獎獲得者薩繆爾森有一句幽默的話:你可以將一隻鸚鵡訓練成經濟學家,因為它所需要學習的只有兩個詞:

供給與需求。博弈論專家坎多瑞引申說:要成為現代經濟學家,這隻鸚鵡必須再多學一個詞,這個詞就是「納什均衡」。

由此可見納什均衡在現代經濟學中的重要性。

某個小鎮上只有一名警察,他要負責整個鎮的治安。現在我們假定,小鎮的一頭有一家酒館,另一頭有一家銀行。再假定該地有一個小偷,要實施偷盜。

因為分身乏術,警察一次只能在一個地方巡邏;而小偷也只能去一個地方。

假定銀行需要保護的財產**為2萬元,酒館的財產**為1萬元。若警察在某地進行巡邏,而小偷也選擇了去該地,就會被警察抓住;若警察沒有巡邏的地方而小偷去了,則小偷偷盜成功。那麼,警察怎麼巡邏才能使效果最好?

一個明顯可取的做法是,警察權衡輕重,只對銀行進行巡邏。這樣,警察可以保住2萬元的財產不被偷竊。可是如此,假如小偷去了酒館,偷竊一定成功。

這種做法是警察的最好做法嗎?有沒有對這種策略改進的措施?

在納什均衡被發現之前,也許沒有別的答案。但是納什均衡為我們開闢一個觀察問題的新視角。

對於這個例子,雖然沒有純策略納什均衡點,也就是參與者在他的策略空間中選取唯一確定的策略。但是卻存在混合策略均衡點,在這個混合策略均衡點下,參與者的策略選擇是他們的最優(混合)策略選擇。

這樣,對於警察的一個最好的做法是,警察抽籤決定去銀行還是酒館。因為銀行的價值是酒館的兩倍,所以用兩個籤代表銀行,比如抽到1、2號籤去銀行,抽到3號籤去酒館。這樣警察有2/3的機會去銀行進行巡邏,1/3的機會去酒館。

而小偷的最優選擇是:以同樣抽籤的辦法決定去銀行還是去酒館偷盜,只是抽到1、2號籤去酒館,抽到3號籤去銀行,那麼,小偷有1/3的機會去銀行,2/3的機會去酒館。

而且,他們的策略都應當是隨機的,不能讓對方知道自己的策略,哪怕是「傾向性」的策略。如果一方知道對方其中一個策略的「可能性」大,那麼就能做出對自己最有利的決定,贏的可能性就會大。

就單次情侶博弈而言,存在著兩個「納什均衡」:或者一起看球,或者一起看芭蕾。但是,最後結局究竟落實到哪一種情形,卻是博弈論本身尚未解決的問題。

我們可以根據經驗來分析,在更多情況下,結果還會體現先動優勢,雖然雙方都會得好處,但是先行動的一方得益多一些。我國古代已有「先下手為強」的說法。大量例子說明,在有多個「納什均衡」的情況下,常常是先動手的一方會佔一些優勢。

在這裡,由於決策或行動有了先後次序,所以叫做「動態博弈」。比方說。兩人還沒商量,小姬就打**告訴阿蔣:我已經買了票,週六一起去看芭蕾,好嗎?

況且他們是戀人,小姬已經開口說了,阿蔣還會駁她的面子嗎?如果我們覺得沒經過商量就先買了票有點過分,那麼就可以把情況改為小姬打**給阿蔣,建議一起去看芭蕾,得到同意才去買票。我們可以設想,阿蔣接到小姬的**,也不會駁她的面子。

而使雙方最終得到滿意的結局。

佔有均衡和納什均衡區別與聯絡,納什均衡和佔優有什麼區別?可以舉一個例子(納什均衡和佔優均衡不完全相同的例子)說明一下嗎?

是納什均衡和佔優均衡吧 佔優均衡就是不管對方做什麼都對參與者都是最優的策略的。納什均衡就是給定一組滿足給定對手的行為時各參與者做的是它所能做的最好的策略或行為。典型的例子就是囚徒困境。假設有兩個小偷a和b聯合犯事 私入民宅被警察抓住。將兩人分別置於不同的兩個房間內進行審訊,對每一個犯罪嫌疑人,給出的...

NBA太陽隊納什得過什麼獎,NBA納什時期的太陽輝煌期是哪幾年

納什,曾經1996 98和2004 2012賽季效力於太陽隊,獲獎記錄 史蒂夫 納什 steve nash 1974年2月7日出生於南非約翰內斯堡。加拿大職業籃球運動員,司職控球后衛,效力於nba洛杉磯湖人隊。史蒂夫 納什在1996年nba選秀第1輪第15順位被太陽隊選中,1998年加盟小牛,200...

喬納金蘋果用什麼品種授粉,喬納金蘋果樹用什麼品種做受粉樹

喬 納 金 喬納金bai 美國品種。果 du實較大zhi,扁圓至圓形,單 dao果重250克左右。果面平 版滑,底色黃綠,權著橙紅霞或不顯著的紅條紋,著色良好的果為全面橙紅色,光照不足時著色不良 果面蠟質多,果點多而小,帶綠色暈圈,明顯易見。果肉淺黃色,質細鬆脆,果肉硬度8千克 平方釐米,味較甜,稍...