1、貝葉斯納什均衡是指這樣一組策略組合:在給定自己的特征和其他局中人特征的概率分布的情況下,每個局中人選擇策略使自己的期望支付達到最大化,也就是說,沒有人有積極性選擇其他策略。
2、動態博弈戰略行動在動態博弈中,參與人為了使得其他參與人的選擇對自己有利,往往采取一些行動來影響其他參與人對于自己行為的預期。
【資料圖】
3、這些行為稱為戰略行動(strategic move)。
4、1.首先行動優勢首先行動優勢(first-mover advantage)是指,在博弈中首先作出戰略選擇并采取相應行動的參與人可以獲得較多的利益。
5、2.確實可信的威脅確實可信的威脅(credible threat)是指,博弈的參與人通過某種行動改變自己的支付函數,從而使得自己的威脅顯得可信。
6、參與人為改變博弈結果而采取的措施稱為承諾(commitment)。
7、第四節 不完全信息靜態博弈在許多情況下,參與人對對手的了解往往是不夠精確的。
8、這種情況下的博弈就是不完全信息博弈。
9、舉例來說,某一市場原來被A企業所壟斷。
10、現在B企業考慮是否進入。
11、B企業知道,A企業是否允許它進入,取決于A企業阻撓B企業進入所花費的成本。
12、如果阻撓的成本低,那么,正如表7-10后兩列所表示的,A企業的占優戰略是阻撓,博弈有重復剔除的占優戰略均衡――A阻撓,B不進入。
13、如果阻撓的成本高,那么,正如表7-10前兩列所表示的,A企業的占優戰略是默許B進入,博弈有重復剔除的占優戰略均衡――A默許,B進入。
14、B企業所不知道的,是A企業的阻撓成本是高是低。
15、這里,某一參與人本人知道、其他參與人則不知道的信息稱為私人信息。
16、某一參與人所擁有的全部私人信息稱為他的類型。
17、在上述例子中,阻撓成本就是 A的私人信息。
18、高阻撓成本和低阻撓成本則是兩種不同的類型。
19、顯然,在這里,B所遇到的,是不確定性條件下的選擇問題。
20、因為B不僅不知道A的類型(是高還是低),而且不知道不同類型的分布概率。
21、解決這類問題的方法之一,就是把不確定性條件下的選擇轉換為風險條件下的選擇。
22、在風險條件下,B雖然不知道A的類型,但可以知道不同類型的分布概率。
23、將不確定性條件下的選擇轉換為風險條件下的選擇,稱為海薩尼轉換(the Harsanyi transformation)。
24、按照海薩尼的方法,所有參與人的真實類型都是給定的。
25、其他參與人雖然不清楚某一參與人的真實類型,但知道這些可能出現的類型的分布概率,而且這種概率是公共知識。
26、用上例來說,公共知識不僅意味著B企業知道A企業高阻撓成本與低阻撓成本的分布概率,而且意味著A也清楚B知道這一概率。
27、通過海薩尼轉換,不完全信息博弈變成了完全但不完美信息博弈(games of complete but imperfect information)。
28、這里的不完美信息,就是指其他參與人只知道某一參與人某些方面類型的分布概率,而不知道該參與人在這些方面的真實類型。
29、在上述轉換的基礎上,海薩尼提出了貝葉斯納什均衡(Bayesian Nash equilibrium)。
30、對此,可以作如下解釋:在不完全信息靜態博弈中,參與人同時行動,沒有機會觀察到別人的選擇。
31、給定其他參與人的戰略選擇,每個參與人的最優戰略依賴于自己的類型。
32、由于每個參與人僅知道其他參與人有關類型的分布概率,而不知道其真實類型,因而,他不可能知道其他參與人實際上會選擇什么戰略。
33、但是,他能夠正確地預測到其他參與人的選擇與其各自的有關類型之間的關系。
34、因此,該參與人的決策目標就是:在給定自己的類型,以及給定其他參與人的類型與戰略選擇之間關系的條件下,使得自己的期望效用最大化。
35、貝葉斯納什均衡是一種類型依賴型戰略組合。
36、在給定自己的類型和其他參與人類型的分布概率的條件下,這種戰略組合使得每個參與人的期望效用達到了最大化。
37、回到上面提到的市場進入的例子。
38、在這個例子里,對于挑戰者B來說,原壟斷者A在阻撓成本方面,存在著兩種可能性:高成本或低成本。
39、B不知道A的阻撓成本究竟是高是低,但他知道A在這兩種不同阻撓成本下會作出的選擇,以及不同阻撓成本(類型)的分布概率。
40、假定高成本的概率為x,則低成本的概率為(1-x)。
41、如果A的阻撓成本高,A將默許B進入市場;如果A的阻撓成本低,A將阻撓B進入市場。
42、在這兩種情況下,如表7-10所示,B進入的支付函數分別是得到40和失去10。
43、因此,B選擇進入所得到的期望利潤為40x+(-10)(1- x),選擇不進入的期望利潤為0。
44、簡單的計算表明,當A阻撓成本高的概率大于20%時,挑戰者B選擇進入得到的期望利潤大于選擇不進入的期望利潤。
45、此時,選擇進入是B的最優選擇。
46、此時的貝葉斯納什均衡為,挑戰者B選擇進入,高成本原壟斷者選擇默許,低成本原壟斷者選擇阻撓。
47、根據參與者類型的公共知識獲得參與者行動的概率,依此決定下一步策略。
48、第五節 不完全信息動態博弈在動態博弈中,行動有先后次序,后行動者可以通過觀察先行動者的行為,來獲得有關先行動者的信息,從而證實或修正自己對先行動者的判斷。
49、如上所述,在不完全信息條件下,博弈的參與人知道其他參與人可能有哪幾種類型,也知道不同的類型與相應戰略選擇之間的關系。
50、但他們并不知道其他參與人的真實類型。
51、在不完全信息靜態博弈中,我們是通過海薩尼轉換,即通過假定其他參與人知道某一參與人的所屬類型的分布概率,來得出博弈的貝葉斯納什均衡結果的。
52、而在不完全信息動態博弈中,問題變得更加簡單。
53、博弈開始時,某一參與人既不知道其他參與人的真實類型,也不知道其他參與人所屬類型的分布概率。
54、他只是對這一概率分布有自己的主觀判斷,即有自己的信念。
55、博弈開始后,該參與人將根據他所觀察到的其他參與人的行為,來修正自己的信念。
56、并根據這種不斷變化的信念,作出自己的戰略選擇。
57、對應于不完全信息動態博弈的均衡概念是精煉貝葉斯均衡(perfect Bayesian equilibrium)。
58、這個概念是完全信息動態博弈的子博弈精煉納什均衡與不完全信息靜態均衡的貝葉斯(納什)均衡的結合。
59、具體來說,精煉貝葉斯均衡是所有參與人戰略和信念的一種結合。
60、它滿足如下條件:第一,在給定每個參與人有關其他參與人類型的信念的條件下,該參與人的戰略選擇是最優的。
61、第二,每個參與人關于其他參與人所屬類型的信念,但是使用貝葉斯法則從所觀察到的行為中獲得的。
62、貝葉斯法則是概率統計中的應用所觀察到的現象對有關概率分布的主觀判斷(即先驗概率)進行修正的標準方法。
63、采用上一節的例子,可以將貝葉斯規則的分析思路表達如下。
64、挑戰者B不知道原壟斷者A是屬于高阻撓成本類型還是低阻撓成本類型,但B知道,如果A屬于高阻撓成本類型,B進入市場時A進行阻撓的概率是20%(此時A為了保持壟斷帶來的高利潤,不計成本地拼命阻撓);如果A屬于低阻撓成本類型,B進入市場時A進行阻撓的概率是100%。
65、博弈開始時,B認為A屬于高阻撓成本企業的概率為70%,因此,B估計自己在進入市場時,受到A阻撓的概率為:0.7×0.2+0.3×1=0.440.44是在B給定A所屬類型的先驗概率下,A可能采取阻撓行為的概率。
66、當B進入市場時,A確實進行阻撓。
67、使用貝葉斯法則,根據阻撓這一可以觀察到的行為,B認為A屬于高阻撓成本企業的概率變成A屬于高成本企業的概率=0.7(A屬于高成本企業的先驗概率)×0.2(高成本企業對新進入市場的企業進行阻撓的概率)÷0.44=0.32根據這一新的概率,B估計自己在進入市場時,受到A阻撓的概率為:0.32×0.2+0.68×1=0.744如果B再一次進入市場時,A又進行了阻撓。
68、使用貝葉斯法則,根據再次阻撓這一可觀察到的行為,B認為A屬于高阻撓成本企業的概率變成A屬于高成本企業的概率=0.32(A屬于高成本企業的先驗概率)×0.2(高成本企業對新進入市場的企業進行阻撓的概率)÷0.744=0.086這樣,根據A一次又一次的阻撓行為,B對A所屬類型的判斷逐步發生變化,越來越傾向于將A判斷為低阻撓成本企業了。
69、以上例子表明,在不完全信息動態博弈中,參與人所采取的行為具有傳遞信息的作用。
70、盡管A企業有可能是高成本企業,但A企業連續進行的市場進入阻撓,給B企業以A企業是低阻撓成本企業的印象,從而使得B企業停止了進入地市場的行動。
71、應該指出的是,傳遞信息的行為是需要成本的。
72、假如這種行為沒有成本,誰都可以效仿,那么,這種行為就達不到傳遞信息的目的。
73、只有在行為需要相當大的成本,因而別人不敢輕易效仿時,這種行為才能起到傳遞信息的作用。
74、傳遞信息所支付的成本是由信息的不完全性造成的。
75、但不能因此就說不完全信息就一定是壞事。
76、研究表明,在重復次數有限的囚徒困境博弈中,不完全信息可以導致博弈雙方的合作。
77、理由是:當信息不完全時,參與人為了獲得合作帶來的長期利益,不愿過早暴露自己的本性。
78、這就是說,在一種長期的關系中,一個人干好事還是干壞事,常常不取決于他的本性是好是壞,而在很大程度上取決于其他人在多大程度上認為他是好人。
79、如果其他人不知道自己的真實面目,一個壞人也會為了掩蓋自己而在相當長的時期內做好事。
80、根據參與者類型的公共知識以及參與者歷史行為來獲得參與者行動的概率,依此決定下一步策略。
81、這是一種均衡的計算方法。
本文到此分享完畢,希望對大家有所幫助。
關鍵詞: