[所有分類]博弈論:原理、模型與教程第04章Nash均衡解的特性第02節(jié)Nash均衡的存在性
《[所有分類]博弈論:原理、模型與教程第04章Nash均衡解的特性第02節(jié)Nash均衡的存在性》由會員分享,可在線閱讀,更多相關《[所有分類]博弈論:原理、模型與教程第04章Nash均衡解的特性第02節(jié)Nash均衡的存在性(33頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、《博弈論:原理、模型與教程》 第一部分 完全信息靜態(tài)博弈 第4章 Nash均衡解的特性 4.2 Nash均衡解的存在性 (已精細訂正?。? =============== =============== 本節(jié)推薦參考文獻: (01)張石生.不動點理論及應用(M). 重慶:重慶出版社,1984年8月第1版. (注:有趣的是,該書的責任編輯尹明善,就是后來從摩配起步創(chuàng)業(yè)成功的力帆老總) (02)張奠宙,顧鶴榮.不動點定理(M). 沈陽:遼寧教育出版社,1989年4月第1版. (03)王則軻,左再思,李志強.經(jīng)濟學拓撲方法(M). 北京:北京大學
2、出版社,2002年1月第1版. =============== =============== 將Nash均衡作為博弈的解,會面臨這樣的問題:Nash均衡是否存在,或者說對于所關心的博弈問題,是否一定存在一個Nash均衡? 非常慶幸的是,我們能夠得到一個肯定的答案。 下面將對本書所涉及的博弈論中一些經(jīng)典的存在性結論進行介紹。 定理4-1(Nash均衡的存在性定理1,1950) 每一個有限的戰(zhàn)略式博弈至少存在一個Nash均衡(包括純戰(zhàn)略和混合戰(zhàn)略Nash均衡)。 定理4-1是博弈論中關于Nash均衡存在性的最基本定理。1950年,John Nash
3、在文章Equilibrium points in n-person games 中首次提出Nash均衡的概念,并給出該存在性定理。無論怎樣強調該定理對于博弈論以后的發(fā)展的意義都不過分,因為Nash均衡之后的博弈論的發(fā)展(尤其是非合作博弈論的發(fā)展)基本上都是以該定理為基石的。定理4-1的條件簡單,但得出的結論卻十分肯定。 下面給出的定理的詳細證明。供有興趣的讀者參考。 為證明該定理,先給出如下必要的基本概念。 定義4-1 從集合到集合的一個規(guī)則,若滿足:,都中的一個集合與之對應,則稱為由到的對應,記為:→。 簡單地說,對應是函數(shù)概念的擴展,函數(shù)將集合中的點映到中的點,而
4、對應將集合中的點映到中的子集。 對應:→的圖像是指中的集合︱。對應:→為上半連續(xù)的,是指和中任意包含的開集,在中都存在的一個鄰域,只要,就有。顯然對應的上半連續(xù)性為函數(shù)連續(xù)性概念的擴展,對應一個函數(shù)它的上半連續(xù)性就等于它的連續(xù)性。對應:→的圖像為閉圖,是指任意給定若就有。閉圖將閉集的概念推廣到集合的直積中。若對應的值域為緊集,則有閉圖就意味著為上半連續(xù)的。有了這些基本概念,下面證明基本定理4-1. 證明的基本思想是將Kakutani不動點定理應用于參與人的反應對應上。 參與人的反應對應 為對手選擇時,將每一個戰(zhàn)略組合映射到的一個混合戰(zhàn)略集。給定對手選擇,給混合戰(zhàn)略集中的每個戰(zhàn)略最大化參與
5、人的支付。這里雖然只依賴于,而不依賴于,仍將 寫作的對應,因為稍后會在戰(zhàn)略組合空間之中尋找一個不動點。定義反應對應為的Cartesian直積,即,則的不動點為滿足 的戰(zhàn)略組合,因此對每個參與人,,所以的不動點即為一個Nash均衡。因此,對定理4-1的證明轉化為證明參與人的反應對應具有不動點。 由Kakutani不動點定理,,存在不動點的充分條件為: ①為有限維歐氏空間的緊的凸子集; ②非空; ③為凸; ④有閉圖。 在這里,若①成立,即為緊集,且④成立,則對應為上半連續(xù)的。 下面分別證明這些條件滿足: 首先,因為為維數(shù)為的單純形,所以①滿足。 其次,因為每一個參與人的支
6、付函數(shù)在自己的混合戰(zhàn)略上是線性的,因此也是連續(xù)的。連續(xù)函數(shù)在緊集上取得最大值,所以非空,②滿足。 再次,為了證明③ ,采用反證法。 若非凸,則存在及 ,且存在,使得,但對每一個,有 因此若,是相對于的最優(yōu)反應,那么它們的加權平均也是。而這與非凸矛盾,所以凸。 最后,仍用反證法證明④ 。 假設④不滿足,則存在序列但,所以存在,。因此存在和,使得。又因為為連續(xù)的且,因此對足夠大的,有 所以對于 嚴格優(yōu)于,這與矛盾。所以 ④ 滿足。 至此,也就完成了有限博弈中Nash均衡的存在性的證明。
7、 在經(jīng)濟學和現(xiàn)實生活中也有很多無限博弈,即參與人的戰(zhàn)略有無限多個或參與人的戰(zhàn)略能在一個集合中連續(xù)取值,如廠商之間的價格或產(chǎn)量競爭。對應于這些情況有如下的存在性定理。 定理4-2(Nash均衡的存在性定理2,Debru 1952,Glicksberg 1952,Fan 1952) 對于戰(zhàn)略式博弈,若為歐氏空間的非空緊凸子集,支付函數(shù)關于戰(zhàn)略組合連續(xù),關于擬凹,則該博弈存在純戰(zhàn)略的Nash均衡。 該定理的證明與Nash均衡的存在性定理4-1類似,支付函數(shù)關于所有參與人戰(zhàn)略組合的連續(xù)性意味著反應對應具有閉圖。另外,支付函數(shù)關于自己戰(zhàn)略的擬凹性意味著反應對應為凸值的。同樣
8、運用Kakutani不動點定理便可以證明該定理。 注意:在上述定理中關于參與人戰(zhàn)略組合的連續(xù)性條件是非常重要的,它類似于有限博弈中期望支付關于混合戰(zhàn)略是連續(xù)的,因此Nash均衡的存在性定理4-1可以看作是該定理的特例。但同時在參與人的支付函數(shù)上該定理的條件較Nash均衡的存在性條件強,但正是因為較強的條件從而導致了較強的結果——純戰(zhàn)略Nash均衡的存在性!在很多博弈中不存在純戰(zhàn)略的Nash均衡,但卻存在混合戰(zhàn)略 Nash均衡,因此將上述條件放松便得到相關條件下關于混合戰(zhàn)略的存在性結論。 定理4-3(Nash均衡的存在性定理3,Glicksberg 1952) 對于戰(zhàn)略式博弈
9、,若戰(zhàn)略空間為距離空間中的非空緊子集,支付函數(shù)關于戰(zhàn)略組合連續(xù),則該博弈存在混合戰(zhàn)略的Nash均衡(將純戰(zhàn)略Nash均衡作為混合戰(zhàn)略Nash均衡的特例)。 在上述關于Nash均衡的存在性定理4-2和定理4-3中,都要求參與人的支付關于所有參與人戰(zhàn)略組合的連續(xù)性,在經(jīng)濟學的一些理論或應用中,非連續(xù)性或非擬凹的收益函數(shù)是很常見的。如果有不連續(xù)的收益,則一個緊的戰(zhàn)略空間就不再確保參與人對應其對手戰(zhàn)略的最優(yōu)反應一定存在。為了探尋此時均衡的存在性,Dasgupta進一步對以上存在性條件進行放松,得到如下存在性定理。 定理4-4(Nash均衡的存在性定理4,Dasgupta和Maski
10、n 1986) 對于戰(zhàn)略式博弈 ,若對于所有的,為有限維歐氏空間的非空緊凸子集;關于擬凹,關于上半連續(xù)且 關于連續(xù),則該博弈存在一個純戰(zhàn)略的Nash均衡。 該定理的證明仍然與前述定理的證明類似,仍然采用Kakutani不動點定理,其中收益函數(shù)關于自己戰(zhàn)略的擬凹性保證了反應對應的凸值性,的極大值關于的連續(xù)性及的上半連續(xù)性保證了反應對應具有閉圖,因此證明過程類似定理4-1,這里不再重復。 在上述定理的基礎上,Dasgupta繼續(xù)對的連續(xù)性及擬凹性進行放松,得到了當支付函數(shù)只在戰(zhàn)略集的某個子集上不連續(xù)時,相關條件下混合戰(zhàn)略均衡的存在性。其思想是用有限分割去近似戰(zhàn)略空間,證明的方
11、法仍然是用Kakutani不動點定理。由于涉及一些較復雜的數(shù)學名詞的解釋,這里不再介紹,建議有興趣的讀者參閱相關文獻。 至此為止,所列出的關于Nash均衡的存在性結論其證明思想都是Kakutani不動點定理。從數(shù)學上看,以上一系列的存在性定理都是在不斷放松Kakutani不動點定理成立的條件,而且都在試圖不斷放松對支付函數(shù)的要求以滿足Kakutani不動點定理的條件。在反應對應具體凸性這一點上它們是相同的。當反應對應的凸性不再滿足,而只是滿足一定的單調性(通常指單調增,有些情況下可以單調減)時,支付函數(shù)也只是滿足一定的單調性時,關于Nash均衡的存在性結論也已經(jīng)有所發(fā)展,這便是超模博
12、弈理論。超模博弈理論為戰(zhàn)略空間只是滿足一定的序結構,支付函數(shù)只是滿足一定的單調性的博弈的Nash均衡存在性提供了一定的保證,不僅如此,它還保證了這種博弈有純戰(zhàn)略的Nash均衡。在戰(zhàn)略空間的一定序結構下,該類博弈的Nash均衡的戰(zhàn)略集的上下界存在且與可理性化戰(zhàn)略集的上下界重合。在思想方法上由于反應對應的凸性假設不再必要,該類博弈的Nash均衡的存在性的理論基礎不再是Kakutani不動點定理,而是Tarski不動點定理。關于該類博弈的具體內(nèi)容有興趣的讀者請參閱Topkis的相關著作。 [實際講授] ============================ =========
13、=================== 第一部分 回顧 例子1 猜幣游戲 一般地,用表示在給定參與人2的戰(zhàn)略的情況下,參與人1的最優(yōu)反應。由式(3-4)可得 = = (3-10) 在式(3-10)中,參與人1的期望收益在時隨遞增,在時隨遞減。因此當時,參與人1的最優(yōu)反應(即選擇正面);當時,參與人1的最優(yōu)反應(即選擇反面)(參見圖3-7中的兩段水平虛線)。 1 (反面) (正面) (正面)1 (反面) 圖3-7 參與人
14、的最優(yōu)反應 前面已經(jīng)提到,在時,參與人1選擇純戰(zhàn)略正面或反面是無差異的。而且從式(3-10)可以看到,參與人1的期望收益在時與無關,所有混合戰(zhàn)略對參與人1都是無差異的。也就是說,當時,對于到之間的任何,混合戰(zhàn)略都是對的最優(yōu)反應,即(參見圖3-7所示中間的豎線段)。 綜上分析,可得參與人1最優(yōu)反應為 (3-11) 在式(3-11)中,當時,可以為 中的任一值,從而使得有不止一個值。因此,稱為參與人1的最優(yōu)反應響應(best correspondence),而不是最優(yōu)反應函數(shù) 最優(yōu)反應函數(shù)表示給定參與人2的一個戰(zhàn)略,參與人1僅有一個最
15、優(yōu)戰(zhàn)略與之相對應;而最優(yōu)反應響應則表示給定參與人2的一個戰(zhàn)略,參與人1不只有一個最優(yōu)戰(zhàn)略與之相對應。參見第5章中關于Cournot模型的介紹。 。 對稱地,可得參與人2的最優(yōu)反應響應。 將參與人1與參與人2的最優(yōu)反應響應置于同一張平面,最優(yōu)反應響應曲線的交點,即是Nash均衡。 (反面) 1 1/2 1 O (正面) (反面) 正面 圖 參與人1的最優(yōu)反應對應 1/2 1 正面 1/2 背面 0 1 正面 圖 參與人2的最優(yōu)反應對應 1/2 納
16、什均衡點(不動點) 1 正面 1/2 背面 0 1 正面 圖 納什均衡點 例子2 Cournot寡頭博弈模型 假設每個寡頭企業(yè)具有相同的不變單位成本,即 ,需求函數(shù)為線性形式,所以 此時,最優(yōu)化的一階條件為 企業(yè)的最優(yōu)反應函數(shù)為 聯(lián)立求解上式,可得企業(yè)的Nash均衡產(chǎn)量為 (5-1) 企業(yè)的Nash均衡利潤分別為 (5-2) 在上述簡單假設下,兩個企業(yè)的最優(yōu)反應函數(shù)均為直線,兩條
17、直線的交點即為Nash均衡,如圖5-1所示。 (不動點) 圖5-1 Cournot 模型的Nash均衡 第二部分 實施Nash定理的證明 已經(jīng)知道,在考慮混合戰(zhàn)略的情況下,一個完全信息靜態(tài)博弈“通?!倍即嬖诩{什均衡。這一認識最早由納什(Nash,1950,1951)進行了證明,稱為納什定理。 定理2.1 納什定理 如果完全信息靜態(tài)博弈是有限的,即參與人是有限的,包含的純策略也是有限的,那么一定存在至少一個(純策略或混合策略)納什均衡。 所謂“通?!敝傅木褪遣┺牡挠邢扌浴5侥壳盀橹?,我們分析的博弈都滿足這兩個
18、條件。參與人有限——通常為兩個人。也是有限的——要么存在若干個純策略,例如猜幣游戲;要么雖然純策略由無窮多,但卻是有界閉集 在數(shù)學中,有界閉集必然意味著是有限的,即它不是無限的,或者說拒斥了無限情。 ,例如古諾模型中的戰(zhàn)略集,所以前面分析的靜態(tài)博弈都存在納什均衡。 對納什定理的證明分三個部分來完成: 第一步,介紹不動點定理; 第二步,說明納什均衡就是不動點; 第三步,完成證明。 第一步,不動點定理。 先來看圖2-29。 0 0 1 A D C 1 B 不動點 圖2-29 從區(qū)間[0,1]區(qū)間[0,1]連續(xù)函數(shù)具有不動
19、點 圖2-29中的方框為正方形。為45°線,它實際上等價于函數(shù)。線上的每一點都滿足,把滿足的稱為不動點。 線所代表的函數(shù)自變量取值為,稱為定義域,而因變量的取值為,稱為值域。定義域和值域都為的函數(shù),又可寫作,讀作從到的映射。 現(xiàn)在做一個小游戲:拿一支筆,從線出發(fā)任意畫一條曲線,記住可以任意畫,但必須連續(xù)畫不能斷裂,至到線結束。這時發(fā)現(xiàn)無論如何畫,這條曲線一定會和相交,這個交點就是不動點。因為任意畫的曲線等價于一個函數(shù),沒有斷裂意味著它是連續(xù)的,與線相交意味著,所以交點為不動點。 所有任意畫的曲線都有如下的性質: (1)定義域是非空的、有界的、閉的、凸集合,簡稱非空凸緊集。有界
20、閉集即為緊集。 (2)函數(shù)是連續(xù)的,并且是自身對自身的映射。 上面考慮的只是一元函數(shù),對于元函數(shù)是不是如果滿足上述性質就存在不動點?布勞爾(Brower)定理肯定地回答了這一點。 定理2.2—布勞爾(Brower)不動點定理。 假設是一個非空凸緊集合,并且是一個連續(xù)函數(shù);那么必有一個不動點;即,存在一個使得。 這里為實數(shù),為實數(shù)的重笛卡爾積,為維向量。在前面的例子中。在實際運用中,我們常常遇到的不是函數(shù)而是對應的情況,例如猜幣游戲這個博弈存在的是最優(yōu)反應對應,而不是函數(shù),這就有了對布勞爾不動點定理的推廣。 定理2.3—角谷(Kakutani)不動點定理。
21、假設是非空凸緊集,并且是上半連續(xù)對應,并且對于每一個,集合是非空凸集,那么必有一個不動點。即,存在一個使得。 角谷不動點定理與布勞爾不動點定理的區(qū)別在于: ①映射為對應而不是函數(shù),所以為一個集合(一個點也能組成集合,所以函數(shù)是對應的特例)。 ②映射是上半連續(xù)的。一個對應只有既是上半連續(xù)又是下半連續(xù)才能稱為連續(xù),因而上半連續(xù)比連續(xù)的要求要弱。 關于對應的上半連續(xù),就是指如果存在一個序列收斂于并且收斂于,那么一定有(如果只有唯一值,那么就變?yōu)椋磳臉O限點。 在圖2-30(a)中,當,即從的左邊向其收斂時,,但我們看到,即對應并不包含極限點,所以它不是上半連續(xù)的。
22、在圖2-30(b)中,對應包含它的每一個序列的極限點,特別是,因而它滿足上半連續(xù),但它不是連續(xù)的。例如,猜幣游戲中每個參與人的最優(yōu)反應對應就是上半連續(xù)的。對于函數(shù)而言,上半連續(xù)就等同于連續(xù)。 (a)非上半連續(xù) (b)上半連續(xù) 圖2-30 對應的上半連續(xù) 第二步,納什均衡是不動點。 根據(jù)納什均衡的定義,在給定其他參與人策略的情況下,參與人選擇一個策略以使其收益最大化,并且對每一個參與人都如此,即納什均衡是一個使每一個參與人收益最大的策略組合。針對其他參與人不同的策略,參與人都有一個最優(yōu)策略與之
23、相對應,用數(shù)學來表示就是最優(yōu)反應函數(shù)或對應。如果參與人的最優(yōu)反應函數(shù)(對應)定義為那么個參與人的最優(yōu)反應函數(shù)(對應)就構成了一個方程,將其定義為,即 如果是納什均衡,它一定滿足,即納什均衡是一個不動點。例如,古諾模型中的最優(yōu)反應函數(shù)共同構成了一個方程組,這個方程的解既是不動點,也是納什均衡。 第三步,完成證明。 現(xiàn)在要完成的是證明:①最優(yōu)反應對應的定義域為非空凸緊集;②為上半連續(xù)的對應。 由于是的方程組,滿足這兩個條件,總的策略方程必然滿足這兩個條件,而根據(jù)不動點定理,我們知道存在著不動點,使得。 (1)定義域為非空凸緊集。所謂有界集合就是任意畫一個圓(圓的半
24、徑可以任意大,但不能無窮大)可以把它包下。所謂閉集就是包含邊界的集合。有界閉集即為緊致集合,簡稱緊集。所謂凸集就是在集合內(nèi)任意找兩點,連接兩點的直線一定位于集合中。圖2-31中的直線和三角平面顯然是有界的,同時也是閉的,即它們是緊集。同時它們也是凸集。 而圖2-32中的環(huán)是非空緊集,但卻不是凸集。 1 1 B A B A 0 圖2-31 非空凸緊集 圖2-32 圓為凸集,環(huán)為非凸集 如果博弈有個人參與人,參與人有個純策略,那么策略方程的定義域為,它表示的重笛卡爾積,例如函數(shù),那么函數(shù)的定義域就為,即都從集合中取值。由
25、于混合策略的取值為,顯然為非空凸緊集,所以也是非空凸緊集。在古諾模型中,它的定義域雖然與上面講的有所不同,即純策略有無窮多個,但策略(產(chǎn)量)的取值為,它同樣是非空凸集。這表明納什均衡真正需要的并不是“有限的”要求,而是策略空間必須為緊致集合。如果一個參與人有兩個純策略,那么所有混合策略集合(策略空間)就是滿足都大于等于零的直線。如果有三個純策略,那么所有的混合策略集合(策略空間)就是一個滿足都大于等于零的一個三角平面。如果2-31所示。 (2)最優(yōu)反應對應是上半連續(xù)的。根據(jù)前面的介紹,我們已經(jīng)知道混合策略空間是非空凸緊集,并且預期收益函數(shù)是混合策略的線性函數(shù),因而它是連續(xù)的和凹的(因為偏
26、好為理性),這就保證了根據(jù)最大化預期收益函數(shù)得到的最優(yōu)反應對應必然是上半連續(xù)和非空凸集,這在數(shù)學上被稱為最大化定理。 綜上所述,最優(yōu)反應方程滿足不動點定理的兩個條件:策略空間為非空凸緊集,最優(yōu)反應對應為上半連續(xù)并且是非空凸集。因而存在著不動點,而不動點就是納什均衡。 ============================ ============================ 《知識擴展》 一、集值映射及其半連續(xù)性 這里限于在歐氏空間中展開討論,當然,我們也說成拓撲空間,但在這里的上下文,讀者可以將拓撲空間直接理解為歐氏空間。 設是一個拓撲空間,的所有子集
27、的全體記作。即.注意, ,。 定義9.1.1 設和是兩個拓撲空間。若對任一,確定的一個子集(己作)與之對應。這樣得到的對應稱作一個點對集映射(point-to-set mapping)或一個集值映射(set-valued mapping)。 相應地,以往對每個確定一個的映射,稱為單值映射(single-valued mapping)。 如同單值映射的情形,我們引進集值映射的圖像的概念。 定義9.1.2 設是一個集值映射。稱的子集 為的圖像(graph)表現(xiàn)。 下面我們建立集值映射的半連續(xù)性和連續(xù)性的概念。 定義9.1.3 設是一個集值映射
28、,。若對的與之交非空的每個開集,存在中包含的一個開集使得蘊涵,就說在是下半連續(xù)的(lower semicontinuous)。 若對的包含的每個開集,存在中包含的一個開集使得蘊涵,就說在是上半連續(xù)的(upper semicontinuous)。 若在既是下半連續(xù)的又是上半連續(xù)的,就說在是連續(xù)的(continuous)。 集值映射的兩種半連續(xù)性和連續(xù)性,都是單值映射的通常的連續(xù)性概念的推廣。事實上,如果把單值映射看作在定義域的每點取值域的一個單點集的集值映射,則作為集值映射的下半連續(xù)性、上半連續(xù)性和連續(xù)性,都與作為單值映射的通常的連續(xù)性吻合。 圖9.1 對于集值映射,下
29、半連續(xù)性和上半連續(xù)性是不同的。請看下面的例子。 例9.1.1 設是實數(shù)軸上的一個閉區(qū)間,集值映射由圖9.1給出。容易驗證,在任一點,連續(xù)性是不成問題的。即在任一點,既是下半連續(xù)的又是上半連續(xù)的。但在,是下半連續(xù)的而不是上半連續(xù)的。 例9.1.2 仍取為閉區(qū)間,集值映射由圖9.2給出。容易驗證,在任一點,連續(xù)性是不成問題的,但在,是上半連續(xù)的卻不是下半連續(xù)的。 圖9.2 定義9.1.4 若在的每個點都是下半連續(xù)的,就說在是下半連續(xù)的。若在的每個點都是上半連續(xù)的,就說在是上半連續(xù)的。若在的每個點都是連續(xù)的,就說在是連續(xù)的。 為了下面討論的方便,我們引入集值映
30、射的逆象的概念。 定義9.1.5 設是一個集值映射,是的一個子集。稱 為的下逆象,或的相交逆;稱 為的上逆象,或的包含逆。 基于上述定義,馬上可以證明下面的定理。 【定理9.1.1】 是下半連續(xù)的充要條件是“開集的相交逆為開集”,即若是的開集,則是的開集。是上半連續(xù)的充要條件是“開集的包含逆為開集”,即若是的開集,則是的開集。 利用這個定理,易知例9.1.1的是下半連續(xù)的,因為開集的相交逆都是開集,但不是上半連續(xù)的,因為開集的包含逆不都是開集。同樣,對于例9.1.2的,因為開集的包含逆都是開集,所以是上半連續(xù)的,但開集的相交逆不都是開集,所以不
31、是下半連續(xù)的。 下面是一個更為方便的上半連續(xù)性判別法。為行文方便,歐氏空間的子空間也稱為歐氏空間。注意在歐氏空間中,子集作為子空間的緊致性與有界閉性等價。 【定理9.1.2】 設和是歐氏空間,并且緊致,集值映射使得對每個,是的緊致子集。那么,為上半連續(xù)的充要條件是:的圖像表現(xiàn) 是中的一個閉子集。 根據(jù)這個定理,僅僅因為例9.1.1中的映射的圖像表現(xiàn)的閉性在處遭到破壞,我們馬上知道不是上半連續(xù)的。但例9.1.2中的集值映射的圖像表現(xiàn)是中的閉集,即知是上半連續(xù)的。 二、Kakutani不動點定理 我們主要關心有強烈應用背景的歐氏空間凸子集到其非
32、空緊致凸子集族的集值映射。 設為歐氏空間的凸集,我們約定,記的非空緊致凸子集族為。當然,。 定義1 設是歐氏空間的凸集,是集值映射。如果使得,就說是集值映射的一個不動點。 為區(qū)別起見,常常把由定義的不動點稱為Brouwer不動點,而把由定義的不動點稱為Kakutani不動點。后者是前者在集值映射情形的推廣。 Brouwer不動點定理說,閉胞腔的連續(xù)自映射必有不動點。 而Kakutani不動點定理說,緊凸集的上半連續(xù)的集值自映射必有不動點。 三、Nash定理的一般證明(重點,講!) 我們首先在博弈的一般表示之下將Nash均衡的概念加以推廣,使之包含混合策略的
33、情形。 設為一個有個參與人的博弈, ,每個為第個參與人的一個純策略。上的一個概率分布為第個參與人的一個混合策略,這里, , ,并且。 這時, 為這個博弈的參與人分別采用混合策略時,第個參與人所得到的期望支付。 為符號方便,我們?nèi)缜坝? 定義1 設博弈,,第個參與人的混合策略為,為第個參與人的期望支付。個參與人的一組混合策略稱為博弈的一個Nash均衡,如果對任意的參與人及參與人的任意混合策略,有 下面我們就證明Nash定理。 【定理1】 設博弈,這里為有限正整數(shù),每個為有限集,則博弈至少存在一個Nash均衡。 注意,這個均衡既可能是純策略
34、均衡,也可能是混合策略均衡。 證明 (0)對于任意的,記其概率空間為 每個為第個參與人的一個混合策略。顯然是一個前面講過的維標準單純形。 對以下單純形的笛卡爾積,如前引進簡便記法: (1)記第個參與人的最佳反應對應為:,這里表示的所有非空緊致凸子集的集合。對任意顯然是的非空閉子集,所以是的非空緊致子集。因為期望支付是純策略支付函數(shù)的線性組合(事實上還是凸組合),所以是的凸子集??梢?對任意是的非空緊致凸子集。這時, 表示除第個參與人之外的其余個參與人采用策略時,第個參與人的一個最佳混合策略。 定義總的最優(yōu)反應對應映射為,, 這里表示的所有子集的集合。
35、 (2)如果有Kakutani不動點,即有,則憐顯然就是該博弈的一個Nash均衡。 (3)利用Kakutani不動點定理證明確實存在Kakutani不動點。 我們來驗證確實滿足Kakutani不動點定理的條件即: 為非空緊致凸集,對任一,為的非空緊致凸子集,并且為上半連續(xù)的集值映射。 首先由于都是維標準單純形,因而是非空緊致凸的,這樣很顯然就是非空緊致凸集。 對于任意,因為各是非空緊致集,所以各非空緊致,所以也是非空緊致集。 如果,那么對每個,已經(jīng)達到最大。設是和的任意凸組合,那么也達到這個最大,可見。由此可見, 是凸集。 這樣可以寫作,這里同樣表示的所有非空緊致凸子集的集合。 剩下只須驗證的上半連續(xù)性,而這只須驗證的圖像是閉集即可。 設,且,我們來證明。 由于,也就是,,即對所有,,有.由于是線性因而是連續(xù)的,當時,上述不等關系保持不變,即有對所有,, 也即 , 這就說明 證畢。 ============================ ============================ 33
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 6.煤礦安全生產(chǎn)科普知識競賽題含答案
- 2.煤礦爆破工技能鑒定試題含答案
- 3.爆破工培訓考試試題含答案
- 2.煤礦安全監(jiān)察人員模擬考試題庫試卷含答案
- 3.金屬非金屬礦山安全管理人員(地下礦山)安全生產(chǎn)模擬考試題庫試卷含答案
- 4.煤礦特種作業(yè)人員井下電鉗工模擬考試題庫試卷含答案
- 1 煤礦安全生產(chǎn)及管理知識測試題庫及答案
- 2 各種煤礦安全考試試題含答案
- 1 煤礦安全檢查考試題
- 1 井下放炮員練習題含答案
- 2煤礦安全監(jiān)測工種技術比武題庫含解析
- 1 礦山應急救援安全知識競賽試題
- 1 礦井泵工考試練習題含答案
- 2煤礦爆破工考試復習題含答案
- 1 各種煤礦安全考試試題含答案