協(xié)調(diào)博弈

1.什么是協(xié)調(diào)博弈

協(xié)調(diào)博弈，是指在博弈所定義的收益空間中，任何均衡點都符合以下條件：即

（1）在給定其他參與人行為策略的條件下，沒有人有激勵改變其行為策略；

（2）沒有參與者希望其他參與者會愿意改變其行為。

2.協(xié)調(diào)博弈概述[1]

Jasmina Arifovic(2000); Hans Carlsson, Mattias Ganslandt(1998); Paul G.Straub(1995)等認(rèn)為協(xié)調(diào)博弈就是存在多個能夠進(jìn)行帕累托排序納什均衡的博弈；

Vincent P.Crawford and Hans Haller(1990)；Vincent P.Crawford（1995）等認(rèn)為協(xié)調(diào)博弈是參與人對不同策略組合有相同偏好的博弈，如果其他人能夠正確地預(yù)期，那么在多個納什均衡中會存在唯一解，即均衡選擇依賴參與人之間對博弈進(jìn)行有充分相似的信念。

他們描述的側(cè)重點不同，前者強調(diào)均衡多重性，后者強調(diào)參與人行為選擇信念的一致性。當(dāng)然，沒有多重均衡就不存在行為選擇信念，有了多重均衡就需要探討行為選擇信念的形成過程，參與人之間行為預(yù)期是協(xié)調(diào)博弈均衡選擇問題的核心之所在。

根據(jù)均衡選擇時參與人之間是相同行動的行為預(yù)期還是不同行動的行為預(yù)期而把協(xié)調(diào)博弈分為對稱協(xié)調(diào)博弈與非對稱協(xié)調(diào)博弈。

3.協(xié)調(diào)博弈典型實例[2]

	夏娃靠左	夏娃靠右
亞當(dāng)靠左	3,3	0，0
亞當(dāng)靠右	0，0	3，3

表：交通博弈

協(xié)調(diào)博弈的最為經(jīng)典的弈局出現(xiàn)在“交通博弈”中。下表中的收益矩陣給出了一個交通博弈的收益分布。觀察該矩陣可以發(fā)現(xiàn)：該矩陣有三個納什均衡，即（靠左，靠左）、（靠右，靠右）以及一個靠左和靠右各占50％概率的混合動機策略均衡。因此，只要給定對方的選擇，參與者就沒有激勵偏離均衡策略；或者即使不給定對方的策略，參與者也只能通過協(xié)調(diào)來實現(xiàn)均衡。

顯然，在這種博弈中，每個參與者的策略問題是：他希望和他的對手就策略選擇進(jìn)行“協(xié)調(diào)”，因為不管是否給定對手的策略，協(xié)調(diào)的結(jié)果總是最好的。森在1967年的論文^[3]中，將一個協(xié)調(diào)博弈稱為“信心博弈”。他指出，協(xié)調(diào)博弈與囚徒困境博弈剛好相反，每個參與者選擇策略A或B，僅僅需要確信對方也會相應(yīng)地選擇A或B。他們不像合作博弈那樣需要一個有約束力的契約之類的東西，而是更需要在彼此之間確立一種相互信任的信心。

如果我們考慮將上述關(guān)于交通的協(xié)調(diào)博弈擴展為，（1）在固定參與者之間進(jìn)行的重復(fù)博弈，或（2）在特定的群體系統(tǒng)內(nèi)部非固定參與者之間進(jìn)行的超博弈，那么就不難想象，與其每次出現(xiàn)時都去嘗試解決這個博弈，遠(yuǎn)不如在行為人之間建立起某種行為或慣例的穩(wěn)定的均衡模式，進(jìn)而使得參與人在此后遇到類似問題時都可以加以遵循，而不需要反復(fù)支付信息成本和交易成本。但協(xié)調(diào)博弈的一個問題在于，均衡解具有不確定性和多樣性，因此哪種均衡的規(guī)則將被選擇具有隨機特征。因此，在習(xí)俗層面上講，協(xié)調(diào)博弈的均衡規(guī)則是多樣的。但不管怎樣，只要相應(yīng)的一種行為模式被廣泛接受，并被自覺遵從，就會形成習(xí)俗或自發(fā)秩序，并且有助于包括參與者在內(nèi)的所有群體成員，避免類似弈局中無效率的非均衡收益。

4.協(xié)調(diào)博弈與選舉[4]

在堯舜時代，自然資源相對豐富，人性淳樸，人們?yōu)闋帄Z資源而進(jìn)行爭斗的情形相對較少。但是隨著時間的推移，人口的增加，以及人性的復(fù)雜化，為爭奪資源所進(jìn)行的爭斗就愈加激烈，且手段也花樣百出了。特別是在目前的市場經(jīng)濟(jì)情況下，人們以無限追逐物資利益為目標(biāo)，一個人能否在激烈的競爭中取得資源控制權(quán)就成為一個人或者一個單位生存及發(fā)展的關(guān)鍵要素。對于市場經(jīng)濟(jì)還欠成熟，法制傳統(tǒng)還比較欠缺的國度來說，不擇手段地進(jìn)行資源控制權(quán)爭奪就特別重要。因此，一些單位在與其它單位的資源或者市場控制權(quán)爭奪中，實際上就是在玩“協(xié)調(diào)博弈 ”——給定其它單位不擇手段地爭奪資源，己方的最優(yōu)策略就是不擇手段地爭奪資源。但是，能否有能力不擇手段地去爭奪資源是依賴于單位“領(lǐng)導(dǎo)”的人格素質(zhì)的。

一般而論，能不擇手段進(jìn)行資源爭奪的人通常是“膽大”的人，俗話說：“餓死膽小的，撐死膽大的”就是這個意思。而膽大的人一般又不太在乎社會公眾輿論或者不太在乎社會規(guī)范的約束，通常就在“德行”上得分不高——即所謂大奸大惡之人，如三國時的曹操。所以，給定其它競爭性單位推選“大奸大惡之人”作領(lǐng)導(dǎo)，該單位也有動機推選自己的“大奸大惡之人”作領(lǐng)導(dǎo)，讓他去迎戰(zhàn)競爭方的“大奸大惡之人”是恰當(dāng)?shù)?。?dāng)然，“大奸大惡之人”也可能并不受本單位廣大人民群眾的歡迎，但是作為集體的生存與發(fā)展，廣大人民群眾在一定程度上也可能容忍，讓他們實際上并不喜歡的人去當(dāng)他們的領(lǐng)導(dǎo)，這叫做“以毒攻毒 ”！如果競爭對手推選他們的領(lǐng)導(dǎo)是德高望重之人而非“大奸大惡之人”，本單位推選“大奸大惡之人”也是要占便宜的，因為在爭奪資源上德高望重之人是斗不過 “大奸大惡之人”的；這樣一來，每個單位都選擇“大奸大惡之人”就是“占優(yōu)戰(zhàn)略”的了。也就是說，無論競爭對手推選什么樣的人作領(lǐng)導(dǎo)，本單位都推選“大奸大惡之人”作領(lǐng)導(dǎo)是最優(yōu)的。這樣的博弈實際上是“囚徒困境 ”。但是，用“囚徒困境”來描述實際現(xiàn)象沒有用“協(xié)調(diào)博弈”恰當(dāng)。理由是，通?！按蠹榇髳褐恕币矔p害本單位廣大人民群眾的利益。如果競爭對手單位推選德高望重之人當(dāng)他們的領(lǐng)導(dǎo)，本單位廣大人民群眾通常也會推選本單位的德高望重之人作本單位領(lǐng)導(dǎo)的。因為盡管本單位的領(lǐng)導(dǎo)是德高望重之人時不會比“大奸大惡之人”爭奪帶來更多的資源，但他也通常會比“大奸大惡之人”更少地?fù)p害本單位廣大人民群眾的利益，甚至通常還會增進(jìn)本單位廣大人民群眾的利益。

一個更為強有力的原因是來自柏克利加州大學(xué)的Rabin教授的公平博弈觀點。他根據(jù)近年來心理學(xué)實驗的發(fā)現(xiàn)概括出人們普遍表現(xiàn)出的”互惠互損“行為準(zhǔn)則。Rabin（1993）的一個有價值的貢獻(xiàn)是把“公平性”（fairness）定義為“當(dāng)別人對你友善良時你也對別人友善，當(dāng)別人對你不善時你也對別人不善（即“投桃報李”和“以牙還牙”），而且他的獨特貢獻(xiàn)是將這種概念給予了明確的規(guī)定，即“如果你在損失自己效用（收入，利益等）情況下去損害別人的效用（收入，利益等），就被定義為你對別人不善；如果你在損失自己效用（收入，利益等）情況下去增進(jìn)別人的效用（收入，利益等），就被定義為你對別人友善?！?

心理學(xué)的諸多實驗證據(jù)表明人的行為在許多情形下是遵循這樣定義的“公平性”規(guī)則的，特別是在按照這種規(guī)則作出反應(yīng)時所可能造成的潛在物質(zhì)利益損失不太大的情況下更是如此。這樣，當(dāng)競爭對手單位推選“大奸大惡之人”作他們的領(lǐng)導(dǎo)時，事實上他們是以放棄讓“大奸大惡之人”為他們帶來更多資源的同時來增進(jìn)本單位廣大人民群眾的利益。此時，按照Rabin的理論，本單位廣大人民群眾也會放棄讓“大奸大惡之人”可能帶來更多資源的好處而推選讓德高望重之人來作本單位的領(lǐng)導(dǎo)。

評論 | 0條評論

評論

經(jīng)理人分享

協(xié)調(diào)博弈

目錄

1.什么是協(xié)調(diào)博弈

2.協(xié)調(diào)博弈概述[1]

3.協(xié)調(diào)博弈典型實例[2]

4.協(xié)調(diào)博弈與選舉[4]