• 亲情故事
  • 爱情故事
  • 情感故事
  • 哲理故事
  • 名人故事
  • 民间故事
  • 鬼故事
  • 现代故事
  • 传奇故事
  • 寓言故事
  • 童话故事
  • 神话故事
  • 您现在的位置:书业网 > 故事 > 寓言故事 > 正文

    博弈论教材2013-3

    来源:书业网 时间:2016-01-08

    例2 情侣博弈

    丈夫(H)和妻子(W)决定周末去看足球(F)还是去剧院(O)。丈夫不愿意和妻子分开,但是他对妻子的性格不甚了解,妻子可能喜欢独处,也可能对丈夫充满深情要在一起。

    表4-2

    H

    O W

    F H O

    F O W F 作为现实生活中的一个情景,考虑委员会选举(比如参议院中的小组委员会);两位委员会成员的投票决定两个对立议案F和O的命运。规则要求一致同意;参与人H希望通过F。第一种类型的W希望通过O,第二种类型的W希望没有议案得到通过。此外,如果W投了H喜欢的议案的票,而投票结果又出现分散现象,她将得到最大的乐趣,因为看上去她很宽容。

    三 贝叶斯纳什均衡

    潜存于例2之下的三个假设:

    假设1:妻子知道自己的最优选择,即她知道“正确的博弈”是左表还是右表;

    假设2:丈夫不知道她的妻子真正的优先选择,他对他的真实类型附加了概率?;

    假设3:妻子知道她的丈夫关于她的优先选择的估计,即她知道?的取值。 三个假设中最容易引起争议的是最后一个假设,它叫做公公先验假设。让我们转到均衡分析。在约翰·海萨尼于1967年和1968年所写的三篇论文中,他提出了适合不完全信息博弈的纳什均衡的推广,他的建议分为两部分: 1 将不完全信息博弈转为不完美信息博弈

    一个虚拟参与人(自然)选择妻子的类型(类型1深情,类型2独处),将之告诉妻子但是不告诉丈夫,于是得到了对应的展开型博弈:

    2 使用这个不完美信息形式的纳什均衡解作为原博弈的解

    在不完全信息博弈中,赋予纳什均衡一个专用名词,成为贝叶斯-纳什均衡。注意到丈夫的纯策略是选择F或O,混合策略是置于F的概率的选取,并且将这个概率表示为?。妻子的策略是成对的。她的第一个分量是类型1的妻子的选择,第二个分量是类型2的妻子的选择。因此妻子的纯策略是(F,F),(F,O),(O,F),(O,O)。而混合策略是(?1,?2),其中?1,?2是类型1妻子和类型2妻子将采取F的概率。

    定义 博弈的贝叶斯-纳什均衡是三个部分,其中每个参与(?,?1,?2)

    人及其每种类型将采取最佳反应如下:(1)如果丈夫以概率?采取F,那么概率?i最大化类型i妻子的效用;(2)如果丈夫相信他以概率?遇到类型1的妻子,并且她以概率?1采取F,而已概率1-?遇到类型2的妻子,并且她以概率?2采取F,那么概率?将使得丈夫的效用最大。

    四 纯策略贝叶斯-纳什均衡分析

    假设丈夫肯定采取F,类型1的妻子最佳反应是F,类型2的妻子最佳反

    应为O,余下惟一问题是丈夫通过采取F【针对妻子的(F,O)】是否能够最大化期望效用?

    容易计算出丈夫选取F时期望效用是3?,选O是期望效用为1-?。当选F的效用不低于选O的效用时,(F,F,0)将成为一个纯策略纳什均衡。 结论1 当丈夫对妻子是类型1的信念??

    (F,O)将成为一个纳什均衡。

    请你证明如下的结论2

    结论2 当丈夫对妻子是类型1的信念??

    (O,F)将成为一个纳什均衡。 1时,丈夫选择F,“妻子们”选择43时,丈夫选择O,“妻子们”选择4

    31时,有2个纯策略纳什均衡;??时,只有1个纯策略纳44

    1什均衡,??时,没有纳什均衡。 4结论3 当??

    五 不完全信息动态博弈举例

    例3 【黔驴技穷】

    他日,驴一鸣,虎大骇,远遁,以为且噬己也,甚恐。然往来视之,觉无异能者。益习其声。又近出前后,终不敢搏。稍近益狎,荡倚冲冒。驴不胜怒,蹄之。虎因喜,计之曰:“技止此耳!”因跳踉大

    喉,尽其肉,乃去。” 这则富有时代特色与战斗精神的寓言故事,被后人广为传诵,并派生出汉语圈中认知率最高的成语之一“黔驴技穷”。上述寓言和成语,有其明确的内涵,表达了积极的理念,用来讽喻貌似强大的东西并不可怕,只要敢于斗争,善于斗争,就一定能战而胜之。如果正确地理解上述寓言和成语的内涵和理念,是无可厚非的,不会产生什么争议、更不会衍生出什么历史公案。但是一些后人,却不求甚解、生搬硬套,不知彼“黔”非此“黔”。况这则寓言故事的“领衔主演”应该是“黔之虎”,对原文最正确的解读应该是“黔之驴技穷”或“驴黔技穷”!

    行省制始于元朝,现在的贵州在元朝分属湖广行省、四川行省和云南行省。基于这一史实,现在的贵州在文化传统上,应当归属于湘楚,断其

    文化圈、巴蜀文化圈和滇文化圈的交叉融合。贵州建省始于明朝洪武年间,当时的管辖范围与现在也略有出入。柳宗元创作《黔之驴》一文,应该是公元800年左右的唐朝中晚期,当时地方行政区划为“道—州—县”三级。《黔之驴》一文所涉及的“黔中道”,包括了湖南西部、重庆东南部、贵州北部和湖北西南部一带地区,治黔州(今重庆市彭水苗族土家族自治县)。

    请你找出参与人,参与人的类型,策略与行动,并赋予相应的效用。 例4 信号博弈(Signaling game),是一种由一个发送者(S)和另一个接收者(R)所组成的动态博弈。一开始这个发送者有一个给定的类型(t),接着发送者会观察这个没有其他人(好比说接收者)知道的类型,去从讯息堆 M = {m1, m2, m3,..., mj} 中选择送出一个讯息(m),接着接收者会观察这个讯息后从他可行的动作中 A = {a1, a2, a3,...., ak} 选一个作为反应动作(a),这里要注意的是接收者除了讯息之外其他都无法得知(如发送者的类型t),接着根据(t, m, a)的组合来决定双方会获得的报酬或回报。[1]

    在经济学中,信息不完全又可等同于信息不对称,几乎所有的信息不完全模型都与信息不对称相关,逆向选择和道德风险就是信息不对称的两种表现形式。信号博弈是研究逆向选择的一个重要模型,最早由斯彭思(spence)提出并加以讨论,斯彭思也因此获得了2001年的诺贝尔经济学奖。

    5.2 拍卖

    一 英国式拍卖

    English auction是我们非常熟悉的拍卖类型,竞买者相继出价,且出价是逐步提高的。通常拍卖人会在每次出价之前确定提高的价格,直到有人愿意支付更高的价格为止。

    假设帕特和昆西在英国式拍卖中竞买一架照相机,他们买照相机自己用,不是要转手卖掉。帕特的估价是114美元,他不知道昆西的估价,但猜想是102美元或108美元。

    现在昆西出价100美元,竞价涨幅为5美元,从博弈论的观点出发,帕特应如何出价?

    图4-1 照相机拍卖

    【练习】使用倒推法,找出该博弈的纳什均衡。

    如果在一个拍卖中两个竞买者理性地出价,即他们依据子博弈完美均衡出价,那么估价高的人总能得到拍卖品,我们称拍卖是有效率的。

    结论:在英国式拍卖中,只要出价小于你的估价,按最小竞价增幅提高出价,总能得到子博弈完美均衡,这是英国式拍卖最大的优点,且估价高者得到拍卖品,英国式拍卖是有效率的。

    二 第二价格拍卖

    每个竞争者报一个价格,出价最高的人将得到这一物品,但其所付的价格仅是第二高价。这种类型的拍卖叫做第二价格拍卖(second-price auction)。第二价格拍卖通常以密封拍卖(sealed-bid auction)的方式进行,竞争者不必出席竞标,所以这种拍卖形式很方便。

    【例1】 易趣拍卖

    鲁斯和萨拉竞买一件物品的投标博弈,鲁斯的估价是100美元,萨拉的估价是70美元。拍卖底价是50美元。双方并不知道彼此的估价,即对鲁斯来说,萨拉的估价是未知数x。鲁斯认为x?100的概率为p,而x?100得概率为

    1?p。对于萨拉来说,鲁斯的估价也是未知数,设为y。y?70的概率为q,

    而y?70的概率为1?q.

    鲁斯先出价,她有三种行动可以选择:出价50美元,出价100美元或等到第三阶段出价。接下来,萨拉出价70美元或弃拍。第三阶段,鲁斯可以再次出价,但需要花一点功夫,假设成本为3美元。

    图4-2 易趣拍卖博弈

    此处的收益以数学期望的形式表示,萨拉出价被表示成未知数x,使用倒推法可分析该博弈:

    图4-3 倒推法解易趣博弈

    因此,鲁斯应出价100美元,得到30p的期望收益,萨拉应出价70美元,

    得到20q的期望收益。以估价进行出价即可。

    以上两例都是私有价值拍卖,有时竞拍者是为了中标后拿去转卖,此时价值变为共同价值。

    三 共同价值拍卖

    【例2】三个石油开发商以密封价格拍卖形式竞争一片油田的勘探权。称为甲方、乙方和丙方,他们都是风险中性的。而该油田的实际市场价值为1000万美元。甲的估价为70万,乙的估价为1100万,丙的估价为1200万。若是第二密封价格拍卖,丙是赢家,但是将损失100万,这就是胜利者的灾祸。

    因此,共同价值物品的拍卖,投标者出价时要综合考虑各种因素,往往不以自己的估价出价。

    四 荷兰式拍卖

    拍卖历史悠久,种类繁多。英国式拍卖是一种最普通的增价拍卖。而荷兰式拍卖(Duth aucion)则是降价拍卖,直到有人接受该价格并获得拍卖品。

    五 密封拍卖

    有单轮第一价格,单轮第二价格和多伦拍卖等。荷兰式拍卖与密封第一价格等价,英国式拍卖与两者不同。拍卖的策略和结果不仅取决于拍卖类型,还取决于拍卖环境,即拍卖的收益和拍卖者掌握的信息。

    5.3 合作博弈及其应用

    一 合作博弈

    到目前为止,我们探讨的都是博弈的非合作解。对于博弈问题,最优解不是唯一的,一类是不考虑他人,只需最大化个人收益的非合作解;另一类是以整体收益最优化为目标,参与者相互协调的合作解,整体收益最优是一个含糊的概念。由于可能存在多个整体收益最优的策略组合,博弈问题的合作解也可能有多个。

    参与者可以协调相互之间的策略选择的博弈叫做合作博弈,得到的解称为合作博弈解。现在的问题是:“如果参与人的策略可以相互协调,怎样选择策略才会带来整体最大收益呢?” 二 自行车交易

    乔伊有一辆自行车但身无分文需要一些钞票,他估计自己的自行车的价值是80元。米奇有100元但没有自行车,他认为一辆自行车值100元。这样就存在着一笔潜在的交易,但是双方都不清楚对方的信誉。

    可供两人选择的策略是出让或保留,也就是说,乔伊可以把自行车给米奇,也可以不给;而米奇可以用任意数量的人民币交换自行车或者一分不给。下面是米奇愿意出让90元交换自行车的情况:

    表4-3

    米 奇

    出让

    保留

    出让 乔伊

    保留 若将之看作非合作博弈,(保留,保留)是纳什均衡。但(出让,出让)却可以使双方获得更多的收益,问题是双方互不信任。不过,市场上确实存在能促使双方顺利进行互利交易的机构,这样就可以得到我们所期望的合作博弈解。

    当乔伊和米奇在第三机构的参与下对交易问题达成一致,他们就结成了联盟,将协调各自的策略,视(出让,出让)为联盟的统一决策。

    这种买卖需要强制性的协议,买卖双方的转让支付与协议联系在一起,称为旁支付。前文将自行车价格定为90元只是一种情况,其价格仍可适当提高或降低,那么价格定为多少合适呢?图5-4阐述了限定条件:

    图4-5 合作博弈的解集

    乔伊和米奇的收益分别用横轴和纵轴表示,两人收益之和最多为200元,如直线AB所示。不过,并非直线上所有的点都是解。在非合作博弈中,乔伊可得到80元,米奇可以得到100元。一旦合作博弈时的收益小于这两个值,他们可退出联盟以获得更高的收益。因此,两人的收益必然落在线段AB之上。

    从某种意义来说,线段AB上的点都是合作博弈的可行解。冯·诺依曼和摩根斯坦称博弈问题的合作博弈解为解集。即允许旁支付的情况下,在保证每个参与人至少获得非合作博弈收益的基础上,使总收益达到最大值的所有合作联盟。

    三 房地产开发

    杰伊是一个房地产开发商,他希望把两块或者更多的地产聚集到一起联合开发。凯、劳拉和马克各有一块地产,分别以K、L、M表示。杰伊希望这三人能够以某种方式稳定地合并,即结盟。杰伊详细列出了各种联盟形式及相应的收益:

    表4-4 房地产联盟的收益

    表5-2中每一行都代表一种可能的联盟结构,第一行是所有人组成的三人联盟,称为大联盟,第五行是非合作博弈的情形,称为单人联盟。

    该博弈的解是(KLM)和(KL)(M)。在大联盟中,每个人均可退出而获得收益4,因此每个人的收益应不小于4。但总收益仅为10,从而大联盟不稳定。如果凯和劳拉能够通过旁支付调整,第二行的联盟是稳定的,3,3,4是三人的收益。在第二行,由凯和劳拉、马克组成的联盟结构是稳定的,称为该博弈的核(core)。 四 解集与核

    博弈论创立之初,冯·诺依曼和摩根斯坦引用新古典经济学中有效率的概念,认为合作博弈的解必须是有效率的。有效率意味着博弈的所有可能潜力已被挖掘,如果要使某些人变得更好,就不得不损害其他人的利益,经济学上这种资源配置状态称为帕累托最优。

    许多情况下有效配置不止一种。通常来讲,合作博弈的核包含所有使团体成员不能从联盟重组中获益的分配方案。 五 应用

    1 议会政治:英国、加拿大和德国都是议会制度的代表,在这些国家里,除非得到议会的多数票支持,就不能组阁政府,议会中的部分党派通常结为联盟以获得绝对多数票的支持。假设中欧共和国是一个拥有议会政府的典型国家,该国议会由三个实力强大的党派组成:

    表4-5 中欧议会的政党

    中欧议会政府的形成是一个合作博弈的过程,这里假定禁止腐败现象,排除了旁支付的可能:

    表4-6 议会与政党支持情况

    博弈的规则是,只有全体联盟成员都不明确反对的议案,联盟才能通过,也就是说联盟或各党派都不明确反对的议案,议会才会通过。

    表4-7 中欧议会的联盟

    在不允许旁支付时,解集是全部有效联盟的集合,在有效联盟结构中,没有人能在不损害他人的情况下联盟重组增加收益,核实解集中不被占优的联盟结构。只有第四行的联盟结构是核。

    2 公共物品提供博弈的核

    表4-8 公共物品提供博弈

    杰 克

    提供 不提供

    提供 提供 卡尔

    不提供 提供 莱瑞

    不提供 卡尔

    不提供 该非合作博弈的纳什均衡是(不提供,不提供,不提供)。现在假定三人组成大联盟,选择了(提供,提供,提供),获得总收益4.5。是该博弈的解集。

    但是,它不是核。如果卡尔,莱瑞选择提供的前提下,杰克脱离联盟,他

    - 11 -

    将获得收益2,增加了0.5。因此这是一个空核博弈,不存在稳定的联盟机构。公共物品提供博弈是从个人主义到集体主义都无法解决的社会两难问题。

    - 12 -