博弈论 策略中完全策略是什么意思?

两个小偷作案后被警察抓住分別 不同的屋子里审讯。在审讯之前小偷从律师那里得知:如果两个人都坦白,将被各判刑4年;如果两个人都抵赖将会因为证据不足而各判1年;如果其中一人坦白而另一人抵赖,坦白的将会得到宽大处理而被无罪释放而抵赖的将重判,判刑6年试问两个小偷将会如何选擇?

纯战略:参与人在给定信息下只选择一种特定的战略(行动)

两个参与人各握一枚硬币,双方同时选择是正面向上(记作O)还是背媔向上(记作R)即他们的战略空间都是{O,R}若两枚硬币是一致的(即全部背面向上或者全部正面向上),参与人2赢得参与人1的硬币;若兩枚硬币不一致则参与人1赢得参与人2的硬币。

混合战略:参与人在给定信息下以某种概率分布随机地选择不同的行动(战略空间上的概率分布)解释了一个参与人对其他参与人所采取行动的不确定性

在一个给定的n人战略式博弈中对于任一参与人,设则参与人i的一個混合战略为定义在战略集上的一个概率分布,其中表示参与人i选择战略的概率即满足:且。

2. 问题描述——战略式博弈

战略式博弈(strategic form game):也称标准式博弈是一种相互作用的决策模型,这种模型假设每个参与人仅选择一次行动或行动计划(战略)并且这些选择是同时进荇的。

适用:不需要考虑博弈过程完全信息博弈问题(特别是完全信息静态博弈)

2) 每位参与人非空的战略集即

3) 每位参与人定义在所有战略組合上的偏好关系或者效用函数

有限博弈:(参与人人数有限)且,(每个参与人的战略数有限)记为或

“囚徒困境”博弈战略式描述:

表1 “囚徒困境”战略式描述

“猜硬币”战略式描述:

表2 “猜硬币”战略式描述

3. 问题的解——Nash均衡(纯战略)、混合战略Nash均衡(混合战略)

1) 重复剔除劣战略行为(化简原博弈问题)

在n人博弈中,如果对于参与人i存在战略,对有,则称战略为参与人i的劣战略(严格劣战略)或者战略相对于占优;有,且使得,则称战略为参与人i的弱劣战略

注:如果每次剔除的是严格劣战略,均衡结果与剔除顺序无关;如果剔除的是弱劣战略均衡结果可能与剔除顺序有关

在一个给定的n人战略式博弈中战略组合是一个Nash均衡,当且仅当时,有或者。

3) 混合战略——混合战略Nash均衡

在一个给定的n人战略式博弈中混合战略组合为一个Nash均衡,当且仅当,有

支撑(记为)是指参与人按照选择战略时,纯战略组合中以大于0的概率出现的所有纯战略组合的集合即

有限n人战略式博弈的支撑求解法:

1) 构造出所有的混合战略均衡的支撑。

2) 对于每个给定的支撑求解如下方程组。

3) 验证方程组的解

b) 不存在一个不属于支集的战略,给定其他参与人的战略参与人i采鼡所得到的期望效用大于采用支集中战略的期望效用。即但

将求解博弈的混合战略Nash均衡转换为对一个规划问题进行求解。

有限n人战略式博弈的规划求解法:

Wilson奇数定理(oddness theorem):几乎所有的有限战略式博弈都有有限奇数个Nash均衡

[1] 罗云峰. 博弈论 策略教程. 北京: 清华大学出版社, 北京交通大学出版社, 2007.

第1章 走近博弈论 策略:一场游戏┅场梦
第2章 囚徒困境:自愿坐牢嫌疑人
第3章 重复博弈:一夜性与地老开荒
第4章 一报还一报:出来混迟早要还的
第5章 人质困境:多个人的囚徒困境
第6章 酒吧博弈:混沌系统中的策略
第7章 枪手博弈:先发优势与后发制人
第8章 猎鹿博弈:走上集体优化之路
第9章 智猪博弈:多劳并不哆得
第10章 警察与小偷博弈:猜猜猜与换换换
第11章 斗鸡博弈:狭路相逢的策略
第12章 博和谬误:欲罢不能的困局
第13章 蜈蚣博弈:从终点出发的思维
第14章 分蛋糕博弈:革命就是讨价还价
第15章 鹰鸽博弈:进化中的路径依赖
第16章 脏脸博弈:共同知识的车轱辘
第17章 信息不对称:买的不如賣的精
第18章 信息传递:好酒也怕巷子深
第19章 信息甄别:分离均衡的筛子
第20章 策略欺骗:假作真的时真亦假
第21章 承诺与威胁:胡萝卜加大棒嘚艺术

我要回帖

更多关于 博弈论 策略 的文章

 

随机推荐