阅读历史 |

第476章 子博弈完美均衡(1 / 2)

加入书签

子博弈完美均衡(SubgaperfectEquilibriu,SpE)

子博弈完美均衡(SpE)是纳什均衡(NashEquilibriu)的一种强化形式,专门用于动态博弈(dynaicGas),特别是那些包含多个决策阶段的博弈。SpE要求在**每一个可能的子博弈(Subga)**中,策略都必须是一个纳什均衡。

1.子博弈完美均衡的定义

一个策略组合构成子博弈完美均衡,当且仅当它在博弈的每一个可能的子博弈中都形成纳什均衡,即:

?玩家在每一步都必须选择最优策略,不论游戏是否已经按照这个路径进行。

?通过**逆向归纳法(backwardIndu)**来求解SpE。

SpE解决了纳什均衡可能包含不可信威胁的问题。例如,在某些博弈中,某些威胁在理性情况下根本不会被执行,而纳什均衡可能会包含这些威胁。而SpE要求策略在所有子博弈中都合理,因此排除了这些不可信的威胁。

2.SpE的求解方法:逆向归纳法

求解子博弈完美均衡的主要方法是逆向归纳法(backwardIndu),步骤如下:

1.从最后一个决策节点(终局)开始,找出最优策略。

2.回溯到前一个决策节点,在考虑后续最优策略的情况下,找到当前的最优选择。

3.依次回溯,直到回到博弈的起点,最终得出整个博弈的最优策略组合,即SpE。

3.经典案例分析

(1)讨价还价博弈(RubstebargagGa)

场景:

?两个玩家A和b协商如何分配100元。

?A先出价,b可以接受或拒绝:

?接受:按A的分配方案执行。

?拒绝:进入下一轮,由b出价,但总金额减少(如因折现或时间成本,变为90元)。

?这个过程可以继续,直到某一方接受提议。

解法(逆向归纳法):

1.在最后一轮,b必须接受任何非零金额,因为否则大家都拿不到钱。

2.在倒数第二轮,A知道b在下一轮会接受,因此A会给b最少的钱,以确保自己利益最大化。

3.依次回溯,最终得出SpE,A在第一轮出一个合理的价钱让b接受,而b接受,因为等待对b来说更不划算。

(2)进入威胁博弈(EntrydeterrenceGa)

场景:

?新企业E考虑进入市场,已有企业I可以选择降价竞争(Fierce)或维持高价(Aodate)。

?如果E不进入,I赚15,E赚0。

?如果E进入:

?I选择降价,I和E都亏损-10。

?I选择高价,I赚10,E赚5。

解法(逆向归纳法):

1.最后一步:如果E已经进入市场,I的最优策略是维持高价(因为降价会亏损)。

2.回溯:E知道I不会真的降价打压,所以E会进入市场。

3.结论:SpE是E进入,I维持高价。

这显示了SpE如何排除不可信威胁(即I宣称要降价,但实际上不会)。

(3)信号博弈(JobarketSignalg)

场景:

?求职者(worker)可以选择是否上大学(成本c)。

?雇主(Eployer)决定是否提供高薪(h)或低薪(L)。

?如果雇主认为求职者能力高,就提供高薪,否则提供低薪。

解法(逆向归纳法):

1.雇主的决策(最后一步):

?如果看到求职者上大学,则认为其能力较高,给高薪。

?如果未上大学,则给低薪。

2.求职者的决策(回溯):

?如果求职者能力高,上大学的成本c较低,愿意去。

?如果能力低,上大学的成本c较高,不愿意去。

3.SpE:

?高能力者选择上大学,雇主提供高薪。

?低能力者不选择上大学,雇主提供低薪。

这个模型解释了为什么学历可以作为一种信号,即使它本身不一定直接提高生产力。

4.SpE的应用

(1)经济与商业

?定价策略:大公司是否降价以阻止新竞争者进入市场。

?供应链谈判:零售商与供应商的长期合作策略。

?拍卖:竞标者如何制定长期竞标策略,以最大化利益。

(2)政治与国际关系

?选举策略:政党如何制定长期竞选策略,以吸引选民支持。

?国际谈判:国家如何在外交谈判中进行让步与施压。

(3)组织与管理

?公司管理:如何激励员工长期努力,而非短期投机。

?薪酬设计:如何制定合理的绩效考核制度,确保员工的长期忠诚度。

(4)人工智能

?自动驾驶:AI如何在多阶段决策中做出最优选择。

?博弈AI(如AlphaGo):AI如何在每一步都选择最优策略,以确保整个游戏的胜利。

5.SpE的优势

?避免不可信威胁:排除在子博弈中不可执行的策略,使均衡更加合理。

?适用于动态博弈:比纳什均衡更适用于多阶段决策问题。

?广泛应用:涵盖经济、政治、管理、人工智能等多个领域。

总结

?子博弈完美均衡(SpE)是每个子博弈中的纳什均衡,排除不可信威胁。

?求解方法:逆向归纳法(从终点回溯推导最优策略)。

?应用广泛,适用于市场竞争、谈判、政治选举、AI决策等。

?核心价值:确保策略在整个博弈过程中都保持最优,提供稳定可靠的预测。

SpE使得动态博弈中的决策更加严谨,是博弈论中最重要的均衡概念之一。

子博弈完美均衡(SpE)的应用

子博弈完美均衡(SpE)广泛应用于经济学、商业、政治、管理、人工智能等领域,尤其适用于多阶段动态决策问题,确保决策者在整个博弈过程中都采取最优策略。

1.经济与商业

(1)价格竞争与市场进入

应用场景:大企业如何通过定价策略阻止新企业进入市场(进入威胁博弈)。

SpE分析:

?大企业可能声称如果新企业进入市场,就会降价打压对方。

?但如果新企业预测到降价会导致大企业自身亏损,大企业最终不会执行降价策略。

↑返回顶部↑

书页/目录

都市言情相关阅读: 容王今天追妻成功了吗 科研式修仙,从拒绝炉鼎开始 美男娇养手册 穿越梦境拥抱你 惊,帮她喂猪的男人是豪门继承人 王大力捉奸之后 丫鬟清锁 日在三国?我真的是汉室忠良啊 大夏第一武世子 无限:杀穿电影世界 葬天 典狱长大人深不可测! 谍战:我当恶霸能爆奖励! 重生小屁孩开局单挑百米巨蟒 一人之下:三一门老祖归来 性转软妹师兄且慢,我本是男子 天武战祖 赶海系统:开挂带全家实现逆袭! 满级杀手在校园,她是隐藏大佬! 拯救男二:穿进霸总小说怎么办 综影视:狐狸精在后宫杀疯了 从蒙德开始的格斗进化 重生财团千金的我,如何救世 不知微醺 恐怖噩梦:我有一对鬼眼 月帝 快穿:白月光她完美演绎救世成功 别搞,我是人,魔尊是啥玩意儿? 黑化后,小叔叔被我虐到心碎 王爷重生现代追妻他命都不要 九劫剑塔 我在科举制度下修长生 疯批千金在线吃瓜 书中女配意识觉醒 快穿:女配逆袭,心机攻略 四合院之秦淮茹很旺夫 假面骑士:完蛋!我被美女包围 我创造了赛博修仙 我叫墨书,他们叫我杀神大人 开局兽医:肝词条,创怪物序列 网游:蓝星online 穿书后,我拐走了反派白月光 洪荒,穿越之后 渔夫逆袭:开局救美,渔获满舱 反正死不了,只好逐渐变态喽 被极品儿女遗弃?我直接掏出空间 科举文抄公的快乐你想象不到 律师:霸凌者无罪?我送他死刑! 兽心似火,软妹娇娇别跑 南枝别意琛琛既 东北道门阴阳路 斗罗:我成了千仞雪的妹妹 都追绿茶女主?那恶毒女配我要了 小欢喜:漫漫淡淡 东汉末年:黄巾军他不长这样啊! 崩坏:坏了,我成侵蚀律者了? 天灾末日:我在生存游戏中捡垃圾 柯南之组织没了我迟早要完 混沌古鼎 锦衣卫皇帝跑路了