第475章逆向归纳法免费在线阅读_职场小聪明

逆向归纳法（Backward
　　Induction）
　　逆向归纳法是一种常用于动态博弈的求解方法，核心思想是从博弈的最后阶段开始推导，逐步回溯，找到最优策略。
　　这种方法通常用于有限步博弈（finite
　　games），尤其是在完全信息动态博弈中，即所有参与者都知道游戏规则和其他玩家的可能选择。
　　逆向归纳法的基本步骤
　　1.
　　从最后一步开始分析：假设已经到达博弈的最后一个决策节点，找出在此节点上每个玩家的最优策略。
　　2.
　　回溯至前一步：假设前一个决策者知道后续的最优选择，并据此做出最优决策。
　　3.
　　重复以上过程，直至回溯到起点：最终得出的策略就是整个博弈的最优均衡解。
　　案例分析
　　1.
　　终局博弈（Ultimatum
　　Game）
　　假设有两个玩家：
　　?
　　A玩家分配100元，决定给B玩家多少钱（整数）。
　　?
　　B玩家可以选择接受（Accept）或拒绝（Reject）：
　　?
　　如果接受，双方按A的分配拿钱。
　　?
　　如果拒绝，双方都拿不到钱。
　　逆向归纳分析
　　1.
　　B的决策（最后一步）：
　　?
　　如果B接受，他能获得分配到的钱。
　　?
　　如果B拒绝，双方都拿不到钱。
　　?
　　理性B玩家应接受任何非零金额，因为比0更好。
　　2.
　　A的决策（回溯）：
　　?
　　A知道B会接受任何非零金额，所以A的最优策略是给B最少的钱（如1元），自己拿99元。
　　结论：A分1元，B接受，这是均衡策略。
　　2.
　　进入威胁博弈（Entry
　　Deterrence
　　Game）
　　假设一个新企业（E）考虑进入市场，而已有企业（I）可以选择降价竞争（Fierce）或维持高价（Acmodate）。
　　博弈树
　　1.
　　E决定是否进入市场：
　　?
　　进入（Enter）
　　?
　　不进入（Stay
　　Out）
　　2.
　　如果E进入，I决定策略：
　　?
　　降价（Fierce）：I
　　和
　　E
　　都亏损
　　10。
　　?
　　高价（Acmodate）：I赚10，E赚5。
　　?
　　E不进入（Stay
　　Out）：I独占市场，赚15，E赚0。
　　逆向归纳分析
　　1.
　　I的决策（最后一步）：
　　?
　　如果E已进入，I在降价（10）和高价（10）之间选择，高价更优，所以I会选择高价。
　　2.
　　E的决策（回溯）：
　　?
　　知道I不会降价，E进入后可以赚5（比0好），所以E会进入市场。
　　结论：E进入，I维持高价，这是均衡策略。
　　3.
　　百吉饼博弈（Centipede
　　Game）
　　假设有两个玩家轮流决定**“拿走（Take）”还是“继续（Pass）”**奖金池：
　　?
　　初始奖金池2元，每轮增加。
　　?
　　如果某人“拿走”，他获得大部分奖金，另一个人获得少部分。
　　?
　　游戏最多持续4轮。
　　逆向归纳分析
　　1.
　　最后一轮：
　　?
　　若轮到玩家B，他会“拿走”，因为这是他的最后机会。
　　2.
　　倒数第二轮：
　　?
　　玩家A知道B会在下一轮拿走，因此他会在这一轮就拿走。
　　3.
　　第三轮：
　　?
　　玩家B知道A会在下一轮拿走，因此他会在这一轮就拿走。
　　4.
　　回溯至第一轮：
　　?
　　A知道B在下一轮会拿走，所以A在第一轮就拿走。
　　结论：尽管合作能让奖金池增大，但完全理性玩家会在第一轮就终止游戏。
　　总结
　　?
　　逆向归纳法适用于有限步动态博弈，从最后一步开始推导。
　　?
　　它能帮助玩家预见对手的最优策略，做出最优决策。
　　?
　　适用于终局博弈、市场进入、谈判、竞标等策略决策。
　　逆向归纳法的应用
　　逆向归纳法广泛应用于经济、商业、政治、军事、人工智能等领域，特别适用于动态决策问题，即决策者的选择会影响未来的结果。以下是几个典型的应用场景：
　　1.
　　经济与商业
　　(1)
　　定价策略
　　企业在制定长期定价策略时，会考虑

第475章逆向归纳法[1/2页]

第475章 逆向归纳法[1/2页]

设置 ×

第475章逆向归纳法[1/2页]