阅读记录

第475章 逆向归纳法[1/2页]

职场小聪明 翟晓鹰

设置 ×

  • 阅读主题
  • 字体大小A-默认A+
  • 字体颜色
    逆向归纳法(Backward
      Induction)
      逆向归纳法是一种常用于动态博弈的求解方法,核心思想是从博弈的最后阶段开始推导,逐步回溯,找到最优策略。
      这种方法通常用于有限步博弈(finite
      games),尤其是在完全信息动态博弈中,即所有参与者都知道游戏规则和其他玩家的可能选择。
      逆向归纳法的基本步骤
      1.
      从最后一步开始分析:假设已经到达博弈的最后一个决策节点,找出在此节点上每个玩家的最优策略。
      2.
      回溯至前一步:假设前一个决策者知道后续的最优选择,并据此做出最优决策。
      3.
      重复以上过程,直至回溯到起点:最终得出的策略就是整个博弈的最优均衡解。
      案例分析
      1.
      终局博弈(Ultimatum
      Game)
      假设有两个玩家:
      ?
      A玩家分配100元,决定给B玩家多少钱(整数)。
      ?
      B玩家可以选择接受(Accept)或拒绝(Reject):
      ?
      如果接受,双方按A的分配拿钱。
      ?
      如果拒绝,双方都拿不到钱。
      逆向归纳分析
      1.
      B的决策(最后一步):
      ?
      如果B接受,他能获得分配到的钱。
      ?
      如果B拒绝,双方都拿不到钱。
      ?
      理性B玩家应接受任何非零金额,因为比0更好。
      2.
      A的决策(回溯):
      ?
      A知道B会接受任何非零金额,所以A的最优策略是给B最少的钱(如1元),自己拿99元。
      结论:A分1元,B接受,这是均衡策略。
      2.
      进入威胁博弈(Entry
      Deterrence
      Game)
      假设一个新企业(E)考虑进入市场,而已有企业(I)可以选择降价竞争(Fierce)或维持高价(Acmodate)。
      博弈树
      1.
      E决定是否进入市场:
      ?
      进入(Enter)
      ?
      不进入(Stay
      Out)
      2.
      如果E进入,I决定策略:
      ?
      降价(Fierce):I
      和
      E
      都亏损
      10。
      ?
      高价(Acmodate):I赚10,E赚5。
      ?
      E不进入(Stay
      Out):I独占市场,赚15,E赚0。
      逆向归纳分析
      1.
      I的决策(最后一步):
      ?
      如果E已进入,I在降价(10)和高价(10)之间选择,高价更优,所以I会选择高价。
      2.
      E的决策(回溯):
      ?
      知道I不会降价,E进入后可以赚5(比0好),所以E会进入市场。
      结论:E进入,I维持高价,这是均衡策略。
      3.
      百吉饼博弈(Centipede
      Game)
      假设有两个玩家轮流决定**“拿走(Take)”还是“继续(Pass)”**奖金池:
      ?
      初始奖金池2元,每轮增加。
      ?
      如果某人“拿走”,他获得大部分奖金,另一个人获得少部分。
      ?
      游戏最多持续4轮。
      逆向归纳分析
      1.
      最后一轮:
      ?
      若轮到玩家B,他会“拿走”,因为这是他的最后机会。
      2.
      倒数第二轮:
      ?
      玩家A知道B会在下一轮拿走,因此他会在这一轮就拿走。
      3.
      第三轮:
      ?
      玩家B知道A会在下一轮拿走,因此他会在这一轮就拿走。
      4.
      回溯至第一轮:
      ?
      A知道B在下一轮会拿走,所以A在第一轮就拿走。
      结论:尽管合作能让奖金池增大,但完全理性玩家会在第一轮就终止游戏。
      总结
      ?
      逆向归纳法适用于有限步动态博弈,从最后一步开始推导。
      ?
      它能帮助玩家预见对手的最优策略,做出最优决策。
      ?
      适用于终局博弈、市场进入、谈判、竞标等策略决策。
      逆向归纳法的应用
      逆向归纳法广泛应用于经济、商业、政治、军事、人工智能等领域,特别适用于动态决策问题,即决策者的选择会影响未来的结果。以下是几个典型的应用场景:
      1.
      经济与商业
      (1)
     &nbs

第475章 逆向归纳法[1/2页]