发布网友 发布时间:2024-08-19 23:20
共1个回答
热心网友 时间:2024-08-24 11:10
在无限重复的博弈中,行为规则可以通过自动机来描述,从而将不同策略之间的竞争转化为机器之间的较量。例如,甲和乙在无限重复囚犯博弈中,甲采用仁厚策略,乙则采用理性主义。他们的博弈可以视为恕道机器与流氓机器的对抗。第一回合,甲的H(合作)对乙的D(欺骗);第二回合,报复的D,接着D;第三回合,甲原谅,再D,乙发现后转为H;如此循环。通过报偿表分析,可以看到循环序列每三个回合重复一次,平均报偿甲为2.67,乙也是2.67,双方平衡。
进一步,我们可以用这种方法计算七种策略对战的平均报偿,形成一个7×7的博弈矩阵。这个矩阵显示了多种策略组合的平衡点,如恶棍对恶棍,双方持续欺骗,是重复博弈的均衡点,报偿为2。有趣的是,无条件合作的傻客策略在重复博弈中不再是均衡点,因为出现了更多新的平衡点,如恕道策略对恕道策略,双方可以实现合作的4,4报偿。以流氓对流氓为例,初期的冲突后,双方会转变为合作,无限次重复后平均报偿为4,这是“大众定理”或“无名氏定理”的体现。
大众定理表明,存在无数对有限自动机策略,能够在无限重复博弈中形成平衡,促进合作的实现。这个定理的名称源于多人对重复博弈合作思想的贡献,使其无法归功于单一创立者,因此被称为“无名氏定理”。
大数定律又称大数法则、大数率。 在一个随机事件中,随着试验次数的增加,事件发生的频率趋于一个稳定值;同时,在对物理量的测量实践中,大量测定值的算术平均也具有稳定性。 在数理统计中,一般有三个定理,贝努利定理和辛钦定理,如:反映算术平均值和频率的稳定性。当n很大时,算术平均值接近数学期望;频率以概率收敛于事件的概率