发布网友 发布时间:2022-04-29 19:40
共3个回答
热心网友 时间:2022-06-21 22:45
棋类运动,甚至人类历史上,发生过无数次,弱小一方对面优势大到不可能输的一方,却发生了绝地大翻盘的事情。抛去东方神秘力量之类的因素,这种事情一般只有三种可能:一、弱势一方运气逆天;二、所谓的优势其实是幻觉,是误判;三、优势方犯了巨大错误。大多数棋类运动,包括围棋,不存在运气问题,所以第一条我们先不考虑。李世石对Alpha的第一场其实就是第二种情况。下到中盘的时候,我看的直播说只要李世石不犯错,基本就不会输了。下完后的复盘结论是,当时优势其实在Alpha一边。这就引出一个很严肃的结论:人类的判断可能跟真实局势相差甚远。如果绝顶聪明的电脑能判断出真实局势,那么它眼中的局势很可能跟你看的完全不一样。这局势有多不一样?很可能人觉得自己占据优势的时候,绝顶聪明的电脑觉得人已经输了。如果此时换成两个人来接着下棋,还能下得有来有回,但在绝顶聪明的电脑眼里,这不过是菜鸡互啄罢了。我举一个星际中的例子:星际2 超级AI梦幻级微操 小狗冲坦克阵100条狗冲20个架好的坦克阵,谁会赢?如果是人来打,坦克大比分赢;换成电脑,小狗大比分赢。人会觉得坦克优势无限大,但如果双方都完美操作的话,坦克一点机会都没有。那么优势方犯错呢?当然,绝顶聪明的电脑应该不会犯错。Alpha不是绝顶聪明,第四盘它犯错了。当然它也算非常聪明了,很快它就意识到自己劣势了,之后它怎么下的?它在乱下。为什么?因为它的学习过程里包含大量自己和自己对弈的过程,所以它默认它是在和另一个接近绝顶聪明的对手下棋。绝顶聪明的对手不会犯错的;绝顶聪明的棋手不会挖坑给对面,因为他知道绝顶聪明的对手不会往下跳。所以乱下并无所谓,反正无论怎么走都是挣扎;只要对面不犯错,自己怎么走都是输了。。所以这里有个思考题:如果有一步棋,你这么下了,对面只要应对正确,就必赢。但是对面中间随便一步出现最微小的偏差,你就立刻赢了。那么,你会不会这么下?或者简单的来说,你会不会卖个破绽给对面?反正绝顶聪明的电脑不会。关羽使拖刀计阵斩了不少对手,不过如果是绝顶聪明的电脑来的话,它会直接从上去把武圣砍了。
热心网友 时间:2022-06-21 22:45
果真的是聪明绝顶的电脑,那情况只会是以下三者之一:
电脑1开局求和,电脑2接受(和)
电脑1开局认输,电脑2接受(先手输)
电脑1开局下了一步,电脑2认输,电脑1接受(先手赢)
补充一下,常见的围棋象棋之类的棋是finite sequential game of perfect information。
finite是指有限步内结束,比如国际象棋规定三次重复局面等情形:和局 (国际象棋);中国象棋也有类似的规定。这些规定保证这些棋不可能永远下下去。sequential game则是指博弈双方轮流做决定,和双方同时做决定的simultaneous game相对应。前者例子就是各种下棋,后者例子有猜拳。perfect information是指双方完全掌握所有信息。perfect information的例子包括所有明棋;imperfect game的例子包括大多数牌类游戏,军棋,带战争迷雾的RTS(红警手动斜眼)。Zermelo's theorem (game theory) 策梅洛定理说明,对于这类游戏,如果其中不包含随机因素(单指棋盘上的随机因素,比如发牌扔骰子。下棋的电脑被断电这类随机因素不算),那么可以通过递归推导使得至少一方获得必不败策略。如果不要求排除随机因素,则这类游戏保证有pure strategy equilibrium。也就是说,均衡状态下,双方有确定策略,但是不保证确定结果。与pure strategy equilibrium相对的是mixed strategy equilibrium,混合策略。例如,石头剪子布里面,均衡状态下就没有确定策略(你确定出剪刀的话一定会被确定出石头的克),只有混合策略(双方出手前按1/3,1/3,1/3的概率随机决定是石头还是剪刀还是布)。总结一下就是,如果是有限步内结束,双方轮流移动,局势对双方透明,不含随机因素的棋类游戏,则一定有确定的最优策略,以及对应的确定的结果。(象棋,围棋)如果是有限步内结束,双方轮流移动,局势对双方透明,包含随机因素的棋类游戏,则一定有确定的最优策略,以及对应的不确定的结果。(大富翁)如果是有限步内结束,双方轮流移动,局势对双方不完全透明的棋类游戏,则至少一定有混合的最优策略,以及对应的不确定的结果。
热心网友 时间:2022-06-21 22:46
1.由于下棋是“有限博弈”所以存在sub game perfect equilibrium(子博弈完美均衡)。
2.下棋是“零和博弈”所以所有equilateral 的payoff(支付)都相等。
也就是说:可以证明在所有的均衡解中,一定是“先手必胜”,或“后手必胜”,或“一定和棋”。
至于究竟是哪种情况目前的理论还无法给出答案。以上两个定理的证明见《A Course in Game Theory》,零和博弈在书中叫strict competitive game。