首页 > 5月5日

零和博弈,5月5日

互联网 2021-04-14 16:52:11

一、零和博弈

零和博弈在英语中就是zero-sum game,也叫零和游戏。它从字面理解就是“加起来是零”,意思是说参与到这个博弈过程的对手,一方的受益,就必然意味着另一方的损失,所以博弈双方的收益和损失加起来一定是零。

比如,两个players参与到一个赌局之中,这两个players是对立的。“在线发牌”赌局游戏中,赌徒与发牌美女之间,就是一个零和博弈,赌徒想要cost函数最大,而美女想要cost函数最小。在这种情况下,对于线性系统,就可以找到一个cost的鞍点,Nash equilibrium点。

二、非零和博弈

非零和博弈是一种合作下的博弈,博弈中各方的收益或损失的总和不是零值,它区别于零和博弈。在经济学研究中比较有用。 在这种状况时,自己的所得并不与他人的损失的大小相等,连自己的幸福也未必建立在他人的痛苦之上,即使伤害他人也可能“损人不利己”,所以博弈双方存在 “双赢”的可能,进而达成合作。

比如,N个Players参与到一个合作下的博弈游戏,Players是协同的。假如目标都是想要成本函数最小,如果有一个player没有达到最优策略,那么整个的成本函数是变大的。所以该问题的Nash equilibrium就是N个Players都达到自身的最优策略。

问题思考:Multi-player non-zero-sum games问题,如何使用PI(Policy Improvement)的方法来解决非零和博弈问题?

1)初始稳定策略

2)Policy Evaluation

3)  Policy Improvemrnt

参考文献:

参考链接:

https://baike.baidu.com/item/零和博弈/3562463?fr=aladdin

https://baike.baidu.com/item/非零和博弈/3956943?fr=aladdin

https://www.zhihu.com/topic/19863374/hot

免责声明:非本网注明原创的信息,皆为程序自动获取自互联网,目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责;如此页面有侵犯到您的权益,请给站长发送邮件,并提供相关证明(版权证明、身份证正反面、侵权链接),站长将在收到邮件24小时内删除。

相关阅读