博弈论——导论、五个入门结论

2022-09-13

导论、五个入门结论

​ 视频里的老师说这属于经济学的课,但是同样属于政治、法学、生物学、体育等等。嗯,计算机都有专门的博弈分支了,更应该听听了。

​ 推荐书籍:《Strategy and Games》 Dutta;《Strategies》 Joel Watson

​ 老师强烈推荐:《Thinking Strategically》,据说是非常棒的睡前读物

  • 策略形势:行为影响结果,然而结果不仅取决于你的行为,还取决于其他的行为
    • 不属于政策形势的例子包括:自由竞争企业、垄断企业等等。
    • 属于的例子包括:福特和丰田等少数几家汽车企业,他们的决策会相互影响

游戏1

​ 一个简单的成绩博弈:在不被你的同桌看到的情况下在方框中填写字母α或β,把这看成是成绩的赌注,学生会被随机分成两两一组,并且学生不知道自己会跟谁分到一组。按如下方法给出成绩:如果你选α而对手选β,那么你是A,对手是C;如果你们都选α,那么你们全是B-;如果你选β而对手选α,那么你是C,对手是A;如果你们全部是β,那么你们都得B+

列表整理信息

​ 表格内的选择表示我的收益

你\你的对手 α β
α B- A
β C B+

​ 再来画一下对手的表格,表格内的选择表示对手的收益

你\你的对手 α β
α B- C
β A B+

​ 接下来使用博弈论的标准方式整理表格,将两个表格插在一起,进行比对。单元格内的第一个成绩是我的成绩,第二个成绩是我的对手的成绩。这是一个outcome matrix,列出了所有游戏内容

你\你的对手 α β
α B-,B- A,C
β C,A B+,B+

博弈的必要因素:动机和收益

​ 这里教授叫起了不同的选择同学回答问题:为什么如此选择。并指出,截止目前为止,这并不算真正意义上的博弈,因为虽然涉及行为、策略、参与人,并且我们知道不同的结果,但是我们缺少了一个必要的因素,就是动机和收益,我们忽略了参与人关注的是什么。博弈论不能告诉你人生的目标是什么,但是一旦你明确了目标,博弈论可以帮助你达成目标。

​ 通过问答,我们获得了两种可能的收益。一种是只考虑自身利益的,一种是同时替他人考虑的

第一种收益(恶魔收益)

​ 只考虑自身利益的收益,我们暂且称为恶魔收益

​ 这次我们用数字来代表功利或者说效益,代表了想要最大化的东西和想要达成的目标

你\你的对手 α β
α 0,0 3,-1
β -1,3 1,1

定义: 无论别人选什么,如果选α得到的结果严格优于β,那么α相对于β是一个严格优势策略(此定义的重点在于 无论别人选什么)

结论1

由此总结结论1:

1、不要选择严格劣势策略,因为选择优势策略的时候,无论哪种情况,收益都要更高

结论2

问题:两个人都选择α,收益都是0,但如果两个人都选择β,两个人的收益都是1,所以应该选β,这个判断的问题在哪?

​ 1、因为这个game没有交流合作的前提,我们没有办法保证别人经过了同样级别的思考,和我们得到了相同的结论。

​ 2、即使有相同的想法,对面这时候也会选择α,因为会有3单位的收益

所以我们每人遵循结论1,不选择劣势策略,选择α,只能获得0的收益,也就是不好的结果

由此得到结论2:

2、理性人的理性选择导致了bad(次优/不好)的结果

经典案例:囚徒困境

这里还举了另一个十分贴切的例子:宿舍环境,年末的时候大家都不愿意打扫宿舍环境,那么无论室友是否打扫,对于一个懒蛋来说,不打扫是最好的选择,所以大家都选择对自己最有利的情况,都不打扫,宿舍环境就会很差。

以及离婚纠纷、企业价格战等等,都是囚徒困境的例子。

那么现实中如何打破囚徒困境?

本质上就是去改变利益

使用强制力约束来来促进和合作的达成,书面协议、暴力

使一次博弈变为多次博弈

使用教育的方式等等

第二种收益(天使收益)

​ 这是同时为别人的考虑的人的收益,我们暂且称为天使收益

​ 这次改变了两人选择不同时的收益数字,想象一种可能:

​ 假设我选择α,对手选择β,我应该得到3收益,但由于内心的愧疚不安,减去负罪感后收益是$3-4=-1$

​ 假设我选择β,对手选择α,我应该得到-1收益,但由于我对他害我得-1感到愤怒,于是收益是$-1-2=-3$

你\你的对手 α β
α 0,0 -1,-3
β -3,-1 1,1

​ 在第二种收益的情况下,选α会得到0/-1,选β会得到-3/1,α的下线更高,β的上限更高。情况是,对方选α的时候我最好也选α,对方选β的时候我最好也选β,这里没有优势策略。这个博弈叫做“协和谬误”

由此可见,收益很重要,改变了收益,博弈截然不同。因此我们得到了结论3

结论3

3、汝欲求之,必先知之(you can’t get what you want unless you know what you want.)

混搭收益

​ 我们是恶魔,而对手是天使,这种时候如何决策呢?还是用列来代表收益,第一列是我们的,第二列是对手的。我们把前面的两个表格和在一起就是我们需要的了

你\你的对手 α β
α 0,0 3,-3
β -1,-1 1,1

作为一个恶魔,α是一个绝对的优势策略,正如结论1,所以选择α

作为一个天使,不存在优势策略,但是这里几乎所有台下的同学都选择了α,这是正确的选项,因为对我的对手来说α是优于β的。我最好也选α(现实生活中,有人做过实验,差不多70%的人会选择α,30%的人选择β)

结论4

由此可以得到重要结论: 结论4:站在别人的立场分析他们会怎么做

结论5

在耶鲁大学α和β比例 是238比36

结论5:Yale students are evil.

游戏2 选数字

​ “从1到100之间选一个数字填到下面的方框内,不要让你的同桌看到,我们会计算全班的平均数,谁选的数字最接近平均数的三分之二,谁就是赢家,赢家的奖金是5美元减去所选数和平均数2/3之差的美分”