火锅博弈的另一部分解释

这是课堂解释部分:

课堂部分是标准的囚徒困境,而且老王为了保证学生们之间不会互相透露信息还特意加大了其实不存在的竞争,像特意在学生们填写这个游戏的时候解释课程的计分原则,导致学生们以为他们的选择真的和期末成绩有关,当然喻文州看穿了王杰希的小把戏,于是课堂上向王杰希扬了扬试卷示意。老王讲课的内容是囚徒困境,是一种非常有名的博弈情况,原引例是两个囚犯落网,警察把他们分开审讯,审讯政策是两人都交代赃物的去向,两人各判八年,其中一人交代,另一人不坦白,坦白的人无罪释放,另外一人判八年;如果两人都不坦白就都只判一年;该理论由约翰纳什提出(对,就是那个美丽心灵的男主角)。

在这门课上老王举的例子是引例的改变,可以画成这个表格:



然后转换成收益矩阵是这个:(假设无罪释放的收益是2,判一年的收益是1,判八年的收益是0,判十年的收益是-1)



由图我们可以知道整体的最优解是两个人都选择b,即最后两人全部都得B+的分数,但是由于心理原因(即每个人都在乎自己的成绩,都不想得到C)每个人都会选择对自己最有利的那一种情况,即a,在这个例子中选b是绝对劣势策略,在这里有条结论叫:

Don't choose the dominated strategy.

既不要选择绝对劣势策略,原因是在你选择a的情况下,无论对方选择什么你都不会掉下B,即不会获得最差的结果,但是一旦你选择了b就有有获得C的风险。但是这个游戏也有前提就是参与的人是理智的而且足够聪明,以及参与的人利益相同(不同的话又是另一种情况);但是如果参与的两个人又有道德上的需求以及很好的同理心的话,看似最后的结果可能就是集体最优解b,b,即收益为1,1,但是这时候并不存在绝对占优策略这个概念,因为它的收益矩阵会告诉我们只存在相对劣势的战略 。

囚徒困境也有破解的方法——共谋(喻文州和黄少天在进教室之前串通好那样)。在这个案例里,这些同学本可以相互签下协定:我们都选择b(如果没有规则:不要让别人看到你的答案的话,王杰希用竞争来保证绝大部分人会遵守或者结果等效地遵守这一规则)。但是这样问题又来了,你怎么知道对方一定会遵守协定呢?

解决这个问题有两种方法:一是有外界的强力保障能干涉到参与者的利益(不是有句话叫没签过的合同就是WC里的废纸么);二是把单轮游戏变成多轮游戏,在多轮游戏的情况下,如果参与者有一次违反了协议那么,在下一次的游戏中由于该参与者的品行受到大家的怀疑和他一组的人势必不会相信他,最后重复未签订协议时的情况又回到了a,a个人最优解,但是这时候除了这组人外的其他人因为签订了协议都拿到了B+的成绩所以这一组人就会处于劣势,于是最先违反协定的人得不偿失;当然这是理想情况,因为在现实情况中一定有剑走偏锋的、不够聪明的、不够理性的。所以最终这只是个模型推导结果。 


评论
热度 ( 15 )

© Link_Check | Powered by LOFTER