博弈论 联系客服

发布时间 : 星期六 文章博弈论更新完毕开始阅读9f07b81103d8ce2f006623a4

目前我们涉及到行为、策略、参与人。

但是我们忽略了博弈的一个重要因素,即动机,或者说是收益,也就是参与人关心什么。只有明白人们关心什么,知道人们的收益是什么,才能真正去分析这个博弈。

当然博弈论,我亦或其他人无法说出你的收益应该是什么样的,也不能告诉你,你的人人生目标应该是什么?这不是博弈论能解决的。然而你一旦知道个人收益,一旦你确定了目标,博弈论能帮你达成目标。

这里有两种不同的收益,一种是只在意自己的收益,另一种是在意他人的收益,下面我们分别用不同的收益分析这个博弈,我们先写出这个游戏收益的各种可能性,不过这里用数字表示。

饭桶恶魔与饭桶恶魔的博弈 对手 α β

我 α β 0,0 3,-1 -1,3 1,1

(引入数字的原因:首先这些数字代表了效用或者功利,代表了人们想要最大化的东西和想要达成的目标。和前面结果矩阵相比,更直观显示收益。

比如(A,C)这个单元格,代表了3个单位效用,而(B-,B-)代表0单位效用,以此类推··· 表示有这样动机的人,只在乎自己的成绩,他们觉得A比B+好,B+比B-好,我希望我的成绩尽量好,要不我的努力就白费了。

他们只关心自己的成绩,适合称呼他们的术语,在英格兰叫“饭桶恶魔”。可能他们一点不讲道理。

再者,不管是不是真的就是自己的收益,假设这就是自己的收益,应该怎么做?如果只关心自己的收益,不管别人怎么选,选择α总能得到最优的成绩,这个理由更具说服力。(0>-1,3>1)

定义一:如果选α得到的结果严格优于β,那么α相对于β是个严格优势策略。 此定义的重点在于,无论别人怎么选,选α的结果优于β。 第一个结论:不要选择严格劣势策略。

(为什么?选优势策略,在每次博弈时都可以得到更好的收益,但道理不明显,不值得讨论) (换个想法:都选α得0个效用,都选β得1个效用,因此选β,1比0大。有问题吗?和我们的结果背道而驰。

但是结论没有错,那错在哪里?) (需要达成一致,如与对方谈判)

但我们的前提是不了解对方的选择,我们不了解他人的选择,即使我选了β,也不影响他人的推理和选择,这就是前面推理的漏洞之一。

其二,就算我知道他人的推理和选择,知道他人选β,我也必然选α,第一它建立在超现实

基础上,即我的推理影响到他人;就算上条可行我也选α。

结果就是我们都选α,都得B-,收益是0单位效用,不是1单位效用。我们都不去选则劣势策略β,收益为次优的收益。

第二个结论:理性选择导致次优结果。

即人们都不选择劣势策略。而选择优势策略,使总结果变得更糟糕,就是经济学里说得“不充分的结果”——帕累托效率。 这个结论可以用来分析囚徒困境(后面会详细分析)、寝室卫生(指望别人打扫)、离婚纠纷、武装冲突、价格战等等。

现实中是如何化解囚徒困境的: 1、 串通——无法实现;

2、 签合同——无效合同(违法)

3、 书面协议(同上,协议是有违约责任的) 4、 沟通——缺乏强制力。

暴力维系协议在一些地方扩展壮大,比如前苏联新成立地区,或者非洲。书面协议不受保护。国家的 壮大是因为法律强制力的补充,它维系所有合同,不管是不是合法的。 所以在其他收益设定的情况下,虽然没立下合同,还是会回来履行这个承诺的。

纳入讲道德的因素,成绩博弈参与人的收益不同又会怎样呢? 愤怒天使与愤怒天使的博弈 对手 我 α

β

α β

0,0 -1,-3 -3,-1 1,1

对手叫“饭桶恶魔”,我叫“愤怒天使”。

如果我选α,对手选β,我得A,对手得C,即(A,C)→(3,-1)

但是我因为良心不安,所以我的分数3减去我的负罪感的负效用后,我只得-1. (A,C)→3-4=-1

反之,我选β,对手选α,对手害的我只得C,所以愤怒,道义上的谴责2减去3单位效用。 (C,A) →-1-2=-3

根据这次博弈的收益,我们讲如何选择?

(回1:这里应该选α,选α的风险更小,这里没有次优策略,在坏形势下最好的选择是减少损失。

回2:选β的理由:选α最多只能得0,选β最多得1,前面看到的是最坏的情况,这里看到的是最好的情况。)

实际上这里没有劣势策略,对方选α,我选α,对方选β,我选β,也没有优势策略。

我们只是改变了参与人的收益,博弈的结构、结果都一样,但是人们在乎的东西不一样,我们得到的结果也不一样,在第一个博弈里,显然应该选α,但这里怎么选就不确定了,这种

博弈叫“协和谬误”。

所以要明白收益的重要性,改变了收益,改变了目的,就改变了博弈,改变了结果。 结论之三:收益很重要。

有一句话说:“汝欲求之,必先知之。”从逻辑上讲,可能行不通,很可能你想要的东西,在你不经意中透露出来。但从策略上讲,这是个不错的想法。它能帮助我们分析博弈之前,先弄清我们的目的是什么,所以说收益很重要。

You can’t get what you want,till you know what you want.

到目前为止,对这个博弈的分析,还停留在局中人都是饭桶恶魔或者都是愤怒天使的阶段。现在来让这个博弈变得更有挑战性,来一个混搭如何? 比如把自己想象成饭桶恶魔,对手想象成愤怒天使,这时该如何选择,不能弃权,必须选择。 这个博弈变成饭桶恶魔于愤怒天使的博弈,要把收益混合在一起,只需把前面的矩阵结合在一起,我的收益就是饭桶恶魔的收益,收益和之前矩阵是一样的,对手的收益就是愤怒天使的收益。

饭桶恶魔与愤怒天使的博弈 对手

α β

我 α β 0,0 3,-3 -1,-1 1,1

第一个收益是饭桶恶魔的收益,第二个收益是愤怒天使的收益,,你如何选择? 基本选α,α是正确答案。为什么? 因为这就是优势策略,这和之前的博弈没什么变化,别人的收益改变了对我的收益没有影响,α是优势策略,β是劣势策略,在这里α依然优于β,无论对手如何选,我都选α。(回忆第一个结论)

再换一下,假设自己是愤怒天使,对手是饭桶恶魔,这种情况下的矩阵为: 愤怒天使与饭桶恶魔的博弈 对手

α β

我 α β 0,0 -1,-1 -3,3 1,1

你是愤怒天使,你的收益还是这些,这次该如何选择? (基本选α)

但α并不优于β。

这次没有优势策略,对手选α,我选α,对手选β,我选β,然而90%以上的人选α。 选α是正确答案。为什么?

回:α是对手的优势策略,我们没有优势策略,对我说选α并不优于选β,但对对手来说,选α优于β。所以考虑到对手,站在对手的立场上看,他有优势策略α。他会选α,根据此情况,我也必须选α。

到目前为止,可以看到四种组合:

1、永远不要选择劣势策略(饭桶恶魔+饭桶恶魔) 2、学会换位思考(愤怒天使+饭桶恶魔)

3、奴欲得之,必先知之(愤怒天使+愤怒天使) 4、理性选择导致次优结果(愤怒天使+愤怒天使) 所以,这里有个重要的结论,即分析博弈最重要的方法或者说策略分析的重要内容或者核心思想是要学会换位思考。

结论之四:学会换位思考。即站在别人的立场上去分析他们会怎么做。

这是这门课程中比较难的结论,即站在自己的角度分析,弄清自己的收益很容易,但是在现实生活中,要走出自己的笑圈子,去发现这个世界上还有其他人,就要学会换位思考,去分析他们的收益是什么,他们会怎么做,并因此做出回应是很难的。

现实中,我并不知道对手的收益到底是什么样的,这会使事情变得更加复杂,弄清自己的收益总是要比弄清别人的收益要容易。我不太清楚到底我是在和饭桶恶魔还是愤怒天使博弈,因此在做类似的博弈之前,我们需要弄清楚收益是什么,今后将会更深入的学习。

实际上,“囚徒困境“这个博弈,比如选择α和β,或者类似的博弈在现实中进行过很多次实验,现实中人们发现大概70%的人选α,30%的人选β,即1/3左右的人会选劣势策略,WHY? 回:1、他们可能是好人,可能是高尚的人;

2、可能会再次博弈,每次都选β的人长期收益会更大。(没有理解实验,认为是多次重复博弈,而不是单次博弈); 3、比较愚蠢。 其他···

结论之五:大多数人都很自私。(修改过) 第二个游戏:选数字

从1到100之間选择一个号码,填到下面的方框內,不要讓你同桌看到。我們会计算全班的平均數,誰选的数字最接近平均数的三分之二,誰就是贏家。所选数字最接近2/3倍平均数字人是贏家,贏家的奖金是,10元人民币减去所选数字和平均数字三分之二之差的百分数

博弈与决策讲义二:学会换位思考——囚徒困境分析博弈(结合耶鲁课程) (2011-08-09 11:50:34) 转载▼ 标签: 博弈