本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 . e4 k% v) J7 l9 R; N4 s) Z
+ Y, W$ j4 U! h- e: U$ j2 Q1 o严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);& V/ X% t$ H+ t: m7 s
以下三个定义:
e2 s. i m$ e 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
4 d9 \. b0 A& Z! e! p 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
' \) t$ }- ^. Q ] 所谓的双方优势策略则是指双方利益总和最大的策略。
& k5 {+ j K3 L) l$ V9 r# B[编辑本段]严格优势策略举例分析) T( w& S, K1 Y1 E
一、经典的囚徒困境 9 h' r& I; z. E( X* A3 L
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 9 a7 f) p7 w3 _( A, M
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
8 W9 L, @* Y4 o8 T- Q8 l 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 + f, e( L2 f+ q/ X5 X
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
& Y* i$ R( Y. |1 y# k/ Q9 B 若二人都互相检举(互相“背叛”),则二人同样判监2年。
2 X. C B, p5 l: V$ @
/ R5 r+ \- {- S. v) a, u) F8 E2 F用表格概述如下:
6 m* h9 \6 ` c; }( I0 X* D! D: D: D0 h; i* m d) x5 Q
甲沉默(合作) 甲认罪(背叛) t. r8 f; g/ O
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
/ n8 }1 x0 {$ E乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
8 y3 A3 A( Z2 ?& x9 I& ^# t/ Q2 y R' d
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 4 N `) g( |+ U
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: . P( c$ A3 {; D7 A6 T
若对方沉默、背叛会让我获释,所以会选择背叛。 . s* m/ d5 u$ [7 P" I6 l5 Q9 v# y) k
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
% x3 H/ C; R# q. H! J9 l' Q4 y# ?. Q 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
* v5 c% x8 k! g; K S! J# O, [ 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 # \8 a+ a( g# m- ~4 S2 @
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
# ^4 h4 }% Q5 V7 q[编辑本段]二、智猪博弈理论0 {; ~" Q+ R# E8 L" v% W4 p
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ! S* C9 [/ }+ I9 W' ]; m
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 6 u9 _( V3 ]. \% @
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ( w' t9 C# f3 W1 S5 N) j
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 1 k% m5 N$ _9 p
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ( q# Z3 Z2 M5 }8 T7 M
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 : O/ [( g. J- \" X8 d1 c1 S
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。7 v2 Y9 L& ^( j9 }
) S v' T& g) D$ Q# F7 m7 q. x( N
三、关于企业价格策略4 b6 x6 i7 F; j! G* e5 M0 w
8 `0 ^2 y" E: \8 g6 [: x
: b, c: c2 ?6 O4 Z! ^ 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
' y& I P: \# V$ K. W. l 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);% q/ K% J* c5 l! f
以下三个定义:
3 ?* S8 T2 x7 o& s" Y1 I9 A 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 & W8 r9 N" {; E
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
& u& [ v# p: Y9 Y 所谓的双方优势策略则是指双方利益总和最大的策略。
4 G" [! Z9 U4 T# O8 N* A( m/ V$ \[编辑本段]严格优势策略举例分析 x$ E! e4 m4 c* u
一、经典的囚徒困境 # x2 `4 F1 `9 r7 S
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
4 V3 K) y& f+ t/ K- @$ K4 E( r: y 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
l C" {4 V+ x# T7 M' s6 Z 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
6 b% w; B; A6 Q- `; e/ E3 X4 l 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 0 k; e) n& L4 F7 K: A% e) W1 Y8 W3 k0 d
若二人都互相检举(互相“背叛”),则二人同样判监2年。& i. ~; M4 C( f' ~
2 |" E3 X7 O; D# Z$ _4 Q
用表格概述如下:
0 M" h7 \ x- j5 V( P& V- ]8 O0 r- G7 H. l" T
甲沉默(合作) 甲认罪(背叛) ' _4 r8 h" Q2 r
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
* K( z& [4 n* K3 H2 e/ q乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
- a. ?9 F( [7 M$ |! y' _# [+ L4 l/ `
/ f* I4 g8 m* B8 q7 {# O( F 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 1 {4 e: r' G0 Y2 Q
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
4 F6 c _0 K/ R1 \6 y+ N0 {3 h% j+ x 若对方沉默、背叛会让我获释,所以会选择背叛。 ; B6 g8 u8 y" ?
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
3 H+ W* u& L/ e, x/ W# i2 @; O 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 - L9 [& m% m" m3 [+ Y, L) q
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ( s; y2 ?1 q! e' D) n% m- s' {
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。3 I& b( M6 ~( g1 v' L# D
[编辑本段]二、智猪博弈理论
7 Q5 [5 ]/ ]5 q7 H 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 " V, u7 d* H- h% Y' O/ m
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
3 g5 |+ K, o- r7 I 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
1 u* j" ^& F5 o! B- ] 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 4 L" b5 z2 B, i4 @( j( a! U5 a/ Z
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
" C9 }2 R' z. Z1 ^. Y+ F 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 + V4 ]- X) A- _, g
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
/ z& g& _7 c: J3 K0 ]9 N 0 l7 R: f; n9 c
三、关于企业价格策略
& j( A) g( ], R5 y4 n' Y; J9 s
/ R. D! P+ L9 c" U7 h$ P 0 y/ |( N" V9 E/ I* P3 x: T
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
1 X# g! {* o# c$ @ 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);. H# ?5 n; b2 G2 Y/ I3 y, G# i; _, C/ ?
以下三个定义:; B% |) \* b8 r4 v4 N L4 G, O9 p
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
+ ?7 I" n# F( ^ E) I 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
1 G, r% B/ n) F5 r7 g( p8 u 所谓的双方优势策略则是指双方利益总和最大的策略。
0 C I6 a- ^2 Y4 _& |# P7 X[编辑本段]严格优势策略举例分析
; ?8 m! ]1 i- K$ c0 _$ M- P. y' } 一、经典的囚徒困境 3 Y4 D5 K5 z, x
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
$ X0 G% Y* e9 _% M7 X" Y' k# F u 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: - T" A$ S" n4 P) Y: b( y% n# A
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
+ {. a9 t) ^' h9 P 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
( i# N5 j0 f" m 若二人都互相检举(互相“背叛”),则二人同样判监2年。) I$ s( }" n" W
* d7 l* S4 o: E+ t* ^( p! H; c/ \用表格概述如下:+ |; ?+ M: {( Q* o1 \! L, e
3 j" D* A6 ]/ d4 L( _
甲沉默(合作) 甲认罪(背叛) + V+ G* c, ]* J; z1 d
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
7 S$ G# E: |; u% n* V( e$ c0 i乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 / z0 Z1 q4 J( ]* L/ E
9 P: W! o/ u) w
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 , [& Y8 p/ n% m- w$ ~5 m) I& v
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: . I9 a! M9 g6 y6 [( U0 R) q1 Z) B P
若对方沉默、背叛会让我获释,所以会选择背叛。 & T( d7 U6 j. c& _' B
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 / Q4 N+ _* F' U" ~! P2 ?8 J6 m n
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
9 R0 M7 q; w& O' |6 J2 l# P 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
0 C% \1 _ m: ^, {8 e. z 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。2 X! c5 M- @7 W) O p {* Z
[编辑本段]二、智猪博弈理论1 E" q9 j& O$ l
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
7 Q7 H8 e1 q5 C H 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
# t" D4 [! H; {# G$ _3 q 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
8 t+ q# e) I! N& c* p 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
' b4 X) }0 y8 v* j: L3 j “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
& n# f3 {: b9 e/ _9 Z6 K, @- ?9 d 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 & }& Y1 X# ^& j: K
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。0 A; e ` f' k
3 \1 K- B" m: x8 ?$ C. J6 t# U
三、关于企业价格策略
) |! @, H2 p1 H. y% b0 d
' v0 g3 S/ S) {7 F( z* {" v, P0 V/ j ) R3 _; X! F* W1 B1 c9 f: W
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
/ T! t* L0 W/ j0 E- ?7 s% a8 j0 r5 d. M N 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);6 s$ V2 |/ \! w3 u, c
以下三个定义:
! b; r9 K; e! r. \ a+ N) k 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 4 n% t3 K: |/ M8 k; O
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
7 \3 }! p1 L6 e! L3 ]$ z0 ` 所谓的双方优势策略则是指双方利益总和最大的策略。 ! e8 U. C* Y, J* i
[编辑本段]严格优势策略举例分析$ W! Y5 G; i/ t2 s/ ~" u6 h
一、经典的囚徒困境 6 e( e, l) o9 M- m
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: . h2 i) W+ a% J$ r5 ]
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: $ `/ @$ U8 K s i8 i v/ g
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 6 H; D0 A0 j8 d3 d4 H7 @2 @3 a
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
+ T% ~5 f7 k; B 若二人都互相检举(互相“背叛”),则二人同样判监2年。* t1 r# y$ R3 ^7 s2 `/ X( W* X8 E
5 i+ J9 ]' r8 x! o& Y3 @用表格概述如下:
: Y& B6 p8 i& m/ Q# u8 j y& Y$ v& U. B" R0 @% Y( j
甲沉默(合作) 甲认罪(背叛)
# _: K6 r( R- L& N! ?乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 & ?) }7 w( ?% K& f3 M$ @" K `& t
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
7 {3 ]+ b/ v: {4 ^, |4 ?$ d) ]
1 @4 N8 a# a. t, \1 F% _ 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 4 E, X' k0 m( u
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: $ J) t' m7 ~' i$ F; [8 `0 C" f4 P$ F
若对方沉默、背叛会让我获释,所以会选择背叛。
! ?7 v8 s3 |. H/ I; F$ P. d 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 $ o+ ]0 S& c5 Q0 R4 l: x# h! \; p: `$ b
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
* i, R* [+ s5 ]/ o1 F4 ` 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
3 y' r- H+ W9 B$ u" A) S 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
7 ?) D( e+ t- ?: p6 _[编辑本段]二、智猪博弈理论
0 B- k8 f1 |4 j+ A9 @ 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ( @" G. B) M+ `" Q9 t
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 8 @# R* V8 V( B; G2 Y/ W1 N5 D& X- s3 [
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
% Y' n) j G2 g* _+ H3 i1 R 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 5 [$ e) o4 Y% {' j% M
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 4 H |* O* U* R7 j
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
& q! ?8 G! k8 Y% V 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。; r: m. I6 v; I# S5 h" P4 ~! x
( {: s7 R8 a4 E# a. q三、关于企业价格策略* a k. C& V0 J* ?! y0 {& e
A" n6 O2 _* U& `2 K. F5 M
7 ]. Z% A8 I) {5 Q9 h
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
- v1 a. p% V; Y5 q. m Y 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |