本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 2 i) v1 z8 I) C7 ^( X
4 J; H% F; q& W% ~0 f8 g9 B; A2 a# c7 k
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
& l, a* P1 M$ L! Y) Q 以下三个定义:6 I: W( _8 I- @1 V% h9 y9 ?, ~/ |
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
) C2 K# E- q$ i, P, x! w# C 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 8 g! |* K n- l' l/ [8 d9 S
所谓的双方优势策略则是指双方利益总和最大的策略。 $ s. E( x) n8 Q/ C# ^5 ^
[编辑本段]严格优势策略举例分析
! S/ s! j1 I* O* @6 P, ^( N7 a) w 一、经典的囚徒困境
, {6 w6 G+ u. D3 p/ g 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
6 C8 z' @9 j( d 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
3 c2 R+ @, W0 @# ]4 D, S 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 5 U* r* S3 X2 P' u$ P
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
) E# h T, @: u% D5 M! s8 W 若二人都互相检举(互相“背叛”),则二人同样判监2年。
& A- d# _8 v, o) U q3 `
7 L" W- U. N% U$ b8 I5 P% E" ]用表格概述如下:3 {% A7 D) M' X2 c
. y. P5 l) r( l" Q2 N2 K 甲沉默(合作) 甲认罪(背叛) & D; d6 r6 f6 _; w: _
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
! W5 _, }/ f& h" @* h! P乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
; u9 _) g* k8 `' ]8 W+ i8 l: z
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 0 R4 S6 c8 c: E+ \& \1 _
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ) f, n( M! ~* `4 E
若对方沉默、背叛会让我获释,所以会选择背叛。
/ O h$ U# U4 G9 {0 M 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
# m' q. A# X* ?% j8 E y 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 " R* j; I1 d1 Z( e! A
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 4 Z7 I, ?: R6 e5 K- x/ O/ o4 Z. I: o
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
( e- ]5 s+ \/ X7 l" S. b[编辑本段]二、智猪博弈理论* X, L3 g m; G: _/ A1 `$ S
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 % p) ]7 X0 f- n L- F0 t a5 x. ^
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 + k- @3 F; O6 n- G6 ?5 M
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
- I2 [# T: u% c2 ?" M* a 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 . J# H# P/ t1 o
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
2 n; T2 A* h5 o: C- h9 r4 p 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
?8 \: E+ g! P7 M' t! ? 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。* M' j r/ l y2 d" }& o) x
9 p& v5 J, n. ^三、关于企业价格策略
" n1 K3 e% q) J5 K# P; y; {! q
6 U7 ^( _1 L: Q ; h. d- ?4 Y0 E0 W7 Q* C
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
6 h+ w. a7 w$ Q2 s+ F8 E 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);" D3 D# c' Z! q. Q2 P# {
以下三个定义:, j6 V5 o8 }! f, L% O
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 j) T. A. G$ w! u/ q- f
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 , A8 v" N' z/ J: H
所谓的双方优势策略则是指双方利益总和最大的策略。 . q- m9 r. O# @& \# d
[编辑本段]严格优势策略举例分析
1 {) l8 `7 ~- m( M# r. c' K' h, t 一、经典的囚徒困境 : E+ B) U0 g% K4 t i% M
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: R4 }5 ]) C( b! Y, g; q
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
& `2 ~& r3 Q Y 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 % _4 C* j2 |! t& I& W$ j8 r& @
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 " v+ `9 j# P; N
若二人都互相检举(互相“背叛”),则二人同样判监2年。3 k2 y5 I. z# B* R) S* L
& Q; Q3 D% o( }2 z; r) `! T4 G: x
用表格概述如下:
7 _ f+ Q) x, L" X' m3 I' m: Y1 A, A! T& I
甲沉默(合作) 甲认罪(背叛)
( s! U( C& P2 ~+ f5 `乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
7 b) k- s4 X) X( A) R5 U: A乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 , W8 x" g ?% o' ]! V" G! @
9 U3 O0 H7 c2 j. r3 _% L( ]% G) r
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
$ M; T( K) {% M; ~6 N 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: # X/ a9 _( T* e( Y
若对方沉默、背叛会让我获释,所以会选择背叛。
6 q" W j+ r, Q" _5 p7 u/ U+ V! V 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ( Y5 k4 u# f$ ~" c( {# p8 ~
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 & u# }. l9 g6 R
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
/ v( E: }- R: V" N 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
8 J4 G$ n2 e1 Q7 X k* C[编辑本段]二、智猪博弈理论
, k6 ` F x" g# ~1 F- r 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
' y4 K; _4 j7 k4 L( J7 |2 A4 y 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
+ q. g) `' h3 H6 Q5 Y 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 D4 L$ p* ]9 A% N
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 2 m( i Q( y0 A+ y
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 / j/ i- L/ M& D- K' ~
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
+ }5 }& \4 i5 ~# I# v 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。1 [+ j/ s' p) P/ v! ` Z/ b0 r( Z
: s4 p7 T! d0 k! p
三、关于企业价格策略
$ I1 d) ~; }" U6 w% L9 e5 S
" D. ^5 X# R* e % X$ F/ T4 h3 h5 H* E! ]
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 3 w9 h4 m: h L5 h
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);0 q; P, l4 k" D/ B6 D9 E$ {
以下三个定义:
/ R3 O4 n L# m! A2 x 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
; C2 T2 B* ~ m6 I6 R 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
( ]4 \) C1 s" I* o 所谓的双方优势策略则是指双方利益总和最大的策略。
1 [5 c. i1 U+ \, o[编辑本段]严格优势策略举例分析4 U5 t) O2 I$ R9 N* Q
一、经典的囚徒困境
/ k6 M1 c+ a- p3 Q3 m& a 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
K" p( } G- l5 s$ o, v$ O9 M- F 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ( F1 h4 h( ?( X B7 j6 d
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 & V& i9 p2 m- y
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
% g' n( H% q% f& r 若二人都互相检举(互相“背叛”),则二人同样判监2年。
2 o4 b) \& i! T$ I6 i; n
+ I* A/ L [0 J( c) X用表格概述如下:* x, ~) W% B0 l# c
- \1 ]9 E1 {$ |6 | 甲沉默(合作) 甲认罪(背叛)
$ k# q/ O9 @; [1 S& ^# a; A乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
. m) o% E( I: j) y乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
0 G" t+ T0 ^1 J/ l8 G& _1 u3 Y) A9 W) q3 a7 r0 L+ o7 [" V8 H
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
9 I% X$ i/ M, N) N5 \, `# d" D3 T& ] 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
$ M# \) Y! g$ j, p& x 若对方沉默、背叛会让我获释,所以会选择背叛。 . C2 @. q1 Q6 | t" t
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 1 j9 N. b8 l5 C5 M3 e! D l1 D* X) \
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
5 {! m, x0 r+ X! O1 x 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 / O5 l3 Q1 q/ H0 l {' J
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。3 X" K, N4 x9 K9 E9 q& b
[编辑本段]二、智猪博弈理论
' O2 D' ?9 a) J& V2 `! f0 | 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
# Q2 w+ b. U2 S$ t7 I: I8 V 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
; d% S b+ t' e$ E0 a 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 4 s% ]3 ?7 D5 L4 v" _/ V
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
6 }6 P: l) r8 n9 C: A “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
( Z3 }+ \, t, Y$ n* G 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ; s* ~& w7 L# [, b
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
4 b7 F2 U7 r4 {# z+ }
& ?- f. b" {; t" _2 G8 a; \* T三、关于企业价格策略$ D. ?) v: P) Y7 t8 Y
2 R3 K( d8 G6 \: Y! ]
) b2 Y2 ^" C" O& R. N2 g4 }4 N 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
; }) [2 g0 I" S! b! l 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);7 m) i# W3 Y8 l; b
以下三个定义:
0 ]- U) i; m# n9 n 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
1 n/ |1 O' u7 e' s; n2 b 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
) C& O) Y, y- ]) v' j* J7 z7 f! \# @ 所谓的双方优势策略则是指双方利益总和最大的策略。
- Z! g! m' l3 @/ c/ T5 L[编辑本段]严格优势策略举例分析# C" D. n; T7 } P
一、经典的囚徒困境 9 ]) o. r& z7 \% }) K3 B
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: + x9 b( @4 ^. S- W
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ( J! S% M( y2 Y- N
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 1 E$ _; }4 M7 N. i6 U) I8 K
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 , j$ [- Y/ t% O! {! ]" a
若二人都互相检举(互相“背叛”),则二人同样判监2年。
: X+ _# |1 m- k* M; I 2 j H X1 L5 \ D) L) u
用表格概述如下:
2 u; }2 G" I1 N* t6 y p2 z' b; Q' `1 h2 \5 [- n
甲沉默(合作) 甲认罪(背叛) 8 t1 L4 K0 P' Z0 m- l
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
7 @0 s: w& \% f乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
! Y) e: S$ k8 X) u
8 @1 n: u6 [9 Q% J8 B C/ \ `( Q 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
8 g. t* E' l; t) K5 v 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
8 m6 A' t2 n7 Z5 N4 j/ h' [; h 若对方沉默、背叛会让我获释,所以会选择背叛。 ( J8 m7 U+ o3 _4 H2 l( ?/ P
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ( h4 O \0 v! y$ Y. D) Z+ N
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
3 Z w( C/ S" H 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
% A# p# {% O: K% c2 ~ 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
7 P" U# ^ f9 Z k; _[编辑本段]二、智猪博弈理论
, @: j$ W# g7 c 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ( J. m! `, b4 n" x2 |$ D6 [
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
5 Y( G: w4 t2 R5 Z/ ~ 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
) B7 a# q( y/ l5 C5 L 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 " S( t" ]' m" S
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
# j; O: J! `, e1 \7 _ 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
3 r7 x1 y% F9 ` 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
% L f$ w) e) X9 L5 J * S# B0 i' Y- Y) E
三、关于企业价格策略2 y* G$ u& Q' E; l% z% S
L. t) D$ C- g1 Q! {; n0 n, G 0 v8 r1 E8 s. w, j4 ~; e
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
: q2 Z! r% ~2 Q/ `1 D 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |