本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
1 M( Z# ]7 F5 d6 m- K* [2 `9 D! e# b# \/ U, e; r; R
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);% e/ |6 U& g0 }
以下三个定义:
9 Q5 b% o) [. M3 q 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
$ ~) ~7 }0 a" C# d/ ^* P0 F 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
, h* ~9 |: u5 J 所谓的双方优势策略则是指双方利益总和最大的策略。
0 d; E) w, @; A3 T[编辑本段]严格优势策略举例分析 Q: u2 f6 E. d/ O$ A0 z
一、经典的囚徒困境
3 F( i8 [- L4 B' A3 F3 l 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
) z) q3 O# C* r+ v) z& O( Z; S 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
) ~% X9 d9 O; Z( p) G$ E+ c 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
2 T; e0 t% U: r7 i 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
8 b+ `2 n) M, \ 若二人都互相检举(互相“背叛”),则二人同样判监2年。
B, f3 ^% X$ e) _ } - f* B( u) u8 p2 U* S5 [( I
用表格概述如下:
. |, R7 U6 c; m2 y- \# F! K4 y! G) T
5 @5 V; I# }6 W9 l- X 甲沉默(合作) 甲认罪(背叛)
4 `" \6 G- t- f) z乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
6 {: J8 _% B6 z' f; s- r乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
, v& H9 o% A% l" @" K4 v3 ]: n0 K
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ! D( r5 M. u3 Z3 h1 `
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
0 F1 U! R9 b! e5 d; O 若对方沉默、背叛会让我获释,所以会选择背叛。
3 w1 l4 Y( z0 Z 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
" k( f+ L# d8 a2 u! C# t 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ( A5 X! m) I1 F: z ?; E
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
! d9 }# N1 `( R. K4 B7 s# e 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
; n# @: K* W: y0 u/ r[编辑本段]二、智猪博弈理论
- T$ T1 Y+ ^8 S9 V* j7 n 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 + x9 u1 c1 E9 u1 e. Q1 ^4 D! ~4 s
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 2 Z) D+ E$ _0 D9 ]: T- Y
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 $ O5 _: Z9 ?! Z& O8 D: H" F
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ; ~- M4 j) E# {4 v6 p
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ! v3 s# m; |5 n8 V
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 - _+ n$ Q. i* U( }
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。7 q& E8 ^" j8 M8 R; r
) W1 t2 K/ [! w! A( [: i
三、关于企业价格策略/ ^3 s. h; h& s. h% f3 O
9 O) s8 K* H g, L6 |5 q5 V
. ~! V+ ~2 y$ U 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? $ v- {! T+ p* D+ N0 P7 D5 D
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
, v/ e' v0 D# k J5 ?$ F 以下三个定义:
" W5 a! u, g+ Q- V/ n8 E. } 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
$ W$ A. Y9 W. j 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
' ^$ G4 ?" B4 n3 M 所谓的双方优势策略则是指双方利益总和最大的策略。
: s w2 d7 J. N6 d[编辑本段]严格优势策略举例分析/ E2 e- ?$ L; U7 P* U, w
一、经典的囚徒困境
* ]: a( D/ c/ U4 g: N" x 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: * n2 s! g* z. g3 Y
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
; N5 N! z- k( w& D, v; g5 t9 v 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 + z4 b& D2 w: A
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
" U$ c+ V. R0 c* g+ ^2 z 若二人都互相检举(互相“背叛”),则二人同样判监2年。! p( v$ V! y& [" d$ g3 }- j) q
7 Y. A, i; k, ^; }* x
用表格概述如下:
. o! { p7 h' p$ y
& |8 v" M! t- h5 J 甲沉默(合作) 甲认罪(背叛) 9 R( C1 l' X$ o2 | t$ k# d6 P
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
$ _, Q7 a b. {( l$ t, ]( H乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 4 F2 C) @$ {5 Q2 u. P5 O8 n
) t* |& O9 b+ q# I# G# e
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 3 n( l% Z0 U1 {
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
- k( q2 s- f' A- j 若对方沉默、背叛会让我获释,所以会选择背叛。 - f8 T+ l c" ]' f7 k
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 3 d1 v8 P9 T9 v& [9 h% |& N
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
% V; I# G" l# {" M+ ] 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
( c( n9 ^0 t$ t. k6 {1 n 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。6 P. \9 P7 P# q7 N" u$ ]
[编辑本段]二、智猪博弈理论" b5 z+ n# _" W1 b5 N# b
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
3 ~$ f. P8 B- N8 S 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
; c9 _. h6 ~6 @* m; u 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
5 ]$ l! W' ]6 J- y 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
+ T2 ^7 O* K& _ n6 p “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
1 R% q& q" ]$ U: }9 j 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 " j9 ]* L" c3 ~) Q2 }
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
( U4 ~2 W$ W) Q1 g& `! H/ G # K9 ]5 C: ~! h! ~" ^( t. s
三、关于企业价格策略
0 k3 }' L$ O4 N8 b0 Q2 I) q4 y5 B) L* e! N$ M" W4 b, f
+ M: {3 p* l9 `$ S
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ! Y# c' B7 A' @* r3 I
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
$ j& A% ?; L# X5 t1 n 以下三个定义:
# }% q+ J3 E( L+ ^4 G* S) e 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ! z" U b5 Q9 v. u) T
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
# ^, D. ~8 e' R% i5 Y% P 所谓的双方优势策略则是指双方利益总和最大的策略。
3 r2 I$ I5 N# P2 r, Q3 G[编辑本段]严格优势策略举例分析
L2 U Y5 S3 l( n) u6 V: [ 一、经典的囚徒困境
+ X/ k# J5 k2 r9 n 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
2 Y" d6 {( g( X+ @: Q0 t6 \ 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
_1 w# J6 N: d7 }, ^" }' x) K1 Y 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
7 l3 f6 \$ Q) T2 n. n( O" T 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 1 E! X4 q6 _# L4 E' u; E6 W' j- n
若二人都互相检举(互相“背叛”),则二人同样判监2年。
9 o& q2 S" [9 L: V. i2 G' \ 4 r3 \# i% Y- i0 [9 p0 Z
用表格概述如下:
8 {9 q( p8 R) A$ L9 _4 G5 T; p* P0 r+ V" C( Z j8 k
甲沉默(合作) 甲认罪(背叛) 1 a" d4 Q3 f& h P+ l% [/ E7 M: ^1 J
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
6 n' V% K5 s) ~乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ! `7 L( p+ R) m ]6 [. @3 w
. m* R2 {8 J" A' \6 M# e, s1 j0 d2 {
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 + f+ r- A. F7 T3 L5 o/ C
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 3 X+ N' T8 h% Q0 C* _ ]
若对方沉默、背叛会让我获释,所以会选择背叛。 2 M* h) ^3 j- i1 G" w' B
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 $ M+ s+ e# V; d9 u$ X
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
( Y5 G' D: c# @8 b5 L$ t 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 9 Z, k- ?7 u2 [* s
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
- t+ h7 o W0 G& m3 \2 O[编辑本段]二、智猪博弈理论
) B0 B0 {. N9 p: \4 U7 }& k 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
. r6 K) M( F2 v/ h3 \9 f 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 5 z' F, L* c ?
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
2 m$ s" T$ G, U' \ 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
# @# y/ o% H" l% m/ I# C N “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 , c3 B) G8 ^+ b% s4 `
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 6 c& ~ K6 S, Z( B) x1 M. r2 n/ F
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。- c( n. [% y# x2 K; w
. H! U) q6 H% P1 d3 S三、关于企业价格策略. c! H1 |( f% J8 l( i3 _
, a2 y* v: w' k, o
/ A7 |% b! N5 X 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? n e9 B4 i0 x
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
: S) i3 V/ K4 U8 a% q1 L4 Q5 s5 l 以下三个定义: a, ?, K4 L$ w. q! h/ D, X7 Q3 t
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ) v: G! ]& z2 n# r
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 [1 T" E. e1 S0 O
所谓的双方优势策略则是指双方利益总和最大的策略。 + y! {4 F' I9 |/ [
[编辑本段]严格优势策略举例分析
; ?# m/ E# S6 d1 L/ V( X7 u 一、经典的囚徒困境 . ~) }# W: x0 O h0 W5 {
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: - t9 H f. e; q+ L
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ]$ T. Y! G* C) e
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 E4 K7 n8 s6 d$ U
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 + S v7 @/ W4 b. V4 i8 Y, E
若二人都互相检举(互相“背叛”),则二人同样判监2年。( i1 a z9 k* e) V3 g# w; I$ P
F8 J3 v: D" M" f8 F' g* T/ U: h用表格概述如下:$ e1 B, s; b7 p
6 x& x* |! F6 n( ]
甲沉默(合作) 甲认罪(背叛)
6 j6 `1 m, Y' c3 q. h1 u0 ]5 Y4 f乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 $ A3 S0 Q/ [, m
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 - H q$ c, c2 [, @/ ?9 V
" p- _" M. D; B8 ^# H8 @: a( v 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
2 r5 C$ d$ p6 B2 l$ [ ` ~0 G 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
- L* Q4 s; y7 S& V 若对方沉默、背叛会让我获释,所以会选择背叛。
0 \/ p; W0 K3 p* O" L1 r) M) ] 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
& v6 t% z0 u+ S( J" ~( @& E6 [ 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
- i+ d* Y; q- S/ G( Z 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
% g6 ^7 Q5 t! I- ~9 ~( G) l1 ^; _ 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
4 y6 x1 J) y, \- z[编辑本段]二、智猪博弈理论; Q t, E' l6 `4 ^1 _9 v
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ( j: h% _ `: U/ I' N
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
9 v% x9 j0 W! ]: j 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 - T. Y' J$ [- v: w5 d9 @, f
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
3 |: i2 ^2 k1 R5 ^ “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
& q. I) L9 T- _ F; f/ u+ S 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
8 n1 E0 Q! ~1 c" H* b% { 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。* V* @( V# i N2 R3 k8 V+ }# W
' Z: p# n6 C! v2 E3 k1 f
三、关于企业价格策略! O4 | }) v. n8 u( _" R8 u% ], f
, X# p5 J( o* Z; S+ T, Y0 [
' @0 ~) K1 b* ]) ^* m3 F 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
- P' ?% t5 D8 j7 P: @" c" |) Q 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |