本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 * D3 B+ X5 a/ v& E% b1 N# w
# ?/ j$ z0 {( Q* C) {
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);! C- l; A& u% w5 U" H% B8 ]
以下三个定义:, R$ u+ ?( y/ E$ v& s# G& o
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 / j! t) `4 B7 }' S& z! Z
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
8 P2 j# e# R$ b 所谓的双方优势策略则是指双方利益总和最大的策略。
6 m1 E i0 Y$ e1 t) y[编辑本段]严格优势策略举例分析
7 _+ J3 U$ W- ` 一、经典的囚徒困境
2 t' J8 J. n9 e% @4 Y& c$ u 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: , l& |1 y& ~& D
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
1 m1 N5 U9 k. H$ B N5 S6 c* P# k 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
( T, ?9 z8 w9 M 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ! {0 S, X0 t4 H C( S, A) |+ L
若二人都互相检举(互相“背叛”),则二人同样判监2年。% r: G, W2 t- f; c: b8 c6 j
. @4 S( C3 }, X! a用表格概述如下:
' ?; f& Y. w1 I4 Q: _6 b! ^6 F+ e% u+ p. L9 x! Z- u
甲沉默(合作) 甲认罪(背叛)
+ c* B3 a/ `1 L; ~乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
* A& q, r8 q( t0 ~* r8 |& L乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
: h8 S O* T/ g+ r% N O! d! h. f }2 p' l( ?
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
* [3 Y& U" h" m6 \) w 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: # o: [& S+ T3 ~! |
若对方沉默、背叛会让我获释,所以会选择背叛。
; L) z7 ]4 }$ [: w 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
6 k. r6 b4 t* |# F3 @( T0 A/ A 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
9 M5 u0 l. A" t* j 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 k, ?6 r4 S2 i+ U- p" Z# t; o# ~
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
7 Z. {0 b8 `9 q0 o[编辑本段]二、智猪博弈理论, z6 ?$ E* }1 C4 L+ K
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
% @- N; }* O G; }& ^# c 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ' V- \: j. T! p0 k; {& y" |8 @, }
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
/ ]% R N/ \# }4 a8 B 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 # |, t3 m6 W( D
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 " E, Z9 }# c. \* Y" B
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 - {2 O+ Z, T. T* t& \3 Z7 s/ n! E
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。' Y2 r% |7 L- H2 ^' k( `
4 e( W# O. v6 @: {: g# Q( _三、关于企业价格策略7 W1 k9 ?4 J$ V& o0 i( }5 o
/ v* ~; m( _# G8 D
. s6 W6 n/ H) w6 s. @ 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? / Q& |, b& Z. {& q
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);+ s# B1 ^) s! ^- K, q# W
以下三个定义:
3 t! J' O! S% G6 L* y 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 0 _4 f. ^( A. d5 f h. P* W4 G
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 8 C2 [4 c( C5 i( n5 P
所谓的双方优势策略则是指双方利益总和最大的策略。 5 P0 f/ H1 f/ ]* e
[编辑本段]严格优势策略举例分析
- F3 f0 e9 e1 ]4 ]) K 一、经典的囚徒困境
5 K8 M/ l" b2 R. e( \ 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ' ~8 H& ?* d$ O# |# y5 |% O/ y
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
" Z5 k6 Q; U4 a, u8 _9 v 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 7 m- _) T9 {' G- T# Y
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 2 \; a n* j1 \7 E
若二人都互相检举(互相“背叛”),则二人同样判监2年。3 k+ _ V2 J U: e! d
$ ^7 J* S& p3 t3 @
用表格概述如下:1 f) ^$ I: e" Z. }" C r
* @% l8 H ^/ u: j) Q+ T% d) C
甲沉默(合作) 甲认罪(背叛) 7 e' @0 P6 `0 E8 V; M4 d0 J/ u
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 # S# _) A$ c- ~' \* Y
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 7 M8 I3 e& x- k; p( l9 E8 q
9 t: _) V7 H9 v) ~2 H 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
2 P& q' w; h( {2 @ 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 8 f. p- X; j8 T5 X/ @
若对方沉默、背叛会让我获释,所以会选择背叛。 5 E4 E2 X' `, E3 b; b$ B; X. H& S1 ~0 D
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
8 `0 [4 A7 N& u$ O" D) z 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
5 [3 T0 x; V% R+ z7 d7 `% Y 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 1 A/ q0 {; u& f+ U
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。9 e2 c) Z" J# y. t5 m9 h. x1 v. G
[编辑本段]二、智猪博弈理论
w* b1 Y! ?& H, ]3 T+ G' o; b 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 7 g9 t5 G# k3 Q4 H
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 2 M7 t5 j2 }$ T- H9 c# g
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
9 [+ d& G( k; I+ e8 V! }5 c 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
0 b& Q8 t2 B5 Y “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
) f; L5 R. \: R 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
1 [& H* y, X' {# y9 Q* p 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。/ H6 A5 X# l: \; n
. C5 T- k' V! b5 z: Q三、关于企业价格策略) l/ g- C G) N6 o( P" Z
, {) F! ?( B3 u* `$ S( P d: Y' p0 m" h
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ) }. m; N1 p# u1 V# K9 N
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
% o- f& [: R/ ?4 P8 a! s) i 以下三个定义:
9 l& ?* S/ p0 a! Z" o) J' l! L 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
/ \% z1 j+ l8 `/ X$ [5 A 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 . W4 y H4 {1 Z! F
所谓的双方优势策略则是指双方利益总和最大的策略。
3 \* ?% |# y; u[编辑本段]严格优势策略举例分析
# { R- {2 \* x, @0 Z 一、经典的囚徒困境 $ {! U [, |% y2 \9 u
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: % q+ J$ o7 c. ^1 [ O) O
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ( G: R" W" R3 H$ P2 M5 p7 F
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 * `0 g+ E+ Q! ^9 j2 D, |" F' v
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
2 k" g+ P \$ W$ N6 j# y 若二人都互相检举(互相“背叛”),则二人同样判监2年。/ K# ~) h7 i1 \# N+ w
' x% W7 R$ i4 f' Z+ ]) i6 J' y l
用表格概述如下:1 }+ x8 m# m% q9 V3 k9 I/ d6 i
- n; o, {- M1 n
甲沉默(合作) 甲认罪(背叛) + b6 e3 p# C4 i0 H! S" ]
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
* j x$ k5 i3 |% u/ N9 c$ F1 |乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 2 b+ z6 A. o' D! f
* t" `# i; u5 F! S6 u( A
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 3 P) ?) i! x: Q$ r$ v
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: : y# O3 k( Z" d1 }
若对方沉默、背叛会让我获释,所以会选择背叛。 3 J/ H/ Y4 M. Z; {
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 # P% f8 q7 D. Q p0 J
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 . M a% y2 A- D! I8 p7 A& d8 B, Y% i
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
. Q; e4 F: R$ Z/ }8 {% r 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
6 l: ^( q) d3 x3 k4 g7 q[编辑本段]二、智猪博弈理论" S& A8 q/ O. w8 T& r
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ! y4 h! i7 F8 d5 s0 h3 \; {
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ; ^' P0 S, r1 L# m$ R
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 - H# r7 T7 O! Q+ C! R! X2 B
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
0 S4 u1 n1 L$ b. J “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
3 g6 H. P2 @ |- F9 {, k6 w 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 4 y% o0 ~/ e% l8 G: {1 Q
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。) s9 y% p" z+ Y' M( v
* N0 w+ n j( c, J2 C* O三、关于企业价格策略; s; H) L# Z6 h1 g% A5 ]
0 N, H0 s' [2 I1 q6 c+ k% Z3 p
3 J g/ V2 ]2 r0 Q4 X% M9 B- g
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? q5 X- M9 \. `+ }* z. q9 _
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
2 m! T1 v; B' @* c1 X 以下三个定义:; z; `6 i6 ]- P4 h0 j2 `; Y
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
6 a! ]' D/ K) G$ {4 N4 i 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
, p+ \/ ]: I: q; g) h l# T; Z 所谓的双方优势策略则是指双方利益总和最大的策略。 ! D- O* m8 g- F" m, \8 E
[编辑本段]严格优势策略举例分析# l, F! [8 e9 Q+ p. ~. K# n) \0 s
一、经典的囚徒困境 6 y$ Z) Y7 j/ ^* Q% U. n
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
, \; }/ ?1 r8 C6 { 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
) q+ h+ j4 }* ], Q% N 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
3 ^: Z8 F1 f/ f. a5 ` 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
1 B; U. c4 _' b7 g/ k 若二人都互相检举(互相“背叛”),则二人同样判监2年。3 {) [! R* [9 b' A
/ a( W2 Z) t- O: M4 `
用表格概述如下:
a4 r$ l6 `& o' }7 ]$ {: H5 }5 W% f5 j
甲沉默(合作) 甲认罪(背叛)
$ J6 ~, n) D) ?2 |2 P乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
H3 [$ T4 P3 d4 L6 a6 D! y6 N乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 9 H D- G5 i5 @6 q
6 |2 B1 h, R1 I7 ~ ^
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 5 f9 Z5 M$ N8 V' d G+ F
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
[5 ^5 S3 ?% G3 f2 F7 b( F 若对方沉默、背叛会让我获释,所以会选择背叛。
, }- y* H% n' z5 v 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
5 i4 U, f! P: t, q 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
* V6 _2 u* j( z+ u: L! o$ B7 Z2 U 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 4 u- r6 R* z$ H' t7 r% H; Y
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。6 T( O8 ^ `& k! h- Z- E
[编辑本段]二、智猪博弈理论
8 P/ A8 {; P3 T9 x6 m: O, G Q 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
- w: B# F+ l" o( K; s% N2 d 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ( g# f8 M- S+ [2 k
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 & Z8 g9 M n- f2 l$ h) K8 |
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ' E, S+ n! b! Q$ I& J
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
( w7 o7 _4 T) P# Z 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 # Y% y4 R" T2 W) M3 j/ L' q2 ~& K
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
) x& n& T/ O6 ^4 | # A) v f; W4 ~+ E$ T5 o
三、关于企业价格策略* _7 ?# N* c8 A( J# d9 }
8 ^- l( C0 T4 S
8 }0 R- @" T8 l7 ]9 a- i 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
% x' ^1 k) U) `5 ~0 I. c- c( n1 | 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |