本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
4 i& {( h0 t9 s% u( K/ f+ x+ ?1 Y5 T( h# Q$ _
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);& C$ c4 C' C" ]& I) }
以下三个定义:
2 l6 M0 K A5 d, P6 Q* u5 [ 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 " ^6 b( H: z" G. l) ~3 D7 U; w
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
. m7 R7 ~0 ]. n' @, l6 k2 v 所谓的双方优势策略则是指双方利益总和最大的策略。
7 |+ D9 k4 U; i4 \5 I# H[编辑本段]严格优势策略举例分析& t7 w! h& C# b4 v1 }( P5 j
一、经典的囚徒困境 3 W" l1 r, [+ z7 K: f) G- V* k
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: : J% g+ r- J! W( \. h8 i) |
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
$ x& p2 }6 Q& }2 k! ]# P. t% |. P 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
7 h/ y! v- ^) ?9 o5 j; @: D4 u. N 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
1 n; T5 s: B- C/ `7 m- Q0 B 若二人都互相检举(互相“背叛”),则二人同样判监2年。8 \: c. P; A) _2 U- `4 E7 c: `
9 R. D- d" M; d+ S
用表格概述如下:4 f7 {" y) R7 R {- T
1 ?; f* s& Y" o; L3 o9 s7 P 甲沉默(合作) 甲认罪(背叛)
' s9 S* D5 j, B3 b9 C' X乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 * `5 h% t2 V' v4 y, m
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 N2 ? F: t$ ?; X0 {0 {0 A9 P
8 A9 L9 W' b9 O 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 7 z7 W0 \. k; X1 U' b% z( M
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: }0 ~ \' T8 W- {' u$ a. D) F
若对方沉默、背叛会让我获释,所以会选择背叛。 . h: f; W0 i8 D! t# W' \# q! U
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
/ E2 `4 v1 M: i- d& z8 [ 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
8 I9 [$ j4 i& h7 h/ g 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
8 E! _+ H3 i, I 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。 G$ t& i* q6 `1 Z9 O0 C& n
[编辑本段]二、智猪博弈理论. r7 N, E* n' J
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
% s. \" J w$ ]' l 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 # O, D/ _- v! c2 \* M
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
( a$ B2 B# n% j. }3 a8 y* L- U 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 # ]( d0 n1 u3 |' N2 x
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
0 `; K3 G% z m3 d; d- Q+ Q 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
' i: m% r3 @$ s5 k) |( _ 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。; r- @/ S1 g6 ]1 G0 c/ X8 T
( j1 b' v( q+ I* K
三、关于企业价格策略, X& A3 S W% q/ A9 g
8 [: m, X, g/ A
: @! l' L9 f5 K3 ?: m" o
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
* Q8 L) Q, N5 N 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);0 G; j! g) |# l
以下三个定义:* P- k. s7 e. n$ F7 j" y
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 C0 p e/ E6 D' _% R/ ^
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 1 H+ u1 W4 Q |' c
所谓的双方优势策略则是指双方利益总和最大的策略。 9 e8 R, X g' k0 V: Q4 c7 J+ y
[编辑本段]严格优势策略举例分析 v0 Y) B( |% F+ x0 D8 X8 H
一、经典的囚徒困境
. d) _2 Z5 e0 B. b; n# N 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 2 U& v# G5 J' K) U6 P
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
/ Q# a# E0 ^6 {! ^4 u 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
; i) O+ m7 K3 P! R1 f+ \ 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
% g* z( M* w' h8 B 若二人都互相检举(互相“背叛”),则二人同样判监2年。
& d; n& C7 E! r! j& G+ n
$ b# M- u6 `& Y% a2 G, @( ~用表格概述如下:
3 ?( |) ]# I5 h
7 l( {, [- m3 K 甲沉默(合作) 甲认罪(背叛) " F- h# q( x) A0 R
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
4 P2 i" }( b; ?7 k( _乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
5 e# j0 }! N. R6 K
3 y# g, J6 K% w0 X 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ! x7 w4 d B" I8 s; Q% f
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 6 v! T w# K# z8 c
若对方沉默、背叛会让我获释,所以会选择背叛。 ; e( k& |8 ]+ _; u- h
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
* m2 r' y+ I: @6 ^$ |3 |5 u 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
% y$ z* F4 g) A( Z$ r9 X 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
# a( K0 D2 A4 A6 ?4 L- U, P 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
+ c; a* k" _# @% e3 n! C# e[编辑本段]二、智猪博弈理论2 _" Q6 \ H: j- Z2 H$ I; D
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
/ e" E+ k6 q% X% } 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 . g8 G' a3 S8 d/ f% j) `
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 " m+ d2 w+ S7 U5 L4 i6 i
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
7 |0 J4 f( R9 `/ f/ R: v “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 2 V1 w- }; B+ j! v, o( ^$ b3 \- O% N( g
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
4 i) q! [4 s( x7 n; p0 J$ \% x 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。0 l' C1 h9 `: k) Z
7 c( c5 ]( ] Q% b三、关于企业价格策略
" e3 x: f8 C9 _# Y' _) v
: g7 k/ ?7 i1 @5 g9 A
1 ~- d: d% ~. S% w/ s$ Z 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
* U% Y) O7 j9 s9 p$ `9 V 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
4 k9 J2 z9 E4 U+ C7 G( b 以下三个定义:
6 Z: l0 y4 V3 t# v 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
$ c" K, M3 T( O7 J+ N 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 & L4 x9 I. b) P( s; Y+ m% X
所谓的双方优势策略则是指双方利益总和最大的策略。
9 G" P8 p# g; H* g' H3 f9 w7 T[编辑本段]严格优势策略举例分析
1 b5 g2 }; O7 a9 ^0 f' r$ L$ z/ S 一、经典的囚徒困境
# V! c5 ^9 v( x9 K 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
, ]! e7 s {' c, U8 q1 A' X8 m 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
7 |; W# p+ Z/ p& a' V 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
" Q; n) Z l2 R+ L8 Z3 C1 _) [ 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
6 M+ b1 U K! A 若二人都互相检举(互相“背叛”),则二人同样判监2年。0 a* e+ T& [5 p, ^
% Z, A7 V+ Q/ Y4 Y1 f用表格概述如下:
5 p: F3 S9 Z$ J8 w, _! K) W# k L, r0 j, j) J3 D* s$ g" l+ v! i$ i* j
甲沉默(合作) 甲认罪(背叛)
0 f# F! Q% {! O3 \% s. i4 n乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
/ ], G! j& M8 }乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
; ~5 D" j0 O$ i7 ~+ Y* p
) Z. f' q0 A3 b) }9 w. }. U# R 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
1 D" `3 `5 `( }5 Q 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ' U* Z) c' C: Z6 i _/ j) d
若对方沉默、背叛会让我获释,所以会选择背叛。 $ K5 H) A/ p7 i* p
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 2 Q5 `, i7 Q. x$ I
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 & \) _7 Y3 [: @ g
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 F6 V0 D* B1 x5 X- z/ P# @. a
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。9 Y& _; o' Q5 w, i
[编辑本段]二、智猪博弈理论: V: \5 `' z2 P9 Z& g
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
: S! n! K) J8 g; K O4 }) w 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 6 f8 o0 K* v G5 ?" ]
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 : Z/ P( S3 [3 M7 G4 |& m' K
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 % j" x! Z/ o# F: j _7 y4 R
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
! ?+ k5 T9 J; ?% m3 w9 L1 l# h4 c s 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
/ O' i$ v1 [% W0 p* C# i 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。2 {8 b t% ]* |) ~- {/ N0 _8 D
5 J2 T1 x U5 e; K3 m0 H
三、关于企业价格策略
4 [0 }6 f) O6 m$ q: }
- T, N6 B- o H9 b! J/ Z$ v 2 ]; G$ J9 z, C; | J; [, V9 v
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? . t: W1 Z1 l# e0 R$ c. o
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
y% y e( `$ U 以下三个定义:) f( {. D0 g, k8 W$ G- ^
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 : u( l. X: m( {
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
: K& ]. s' @* A. }+ N4 b 所谓的双方优势策略则是指双方利益总和最大的策略。
) J6 p+ V1 C% I$ o7 ?7 a[编辑本段]严格优势策略举例分析
+ O- b+ g8 z0 I5 j: }6 L 一、经典的囚徒困境 . @2 W# g6 D$ l5 y2 B( J' f) g
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
$ W5 Z* f, P# A( X( _6 W 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: : t4 f# Q8 o$ Y9 J ^
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 $ O& q& i- ^. S" j; G3 S3 f
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 " {- m% a$ u, _- k8 }
若二人都互相检举(互相“背叛”),则二人同样判监2年。 p, Y6 V! G; r1 V0 p
: ~5 i7 N: ` i' \3 r
用表格概述如下:
4 r" \' I) q: k" ~! b0 K" @
: Q0 u% x0 V7 h8 D+ ^# B/ S 甲沉默(合作) 甲认罪(背叛) ! v* @8 s; {7 J" p7 b
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 O4 r. C- ~0 v0 p4 r) v- t
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
2 H& R' S& V6 c( X" x+ q
) T4 J. Z# ?9 `: e9 D+ ]% { 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ! O5 i# F( v" `& P1 o7 A
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
9 g) x- q: X! F& U2 e# H; ^. I: R 若对方沉默、背叛会让我获释,所以会选择背叛。
0 L) J1 ?0 [; p* n* v1 u; ? 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 * z# g I9 }9 y: D
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 + l, m7 V- U# C% t M% z
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
* W& S% D: g z& [. R) J 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
0 \& f G8 j" N6 A[编辑本段]二、智猪博弈理论
. k' d; c1 V1 [( K) n3 e 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
/ X- C. d2 _0 J/ J7 p# ? 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
1 x+ b; |& o |# m7 @ 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
9 ]: b* J# t) m( E1 o8 b9 M- r/ n 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 - m1 B9 o/ f# N- T
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 G6 j, k" k* `- \3 u% X' c
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
2 C( ]: ^! Z+ L2 A! N, F 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。 |" J8 {* c5 @/ W B( \
, z' ?* _) f6 P9 o三、关于企业价格策略) [2 |2 u3 A) o+ d6 t1 C1 l# X- K
; q* N9 k4 _2 k. k5 M. M- O) Y2 x ' J4 ]7 t9 [. u( m v. H( C7 D o
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? / p: A- [- A& c9 q
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |