老秘网_材夜思范文
标题:
人生有许多无耐
[打印本页]
作者:
lzqggg
时间:
2015-12-31 11:31
标题:
人生有许多无耐
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
5 ]- {) Z8 Q3 f( V
" k) `* \% Q, Y. E, i- k& I
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
& c% q" W) w/ m4 T0 D' Z3 l) m
以下三个定义:
6 B5 D8 e9 _" }# G, N. ?( u+ L* n
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
3 ~/ [# q5 o N0 K$ Z! O2 Z# s X% O
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
! r+ }2 S5 a9 N V' b# ^8 W
所谓的双方优势策略则是指双方利益总和最大的策略。
. k( t- Q* v$ E0 D( o0 h& C' f, ?2 Z
[编辑本段]严格优势策略举例分析
8 c) v5 v( m! x, Z, ^3 R, x: x
一、经典的囚徒困境
; e8 X' P6 `8 y4 n
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
5 G9 N# {1 F$ H7 J, @- { {- v
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
, ~1 C8 N3 S: G, H9 q$ ?
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
5 n7 Y$ \0 ]& u, k' p- n8 C
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
4 f0 `, L3 M6 ?
若二人都互相检举(互相“背叛”),则二人同样判监2年。
% \5 K2 ?+ o- O5 o) |
. z+ B( S$ ]+ F4 W' o H/ T! i! f! O
用表格概述如下:
& s2 I0 w9 c+ S- q7 ~) I
& F6 E" Y3 h: s/ M$ g. k1 K
甲沉默(合作) 甲认罪(背叛)
$ K2 D9 v- B0 k- ?
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
$ R; J9 q) N" T b& v1 o
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
* ^5 ]) C! I. z9 ~! t+ k8 S
- D0 }7 T$ s* q2 m
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
) T7 J3 r4 @! e' g
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
" q4 c3 ]) h5 O; z! ~ J: U6 z( g
若对方沉默、背叛会让我获释,所以会选择背叛。
2 l* D( [! ?; c. j" r ?( F; Q8 W# D
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
9 d* u: ~) C# }! N& @( z
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
2 w( s# W& [$ R
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
2 D @& c. q' H0 A0 U: L
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
, t7 T3 i! _/ V- ?. {" q
[编辑本段]二、智猪博弈理论
' {! c: ]; \$ ]
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
& i1 |! ^3 [6 W" s- v x$ j6 P$ ~! e
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
/ P1 E, s9 q. {- h# Q F9 z
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
" M& c# T+ j0 }7 V& |
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
, M% s5 P7 C( w+ m: V
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
2 J. J1 Y5 k" J/ s
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
3 E, ~5 E# c2 q# `* Y9 |/ J
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
% M- K. b3 y# E" r! N
) {* [( T$ o8 \# s
三、关于企业价格策略
! y8 N5 t2 L k5 M
: T1 Q% ^7 k; p/ m$ L4 e4 W5 f9 ?; f# \
* n- p" O1 L1 T- j, M/ W4 X
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
. h# B$ E' W$ d% ?
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
5 c- O7 m* Q# S. O. e1 r* d
以下三个定义:
& n6 P0 s( y6 l% e8 n; h) r
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
# |' Z1 v# o- j' j4 b
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
L1 P9 E; d! _3 O" ^
所谓的双方优势策略则是指双方利益总和最大的策略。
* S0 }1 q1 o2 t2 e! [
[编辑本段]严格优势策略举例分析
- t/ g- K( s7 u# ^" l* U& g% z' u7 R4 |6 X
一、经典的囚徒困境
( r% k, A/ ?4 G3 O; L& `
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
. y+ M; J) {0 p/ C F# m3 X# H8 V
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
* B! V1 C/ v! l4 w* H# c" p( S
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
' R! V& B- @0 V4 a
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
( ~- b# U/ i/ F6 G- K$ o1 I/ D4 A
若二人都互相检举(互相“背叛”),则二人同样判监2年。
6 ]% \4 Q! P6 h6 o
, }+ U$ `7 _+ j
用表格概述如下:
& s+ z3 k2 I! M; ?
& Q F+ ` Z& v4 z. p6 W
甲沉默(合作) 甲认罪(背叛)
0 J9 Q% i# l, Z$ ~ B7 m% ~6 j
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
' ?& w! b- o& n$ p1 B, W2 p$ R
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
0 w0 b+ i1 m! f4 o
3 d7 D/ f6 h6 o+ q7 `( i# y
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
0 |# ^9 e0 \- ?) }- ~/ v/ Q& X- G
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
' o) e, w$ J2 Y' P0 N5 h* I
若对方沉默、背叛会让我获释,所以会选择背叛。
+ g# K$ ~) s G9 {; T
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
, t8 M8 ?: t. c* ?2 ^9 U
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
4 v' z* g3 u7 u( Y1 g" ~1 _2 B
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
5 Y6 @8 k* O% g- i
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
5 Y* o) i: Y. u3 e% v
[编辑本段]二、智猪博弈理论
% {" \3 B) m$ {5 G* B
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
( m% A- F. [0 C
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
4 d# G& `7 M6 u. d3 m9 B- n: \
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
9 Z9 E" x/ N C
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
r7 I1 a- U5 V* {$ E
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
% G- z# k" T; c6 k4 s5 o
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
; c9 D& ]' ?7 e4 a2 B- k
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
+ d: ? d( Z0 p5 k; J- |
/ H9 u3 |& z5 H) w7 f$ C% [
三、关于企业价格策略
) C @' Z' R" F
2 A5 o5 [. W& V
0 D9 h+ w+ V& H( T7 t2 ^
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
+ V% A7 u* s3 \: L
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
3 r( c3 o1 W! d, ^9 U
以下三个定义:
8 c5 L1 D% R4 x' d
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
7 d/ W% l/ H r) W# m1 e
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
7 y3 r) i) s8 x) y% S
所谓的双方优势策略则是指双方利益总和最大的策略。
/ |% M$ V8 B# T3 {4 O
[编辑本段]严格优势策略举例分析
0 w: z5 s" ]* z
一、经典的囚徒困境
" l1 z- X' ^' n7 v
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
( I. h' W8 s4 i% h1 I0 A
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
( O" H' D1 h' }3 ?
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
; D2 x! e& E+ u, p* a! L6 @5 R7 m# P
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
4 G# S: s1 W8 @1 p& ~' Q# O
若二人都互相检举(互相“背叛”),则二人同样判监2年。
. O5 r/ m' O3 X0 q5 W; W
. i e5 z& x$ Y
用表格概述如下:
+ J: b( H0 F4 m' G' b: f3 k
3 p2 I6 @/ o4 z; M. P
甲沉默(合作) 甲认罪(背叛)
- w2 N9 l1 B6 f' u/ x/ H* m# Z7 e
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
$ Y1 j5 a& H- W- D+ O( w( ?, B. O
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
0 M* l h+ T+ D/ {
0 q% F% w8 h% |) }" b
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
% P) E$ o: b6 ~6 X( v0 N) U
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
' o& x1 A! o9 C. L5 ?) H' A6 F
若对方沉默、背叛会让我获释,所以会选择背叛。
5 v Z* D( X9 z1 I
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
1 a0 A3 M4 f1 V; E5 \
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
* x7 i: R9 A; ?. X
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
5 ]& P6 }, |( o! z9 x0 E$ Z
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
$ m6 C- g2 }9 X# l" z
[编辑本段]二、智猪博弈理论
$ M9 G, E/ n7 s' ^* x
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
; f$ @: t2 Z1 u# u6 h
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
% w- ?" G" J9 S X. a a3 E0 j% R
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
' w$ e9 K# m" w- V
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
3 {* x8 l9 T) Z) U
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
e% v; H& ?$ _, y4 D
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
; S$ ~! K: V+ S" J) T# @9 |* t
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
2 _7 H9 }6 E. ]- _; u/ P4 |
- ?# w- \$ p. ?, U ?) Y# N1 g9 r+ M: N
三、关于企业价格策略
( V# M8 [: ^) s+ M& O
* O J# Y0 y+ e% ?% E/ V
( @" H# c" b4 _/ D. ?* h* W
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
. l* M# a' K( z1 S M
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
0 m1 H& d7 n8 m
以下三个定义:
- Y& X. V6 i$ t8 E3 H
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
+ E% J; S' U+ o$ v1 \' `
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
9 E. s% N8 `- u# ?2 b, O* g
所谓的双方优势策略则是指双方利益总和最大的策略。
/ { j7 e* r- S9 V: i. n( Z, s/ p
[编辑本段]严格优势策略举例分析
+ m! X, _* u; F% J, f5 o
一、经典的囚徒困境
6 ?2 }/ [) c5 `$ r9 o$ E- n
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
; H! ?2 m1 K; n$ n V
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
- ^7 b+ r: c4 j% | c( s( Q h
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
# {7 @* e) j5 s$ S
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
9 G7 T6 S4 e/ l
若二人都互相检举(互相“背叛”),则二人同样判监2年。
' d* l ?& A/ Y/ @1 w# Q* h. E2 t
) Y; {& r0 q- ` a* Y) p3 ~& \
用表格概述如下:
9 C$ w4 k4 B: j, r
( c1 Z" J- L- M7 E
甲沉默(合作) 甲认罪(背叛)
8 q, ^5 _2 \; V' y* d. y j: |
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
/ q' M, [- d- ?5 a' r8 r7 v- J
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
3 J8 H& _2 ?( E; `
2 w9 D" o" b( Q9 Z g
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
7 M5 C" `; R9 h5 V' W
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
0 S% [* t( d& {$ n) C' \/ J4 V5 D
若对方沉默、背叛会让我获释,所以会选择背叛。
5 U% @, B* S. }& Z
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
( ?% ?5 d; C, _! U4 [* E
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
& r8 d1 o) U9 H' o! @
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
% z$ r7 A3 e6 M3 ~
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
1 l; i6 x- f& Z4 z- G- b ^
[编辑本段]二、智猪博弈理论
6 h1 z% J6 B( z* V7 n
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
' K. C8 ?6 D0 s5 p8 M4 Z+ x
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
3 _2 v: c. D# _; {: r
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
, G; x" S3 H1 ~5 M, ?0 X2 S
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
7 ~$ x6 Q1 N$ p E- g! R6 {6 i/ v
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
3 g ^* j4 c; K5 P( D4 o! n9 k
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
. r' F/ y3 r( R+ ?& y7 }
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
5 Y3 Y6 y* ~, @1 K
) t$ E$ v. U! X9 R" L4 m
三、关于企业价格策略
1 u. j# r( m, ~7 U }% ~
5 x! l& r/ m- U0 I# }" K& i
5 k# z; Y: I; h
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
! p: W; A4 o! E) w5 l$ C' A$ K
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
欢迎光临 老秘网_材夜思范文 (http://caiyes.cn/)
Powered by Discuz! X3.4