老秘网_材夜思范文

标题: 人生有许多无耐 [打印本页]

作者: lzqggg    时间: 2015-12-31 11:31
标题: 人生有许多无耐
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 5 ]- {) Z8 Q3 f( V
" k) `* \% Q, Y. E, i- k& I
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);& c% q" W) w/ m4 T0 D' Z3 l) m
  以下三个定义:
6 B5 D8 e9 _" }# G, N. ?( u+ L* n  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
3 ~/ [# q5 o  N0 K$ Z! O2 Z# s  X% O  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ! r+ }2 S5 a9 N  V' b# ^8 W
  所谓的双方优势策略则是指双方利益总和最大的策略。  . k( t- Q* v$ E0 D( o0 h& C' f, ?2 Z
[编辑本段]严格优势策略举例分析
8 c) v5 v( m! x, Z, ^3 R, x: x  一、经典的囚徒困境 ; e8 X' P6 `8 y4 n
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
5 G9 N# {1 F$ H7 J, @- {  {- v  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
, ~1 C8 N3 S: G, H9 q$ ?  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
5 n7 Y$ \0 ]& u, k' p- n8 C  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
4 f0 `, L3 M6 ?  若二人都互相检举(互相“背叛”),则二人同样判监2年。% \5 K2 ?+ o- O5 o) |
  
. z+ B( S$ ]+ F4 W' o  H/ T! i! f! O用表格概述如下:
& s2 I0 w9 c+ S- q7 ~) I
& F6 E" Y3 h: s/ M$ g. k1 K    甲沉默(合作)  甲认罪(背叛)  $ K2 D9 v- B0 k- ?
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  $ R; J9 q) N" T  b& v1 o
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  * ^5 ]) C! I. z9 ~! t+ k8 S

- D0 }7 T$ s* q2 m  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
) T7 J3 r4 @! e' g  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
" q4 c3 ]) h5 O; z! ~  J: U6 z( g  若对方沉默、背叛会让我获释,所以会选择背叛。
2 l* D( [! ?; c. j" r  ?( F; Q8 W# D  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 9 d* u: ~) C# }! N& @( z
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 2 w( s# W& [$ R
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 2 D  @& c. q' H0 A0 U: L
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。, t7 T3 i! _/ V- ?. {" q
[编辑本段]二、智猪博弈理论
' {! c: ]; \$ ]  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
& i1 |! ^3 [6 W" s- v  x$ j6 P$ ~! e  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
/ P1 E, s9 q. {- h# Q  F9 z  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
" M& c# T+ j0 }7 V& |  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
, M% s5 P7 C( w+ m: V  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
2 J. J1 Y5 k" J/ s  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
3 E, ~5 E# c2 q# `* Y9 |/ J  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
% M- K. b3 y# E" r! N  
) {* [( T$ o8 \# s三、关于企业价格策略
! y8 N5 t2 L  k5 M: T1 Q% ^7 k; p/ m$ L4 e4 W5 f9 ?; f# \
  
* n- p" O1 L1 T- j, M/ W4 X  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
. h# B$ E' W$ d% ?  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);5 c- O7 m* Q# S. O. e1 r* d
  以下三个定义:
& n6 P0 s( y6 l% e8 n; h) r  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
# |' Z1 v# o- j' j4 b  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。   L1 P9 E; d! _3 O" ^
  所谓的双方优势策略则是指双方利益总和最大的策略。  
* S0 }1 q1 o2 t2 e! [[编辑本段]严格优势策略举例分析
- t/ g- K( s7 u# ^" l* U& g% z' u7 R4 |6 X  一、经典的囚徒困境
( r% k, A/ ?4 G3 O; L& `  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
. y+ M; J) {0 p/ C  F# m3 X# H8 V  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: * B! V1 C/ v! l4 w* H# c" p( S
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ' R! V& B- @0 V4 a
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ( ~- b# U/ i/ F6 G- K$ o1 I/ D4 A
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
6 ]% \4 Q! P6 h6 o  
, }+ U$ `7 _+ j用表格概述如下:
& s+ z3 k2 I! M; ?& Q  F+ `  Z& v4 z. p6 W
    甲沉默(合作)  甲认罪(背叛)  0 J9 Q% i# l, Z$ ~  B7 m% ~6 j
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ' ?& w! b- o& n$ p1 B, W2 p$ R
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
0 w0 b+ i1 m! f4 o
3 d7 D/ f6 h6 o+ q7 `( i# y  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 0 |# ^9 e0 \- ?) }- ~/ v/ Q& X- G
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ' o) e, w$ J2 Y' P0 N5 h* I
  若对方沉默、背叛会让我获释,所以会选择背叛。
+ g# K$ ~) s  G9 {; T  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 , t8 M8 ?: t. c* ?2 ^9 U
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
4 v' z* g3 u7 u( Y1 g" ~1 _2 B  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
5 Y6 @8 k* O% g- i  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
5 Y* o) i: Y. u3 e% v[编辑本段]二、智猪博弈理论% {" \3 B) m$ {5 G* B
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ( m% A- F. [0 C
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 4 d# G& `7 M6 u. d3 m9 B- n: \
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 9 Z9 E" x/ N  C
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
  r7 I1 a- U5 V* {$ E  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 % G- z# k" T; c6 k4 s5 o
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
; c9 D& ]' ?7 e4 a2 B- k  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
+ d: ?  d( Z0 p5 k; J- |  
/ H9 u3 |& z5 H) w7 f$ C% [三、关于企业价格策略) C  @' Z' R" F
2 A5 o5 [. W& V
  
0 D9 h+ w+ V& H( T7 t2 ^  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? + V% A7 u* s3 \: L
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
3 r( c3 o1 W! d, ^9 U  以下三个定义:
8 c5 L1 D% R4 x' d  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
7 d/ W% l/ H  r) W# m1 e  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 7 y3 r) i) s8 x) y% S
  所谓的双方优势策略则是指双方利益总和最大的策略。  
/ |% M$ V8 B# T3 {4 O[编辑本段]严格优势策略举例分析
0 w: z5 s" ]* z  一、经典的囚徒困境 " l1 z- X' ^' n7 v
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ( I. h' W8 s4 i% h1 I0 A
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
( O" H' D1 h' }3 ?  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
; D2 x! e& E+ u, p* a! L6 @5 R7 m# P  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 4 G# S: s1 W8 @1 p& ~' Q# O
  若二人都互相检举(互相“背叛”),则二人同样判监2年。. O5 r/ m' O3 X0 q5 W; W
  . i  e5 z& x$ Y
用表格概述如下:
+ J: b( H0 F4 m' G' b: f3 k
3 p2 I6 @/ o4 z; M. P    甲沉默(合作)  甲认罪(背叛)  - w2 N9 l1 B6 f' u/ x/ H* m# Z7 e
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  $ Y1 j5 a& H- W- D+ O( w( ?, B. O
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
0 M* l  h+ T+ D/ {
0 q% F% w8 h% |) }" b  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 % P) E$ o: b6 ~6 X( v0 N) U
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
' o& x1 A! o9 C. L5 ?) H' A6 F  若对方沉默、背叛会让我获释,所以会选择背叛。
5 v  Z* D( X9 z1 I  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 1 a0 A3 M4 f1 V; E5 \
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
* x7 i: R9 A; ?. X  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
5 ]& P6 }, |( o! z9 x0 E$ Z  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
$ m6 C- g2 }9 X# l" z[编辑本段]二、智猪博弈理论
$ M9 G, E/ n7 s' ^* x  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ; f$ @: t2 Z1 u# u6 h
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 % w- ?" G" J9 S  X. a  a3 E0 j% R
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ' w$ e9 K# m" w- V
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
3 {* x8 l9 T) Z) U  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。   e% v; H& ?$ _, y4 D
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ; S$ ~! K: V+ S" J) T# @9 |* t
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。2 _7 H9 }6 E. ]- _; u/ P4 |
  - ?# w- \$ p. ?, U  ?) Y# N1 g9 r+ M: N
三、关于企业价格策略
( V# M8 [: ^) s+ M& O* O  J# Y0 y+ e% ?% E/ V
  
( @" H# c" b4 _/ D. ?* h* W  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
. l* M# a' K( z1 S  M  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
0 m1 H& d7 n8 m  以下三个定义:
- Y& X. V6 i$ t8 E3 H  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 + E% J; S' U+ o$ v1 \' `
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 9 E. s% N8 `- u# ?2 b, O* g
  所谓的双方优势策略则是指双方利益总和最大的策略。  
/ {  j7 e* r- S9 V: i. n( Z, s/ p[编辑本段]严格优势策略举例分析+ m! X, _* u; F% J, f5 o
  一、经典的囚徒困境 6 ?2 }/ [) c5 `$ r9 o$ E- n
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
; H! ?2 m1 K; n$ n  V  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: - ^7 b+ r: c4 j% |  c( s( Q  h
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
# {7 @* e) j5 s$ S  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
9 G7 T6 S4 e/ l  若二人都互相检举(互相“背叛”),则二人同样判监2年。
' d* l  ?& A/ Y/ @1 w# Q* h. E2 t  ) Y; {& r0 q- `  a* Y) p3 ~& \
用表格概述如下:9 C$ w4 k4 B: j, r
( c1 Z" J- L- M7 E
    甲沉默(合作)  甲认罪(背叛)  
8 q, ^5 _2 \; V' y* d. y  j: |乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  / q' M, [- d- ?5 a' r8 r7 v- J
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  3 J8 H& _2 ?( E; `
2 w9 D" o" b( Q9 Z  g
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 7 M5 C" `; R9 h5 V' W
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
0 S% [* t( d& {$ n) C' \/ J4 V5 D  若对方沉默、背叛会让我获释,所以会选择背叛。
5 U% @, B* S. }& Z  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
( ?% ?5 d; C, _! U4 [* E  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
& r8 d1 o) U9 H' o! @  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
% z$ r7 A3 e6 M3 ~  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
1 l; i6 x- f& Z4 z- G- b  ^[编辑本段]二、智猪博弈理论6 h1 z% J6 B( z* V7 n
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ' K. C8 ?6 D0 s5 p8 M4 Z+ x
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 3 _2 v: c. D# _; {: r
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
, G; x" S3 H1 ~5 M, ?0 X2 S  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 7 ~$ x6 Q1 N$ p  E- g! R6 {6 i/ v
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
3 g  ^* j4 c; K5 P( D4 o! n9 k  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 . r' F/ y3 r( R+ ?& y7 }
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
5 Y3 Y6 y* ~, @1 K  
) t$ E$ v. U! X9 R" L4 m三、关于企业价格策略1 u. j# r( m, ~7 U  }% ~
5 x! l& r/ m- U0 I# }" K& i
  5 k# z; Y: I; h
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
! p: W; A4 o! E) w5 l$ C' A$ K  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局




欢迎光临 老秘网_材夜思范文 (http://caiyes.cn/) Powered by Discuz! X3.4