关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 " v* c; B3 o$ S  p/ S2 N2 I4 a

, q2 N# R( J% J( v( U3 j: O严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);7 b) t( r$ y$ m' p; b' g
  以下三个定义:
' c; M# y! C0 ]  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
! J7 |; [( D) l  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
- P. M; G  G4 O  所谓的双方优势策略则是指双方利益总和最大的策略。  
; e* [7 d5 r0 ^2 Q6 v8 r[编辑本段]严格优势策略举例分析1 I: X; O5 ^/ S: _
  一、经典的囚徒困境
1 ?2 O5 E& G2 f+ j  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ' h$ V$ N5 h4 y% q9 Q) B
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 9 ~- W$ o% E  Z+ N1 n6 L1 |
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
" B6 A' A9 K( B  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 0 w% X0 G2 Z. p" J4 N
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
' {) r" J5 I0 d# X, P. l4 I% [3 U5 q+ R  $ r  l" U$ k# j0 V% [6 c
用表格概述如下:
, F7 V% e1 ~9 ~9 }% T9 K4 Z& I2 J8 Q: f8 k3 s1 g' _& Y$ j5 I
    甲沉默(合作)  甲认罪(背叛)  
+ }: i7 v) @1 i6 i& T6 P& d/ W+ x乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ' L5 {) z3 m* s
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
  l! E0 L4 Y1 r% Q+ K! z' s( G3 ^: u7 c" R. M. W$ ?3 I- R# c
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 & _0 y3 I5 f5 w, m. L' L4 L" V
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
! F  J( q8 {* I/ Z! ]8 z  若对方沉默、背叛会让我获释,所以会选择背叛。
1 D# f+ `' \  o4 ^  {7 N  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
1 _8 R1 H# U7 \; t8 s  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
! M- M- s, D" l% r. r  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
. U  a& Y, u  X2 y* E$ {# [5 I: E' G  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。+ i7 U* ?+ \; B! I9 Y
[编辑本段]二、智猪博弈理论
/ V/ n4 P2 q7 L& V( @  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
' y& a# b8 b8 z  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
* ~3 ]2 n2 z4 a, E# E  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
2 T; ?6 y" G6 X  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
) c4 Y1 Z6 b2 t( V6 A9 Z9 g+ I7 Z9 u  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 5 X5 A( @' M6 n8 K! F; ^( }
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 + V+ ^6 `6 @3 A4 a0 E# U3 a( G
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。/ U% `" ~8 D4 z+ b  l+ B
  
. @, l$ `1 J" r9 S& k, h0 X. {三、关于企业价格策略4 x6 g9 R' O  u4 r+ W
3 r* v6 e- \' d, F9 G4 w
  
6 C7 p2 m' j3 X7 e  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
4 H; e4 P: W: f, l! S/ Y  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);6 L- j8 E+ m7 x5 D
  以下三个定义:5 M" I! H1 J3 f: _
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 7 P" H/ K0 `& h; Y  ?, a! ~
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
& O& C5 [" _* u* N  所谓的双方优势策略则是指双方利益总和最大的策略。  
9 ~, L$ S3 P4 T% c/ z1 K9 b9 H4 w[编辑本段]严格优势策略举例分析% D  S9 X( o7 n  h3 u8 q
  一、经典的囚徒困境 9 l: v& I9 y* C8 b
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 1 X+ v5 [; A2 A" p4 |$ t  k7 ^  ]
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
" \! {( F; P2 H3 Z' O. P  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
% m  {4 o4 `/ x0 V5 x6 v  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
6 G  w  n0 b4 h) m+ ~  若二人都互相检举(互相“背叛”),则二人同样判监2年。1 M8 E) ]$ q! |- X' i
  - i: b6 |# `, t+ m% d2 U# z. k
用表格概述如下:
9 Z& C! t* l% e  Q; Q# y' J& p+ o6 Q2 p4 U
    甲沉默(合作)  甲认罪(背叛)  
2 u& H& ]. q. O' Y9 h+ M. ]4 J乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ; m0 P5 ?$ r5 `7 S! v( m
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  - H7 G4 q+ y; U1 o6 `1 K; A+ N* T9 @2 p
6 f5 j. v5 L8 t, X6 B  u
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
" j1 O' C6 u1 X; Y4 K' B! k  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: , S# l! K, C  U0 L
  若对方沉默、背叛会让我获释,所以会选择背叛。 1 H2 F% s6 @! g5 W0 T: x
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
  H, t9 @" \6 \* K( o  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
2 p/ [1 r; c( G  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 3 O' ~, T2 I% Q
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。. F( P, H( [( p' {
[编辑本段]二、智猪博弈理论3 E5 W, v+ C9 r! H0 X& W! }
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ; l' w! @$ X( s# a
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
7 v4 [8 X8 I" d+ s, S; {  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 / C# x# l1 {/ c
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 8 h: F6 c( ^/ Q- @. _" ?1 L4 h
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 * D, `0 }. i& F' r( `
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
. g  i7 h* |+ B$ q. m2 f) P  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。; T' w, l8 V- `* v+ A( ]2 W* A6 E5 p
  
  U- `# k8 Y# ]7 P9 X三、关于企业价格策略
% {+ d  d1 l! l1 l8 {2 V. L+ C% ~% D2 V) S  a
    K1 i/ h) ?9 k& P, B: e
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
. s4 F6 J2 A) E) M  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
( w1 T7 _* l. R% |+ ]! F! p7 g/ i! l  以下三个定义:1 E8 ?5 E8 g+ D5 o: Q; ^
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
( l6 b1 `8 N6 j  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
  m3 I7 F3 p7 [  所谓的双方优势策略则是指双方利益总和最大的策略。    _3 }0 @% f! ?7 \) A% D) V
[编辑本段]严格优势策略举例分析
5 z; S& {1 u+ D  一、经典的囚徒困境 4 w0 f9 f, o3 G( H
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
' W; Y# b/ ]; I  h. y9 C* E  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
' l8 j% V0 ~8 ]. i9 B8 H  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
; }5 S; T/ @/ m# _9 w: U+ ?/ y  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
; B" N1 }1 j8 n/ I8 U  若二人都互相检举(互相“背叛”),则二人同样判监2年。
( R: Y' y- X7 K0 o7 ^+ S# ^  . K  e. n  i) F/ v7 G4 @' M, U9 L
用表格概述如下:# m# P$ r+ Z- m+ F2 d, y+ y  q% D4 y
% C# _/ M. G( C  k& ~
    甲沉默(合作)  甲认罪(背叛)  
  g: `! _3 _! P4 H/ |" j- R" J乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
& C, h: z5 J: C/ X乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
' ^" M6 {8 u" _+ W- d6 f& _
! J6 {( Z: R7 e  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 . C: `# n' u% E6 F- W
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
; O1 g: x3 U3 m* n/ k. x  若对方沉默、背叛会让我获释,所以会选择背叛。
: M: {- a3 C0 J9 K3 d; l$ }+ |- m  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
# N! i4 F; ^" }& A: B  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
* }! u+ ~  T+ V9 S) \9 g4 k% ]0 V  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 / a- L1 T# t4 t# K& d
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
# x! |. g4 K5 b1 p! k8 @' f  b[编辑本段]二、智猪博弈理论
2 S# _& I2 w4 ]# T" t  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
7 V$ q, }4 m. P  k0 O  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ; u1 p/ s. a1 h4 D1 P$ I) v
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
1 n+ x1 Z% r5 _! T: j) J# I  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 * {0 i+ ~7 r) `* a
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
& }! G( Y' O" _8 g3 |  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 $ b7 |$ m1 b0 W1 C/ l: V# ~
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。4 `  m. Z) t6 e3 r; Q: ?
  # v/ u3 R! q" {! o- ^7 |" x
三、关于企业价格策略. i# w: F: t- U( p; Z) A
. T8 v- h9 b2 x; O5 v: `* Z/ ?3 [' i
  
/ ?; K; J& m. p* a& U  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? , M/ S, F9 z+ s5 E9 q) V
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);3 S2 ^" L7 s6 m" r( A- J  J5 C
  以下三个定义:
2 M' t5 w, n* W' q9 P' r  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 0 X2 _& d- h$ |3 [, I$ y. G
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
3 f- r6 i/ ~, U) W: t0 D3 l& B( o9 T  所谓的双方优势策略则是指双方利益总和最大的策略。  8 i5 e+ O% O% ~. X3 @- p' b' c
[编辑本段]严格优势策略举例分析; t  `  R4 Q8 I' L) }) e5 z
  一、经典的囚徒困境
( c, l+ P' x; L  q* K' A8 t  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 0 A7 X7 F& R! x% o! o
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: , e" F  z/ C, E
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
5 [' R# \9 ~9 n) l  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
$ q  T3 [9 J+ B- h8 i0 y- J2 S  若二人都互相检举(互相“背叛”),则二人同样判监2年。
: o, S/ D( B; f7 H6 q/ n  
0 E+ T( m/ a) z  y" j0 J用表格概述如下:% J1 ~+ k$ x6 h( d" ^7 P0 h% b* a

( v4 g: Q  J& o  K' O    甲沉默(合作)  甲认罪(背叛)  
: h* D3 v" `8 O# f' `+ q# T1 ?乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
7 Q9 j5 n! d/ S乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  8 m. H' u% R8 D) B# _

/ g6 V9 T  c& p. h' w) J2 I  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
( x3 w2 h$ z' |  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: , @% Z- M0 N1 A. j+ K) D) U  s# }
  若对方沉默、背叛会让我获释,所以会选择背叛。 " F1 y; c7 l; f3 \+ T; M6 \* ~! r( ]
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
" Y, M' y  \2 z. I+ i  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
4 F6 U' w- B* Q+ x0 j" v  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 7 C- l9 H: h7 c
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。& X5 c; v- b- J5 \
[编辑本段]二、智猪博弈理论
( r& q- G1 V) G- g4 T% ^  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
# p$ r% D4 ~, @. I, f  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 + G7 a0 Y: y2 t+ u' {& B  x
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
. w& |$ _) p+ D$ |) `: p  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 , p9 L! D9 \5 O  M
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。   g1 Y. @( \% L- |% ~( g6 u
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
9 T( u) R" D  b  f  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
7 G3 d, _' y. k3 A4 O  
2 r- ^- A; I+ F! \2 W( O三、关于企业价格策略' G* N. b/ {0 p8 D4 ~' h% N3 l) S

) u  N% P% u! L6 ^& `- `" d  $ F  e2 ~5 a4 X7 I9 r# @7 t
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 0 s5 Y" V% U1 x( b: q  f
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )