关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
1 M( Z# ]7 F5 d6 m- K* [2 `9 D! e# b# \/ U, e; r; R
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);% e/ |6 U& g0 }
  以下三个定义:
9 Q5 b% o) [. M3 q  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
$ ~) ~7 }0 a" C# d/ ^* P0 F  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
, h* ~9 |: u5 J  所谓的双方优势策略则是指双方利益总和最大的策略。  
0 d; E) w, @; A3 T[编辑本段]严格优势策略举例分析  Q: u2 f6 E. d/ O$ A0 z
  一、经典的囚徒困境
3 F( i8 [- L4 B' A3 F3 l  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
) z) q3 O# C* r+ v) z& O( Z; S  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
) ~% X9 d9 O; Z( p) G$ E+ c  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
2 T; e0 t% U: r7 i  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
8 b+ `2 n) M, \  若二人都互相检举(互相“背叛”),则二人同样判监2年。
  B, f3 ^% X$ e) _  }  - f* B( u) u8 p2 U* S5 [( I
用表格概述如下:
. |, R7 U6 c; m2 y- \# F! K4 y! G) T
5 @5 V; I# }6 W9 l- X    甲沉默(合作)  甲认罪(背叛)  
4 `" \6 G- t- f) z乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
6 {: J8 _% B6 z' f; s- r乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
, v& H9 o% A% l" @" K4 v3 ]: n0 K
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ! D( r5 M. u3 Z3 h1 `
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
0 F1 U! R9 b! e5 d; O  若对方沉默、背叛会让我获释,所以会选择背叛。
3 w1 l4 Y( z0 Z  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
" k( f+ L# d8 a2 u! C# t  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ( A5 X! m) I1 F: z  ?; E
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
! d9 }# N1 `( R. K4 B7 s# e  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
; n# @: K* W: y0 u/ r[编辑本段]二、智猪博弈理论
- T$ T1 Y+ ^8 S9 V* j7 n  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 + x9 u1 c1 E9 u1 e. Q1 ^4 D! ~4 s
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 2 Z) D+ E$ _0 D9 ]: T- Y
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 $ O5 _: Z9 ?! Z& O8 D: H" F
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ; ~- M4 j) E# {4 v6 p
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ! v3 s# m; |5 n8 V
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 - _+ n$ Q. i* U( }
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。7 q& E8 ^" j8 M8 R; r
  ) W1 t2 K/ [! w! A( [: i
三、关于企业价格策略/ ^3 s. h; h& s. h% f3 O
9 O) s8 K* H  g, L6 |5 q5 V
  
. ~! V+ ~2 y$ U  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? $ v- {! T+ p* D+ N0 P7 D5 D
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
, v/ e' v0 D# k  J5 ?$ F  以下三个定义:
" W5 a! u, g+ Q- V/ n8 E. }  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
$ W$ A. Y9 W. j  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
' ^$ G4 ?" B4 n3 M  所谓的双方优势策略则是指双方利益总和最大的策略。  
: s  w2 d7 J. N6 d[编辑本段]严格优势策略举例分析/ E2 e- ?$ L; U7 P* U, w
  一、经典的囚徒困境
* ]: a( D/ c/ U4 g: N" x  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: * n2 s! g* z. g3 Y
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
; N5 N! z- k( w& D, v; g5 t9 v  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 + z4 b& D2 w: A
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
" U$ c+ V. R0 c* g+ ^2 z  若二人都互相检举(互相“背叛”),则二人同样判监2年。! p( v$ V! y& [" d$ g3 }- j) q
  7 Y. A, i; k, ^; }* x
用表格概述如下:
. o! {  p7 h' p$ y
& |8 v" M! t- h5 J    甲沉默(合作)  甲认罪(背叛)  9 R( C1 l' X$ o2 |  t$ k# d6 P
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
$ _, Q7 a  b. {( l$ t, ]( H乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  4 F2 C) @$ {5 Q2 u. P5 O8 n
) t* |& O9 b+ q# I# G# e
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 3 n( l% Z0 U1 {
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
- k( q2 s- f' A- j  若对方沉默、背叛会让我获释,所以会选择背叛。 - f8 T+ l  c" ]' f7 k
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 3 d1 v8 P9 T9 v& [9 h% |& N
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
% V; I# G" l# {" M+ ]  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
( c( n9 ^0 t$ t. k6 {1 n  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。6 P. \9 P7 P# q7 N" u$ ]
[编辑本段]二、智猪博弈理论" b5 z+ n# _" W1 b5 N# b
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
3 ~$ f. P8 B- N8 S  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
; c9 _. h6 ~6 @* m; u  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
5 ]$ l! W' ]6 J- y  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
+ T2 ^7 O* K& _  n6 p  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
1 R% q& q" ]$ U: }9 j  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 " j9 ]* L" c3 ~) Q2 }
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
( U4 ~2 W$ W) Q1 g& `! H/ G  # K9 ]5 C: ~! h! ~" ^( t. s
三、关于企业价格策略
0 k3 }' L$ O4 N8 b0 Q2 I) q4 y5 B) L* e! N$ M" W4 b, f
  + M: {3 p* l9 `$ S
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ! Y# c' B7 A' @* r3 I
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
$ j& A% ?; L# X5 t1 n  以下三个定义:
# }% q+ J3 E( L+ ^4 G* S) e  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ! z" U  b5 Q9 v. u) T
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
# ^, D. ~8 e' R% i5 Y% P  所谓的双方优势策略则是指双方利益总和最大的策略。  
3 r2 I$ I5 N# P2 r, Q3 G[编辑本段]严格优势策略举例分析
  L2 U  Y5 S3 l( n) u6 V: [  一、经典的囚徒困境
+ X/ k# J5 k2 r9 n  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
2 Y" d6 {( g( X+ @: Q0 t6 \  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
  _1 w# J6 N: d7 }, ^" }' x) K1 Y  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
7 l3 f6 \$ Q) T2 n. n( O" T  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 1 E! X4 q6 _# L4 E' u; E6 W' j- n
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
9 o& q2 S" [9 L: V. i2 G' \  4 r3 \# i% Y- i0 [9 p0 Z
用表格概述如下:
8 {9 q( p8 R) A$ L9 _4 G5 T; p* P0 r+ V" C( Z  j8 k
    甲沉默(合作)  甲认罪(背叛)  1 a" d4 Q3 f& h  P+ l% [/ E7 M: ^1 J
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
6 n' V% K5 s) ~乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  ! `7 L( p+ R) m  ]6 [. @3 w
. m* R2 {8 J" A' \6 M# e, s1 j0 d2 {
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 + f+ r- A. F7 T3 L5 o/ C
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 3 X+ N' T8 h% Q0 C* _  ]
  若对方沉默、背叛会让我获释,所以会选择背叛。 2 M* h) ^3 j- i1 G" w' B
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 $ M+ s+ e# V; d9 u$ X
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
( Y5 G' D: c# @8 b5 L$ t  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 9 Z, k- ?7 u2 [* s
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
- t+ h7 o  W0 G& m3 \2 O[编辑本段]二、智猪博弈理论
) B0 B0 {. N9 p: \4 U7 }& k  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
. r6 K) M( F2 v/ h3 \9 f  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 5 z' F, L* c  ?
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
2 m$ s" T$ G, U' \  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
# @# y/ o% H" l% m/ I# C  N  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 , c3 B) G8 ^+ b% s4 `
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 6 c& ~  K6 S, Z( B) x1 M. r2 n/ F
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。- c( n. [% y# x2 K; w
  
. H! U) q6 H% P1 d3 S三、关于企业价格策略. c! H1 |( f% J8 l( i3 _

, a2 y* v: w' k, o  
/ A7 |% b! N5 X  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?   n  e9 B4 i0 x
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
: S) i3 V/ K4 U8 a% q1 L4 Q5 s5 l  以下三个定义:  a, ?, K4 L$ w. q! h/ D, X7 Q3 t
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ) v: G! ]& z2 n# r
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。   [1 T" E. e1 S0 O
  所谓的双方优势策略则是指双方利益总和最大的策略。  + y! {4 F' I9 |/ [
[编辑本段]严格优势策略举例分析
; ?# m/ E# S6 d1 L/ V( X7 u  一、经典的囚徒困境 . ~) }# W: x0 O  h0 W5 {
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: - t9 H  f. e; q+ L
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:   ]$ T. Y! G* C) e
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。   E4 K7 n8 s6 d$ U
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 + S  v7 @/ W4 b. V4 i8 Y, E
  若二人都互相检举(互相“背叛”),则二人同样判监2年。( i1 a  z9 k* e) V3 g# w; I$ P
  
  F8 J3 v: D" M" f8 F' g* T/ U: h用表格概述如下:$ e1 B, s; b7 p
6 x& x* |! F6 n( ]
    甲沉默(合作)  甲认罪(背叛)  
6 j6 `1 m, Y' c3 q. h1 u0 ]5 Y4 f乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  $ A3 S0 Q/ [, m
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  - H  q$ c, c2 [, @/ ?9 V

" p- _" M. D; B8 ^# H8 @: a( v  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
2 r5 C$ d$ p6 B2 l$ [  `  ~0 G  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
- L* Q4 s; y7 S& V  若对方沉默、背叛会让我获释,所以会选择背叛。
0 \/ p; W0 K3 p* O" L1 r) M) ]  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
& v6 t% z0 u+ S( J" ~( @& E6 [  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
- i+ d* Y; q- S/ G( Z  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
% g6 ^7 Q5 t! I- ~9 ~( G) l1 ^; _  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
4 y6 x1 J) y, \- z[编辑本段]二、智猪博弈理论; Q  t, E' l6 `4 ^1 _9 v
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ( j: h% _  `: U/ I' N
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
9 v% x9 j0 W! ]: j  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 - T. Y' J$ [- v: w5 d9 @, f
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
3 |: i2 ^2 k1 R5 ^  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
& q. I) L9 T- _  F; f/ u+ S  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
8 n1 E0 Q! ~1 c" H* b% {  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。* V* @( V# i  N2 R3 k8 V+ }# W
  ' Z: p# n6 C! v2 E3 k1 f
三、关于企业价格策略! O4 |  }) v. n8 u( _" R8 u% ], f
, X# p5 J( o* Z; S+ T, Y0 [
  
' @0 ~) K1 b* ]) ^* m3 F  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
- P' ?% t5 D8 j7 P: @" c" |) Q  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )