关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 * D3 B+ X5 a/ v& E% b1 N# w
# ?/ j$ z0 {( Q* C) {
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);! C- l; A& u% w5 U" H% B8 ]
  以下三个定义:, R$ u+ ?( y/ E$ v& s# G& o
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 / j! t) `4 B7 }' S& z! Z
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
8 P2 j# e# R$ b  所谓的双方优势策略则是指双方利益总和最大的策略。  
6 m1 E  i0 Y$ e1 t) y[编辑本段]严格优势策略举例分析
7 _+ J3 U$ W- `  一、经典的囚徒困境
2 t' J8 J. n9 e% @4 Y& c$ u  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: , l& |1 y& ~& D
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
1 m1 N5 U9 k. H$ B  N5 S6 c* P# k  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
( T, ?9 z8 w9 M  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ! {0 S, X0 t4 H  C( S, A) |+ L
  若二人都互相检举(互相“背叛”),则二人同样判监2年。% r: G, W2 t- f; c: b8 c6 j
  
. @4 S( C3 }, X! a用表格概述如下:
' ?; f& Y. w1 I4 Q: _6 b! ^6 F+ e% u+ p. L9 x! Z- u
    甲沉默(合作)  甲认罪(背叛)  
+ c* B3 a/ `1 L; ~乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
* A& q, r8 q( t0 ~* r8 |& L乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
: h8 S  O* T/ g+ r% N  O! d! h. f  }2 p' l( ?
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
* [3 Y& U" h" m6 \) w  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: # o: [& S+ T3 ~! |
  若对方沉默、背叛会让我获释,所以会选择背叛。
; L) z7 ]4 }$ [: w  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
6 k. r6 b4 t* |# F3 @( T0 A/ A  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
9 M5 u0 l. A" t* j  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。   k, ?6 r4 S2 i+ U- p" Z# t; o# ~
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
7 Z. {0 b8 `9 q0 o[编辑本段]二、智猪博弈理论, z6 ?$ E* }1 C4 L+ K
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
% @- N; }* O  G; }& ^# c  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ' V- \: j. T! p0 k; {& y" |8 @, }
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
/ ]% R  N/ \# }4 a8 B  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 # |, t3 m6 W( D
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 " E, Z9 }# c. \* Y" B
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 - {2 O+ Z, T. T* t& \3 Z7 s/ n! E
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。' Y2 r% |7 L- H2 ^' k( `
  
4 e( W# O. v6 @: {: g# Q( _三、关于企业价格策略7 W1 k9 ?4 J$ V& o0 i( }5 o

/ v* ~; m( _# G8 D  
. s6 W6 n/ H) w6 s. @  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? / Q& |, b& Z. {& q
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);+ s# B1 ^) s! ^- K, q# W
  以下三个定义:
3 t! J' O! S% G6 L* y  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 0 _4 f. ^( A. d5 f  h. P* W4 G
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 8 C2 [4 c( C5 i( n5 P
  所谓的双方优势策略则是指双方利益总和最大的策略。  5 P0 f/ H1 f/ ]* e
[编辑本段]严格优势策略举例分析
- F3 f0 e9 e1 ]4 ]) K  一、经典的囚徒困境
5 K8 M/ l" b2 R. e( \  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ' ~8 H& ?* d$ O# |# y5 |% O/ y
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
" Z5 k6 Q; U4 a, u8 _9 v  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 7 m- _) T9 {' G- T# Y
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 2 \; a  n* j1 \7 E
  若二人都互相检举(互相“背叛”),则二人同样判监2年。3 k+ _  V2 J  U: e! d
  $ ^7 J* S& p3 t3 @
用表格概述如下:1 f) ^$ I: e" Z. }" C  r
* @% l8 H  ^/ u: j) Q+ T% d) C
    甲沉默(合作)  甲认罪(背叛)  7 e' @0 P6 `0 E8 V; M4 d0 J/ u
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  # S# _) A$ c- ~' \* Y
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  7 M8 I3 e& x- k; p( l9 E8 q

9 t: _) V7 H9 v) ~2 H  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
2 P& q' w; h( {2 @  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 8 f. p- X; j8 T5 X/ @
  若对方沉默、背叛会让我获释,所以会选择背叛。 5 E4 E2 X' `, E3 b; b$ B; X. H& S1 ~0 D
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
8 `0 [4 A7 N& u$ O" D) z  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
5 [3 T0 x; V% R+ z7 d7 `% Y  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 1 A/ q0 {; u& f+ U
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。9 e2 c) Z" J# y. t5 m9 h. x1 v. G
[编辑本段]二、智猪博弈理论
  w* b1 Y! ?& H, ]3 T+ G' o; b  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 7 g9 t5 G# k3 Q4 H
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 2 M7 t5 j2 }$ T- H9 c# g
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
9 [+ d& G( k; I+ e8 V! }5 c  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
0 b& Q8 t2 B5 Y  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
) f; L5 R. \: R  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
1 [& H* y, X' {# y9 Q* p  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。/ H6 A5 X# l: \; n
  
. C5 T- k' V! b5 z: Q三、关于企业价格策略) l/ g- C  G) N6 o( P" Z

, {) F! ?( B3 u* `$ S( P    d: Y' p0 m" h
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ) }. m; N1 p# u1 V# K9 N
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
% o- f& [: R/ ?4 P8 a! s) i  以下三个定义:
9 l& ?* S/ p0 a! Z" o) J' l! L  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
/ \% z1 j+ l8 `/ X$ [5 A  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 . W4 y  H4 {1 Z! F
  所谓的双方优势策略则是指双方利益总和最大的策略。  
3 \* ?% |# y; u[编辑本段]严格优势策略举例分析
# {  R- {2 \* x, @0 Z  一、经典的囚徒困境 $ {! U  [, |% y2 \9 u
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: % q+ J$ o7 c. ^1 [  O) O
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ( G: R" W" R3 H$ P2 M5 p7 F
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 * `0 g+ E+ Q! ^9 j2 D, |" F' v
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
2 k" g+ P  \$ W$ N6 j# y  若二人都互相检举(互相“背叛”),则二人同样判监2年。/ K# ~) h7 i1 \# N+ w
  ' x% W7 R$ i4 f' Z+ ]) i6 J' y  l
用表格概述如下:1 }+ x8 m# m% q9 V3 k9 I/ d6 i
- n; o, {- M1 n
    甲沉默(合作)  甲认罪(背叛)  + b6 e3 p# C4 i0 H! S" ]
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
* j  x$ k5 i3 |% u/ N9 c$ F1 |乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  2 b+ z6 A. o' D! f
* t" `# i; u5 F! S6 u( A
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 3 P) ?) i! x: Q$ r$ v
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: : y# O3 k( Z" d1 }
  若对方沉默、背叛会让我获释,所以会选择背叛。 3 J/ H/ Y4 M. Z; {
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 # P% f8 q7 D. Q  p0 J
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 . M  a% y2 A- D! I8 p7 A& d8 B, Y% i
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
. Q; e4 F: R$ Z/ }8 {% r  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
6 l: ^( q) d3 x3 k4 g7 q[编辑本段]二、智猪博弈理论" S& A8 q/ O. w8 T& r
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ! y4 h! i7 F8 d5 s0 h3 \; {
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ; ^' P0 S, r1 L# m$ R
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 - H# r7 T7 O! Q+ C! R! X2 B
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
0 S4 u1 n1 L$ b. J  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
3 g6 H. P2 @  |- F9 {, k6 w  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 4 y% o0 ~/ e% l8 G: {1 Q
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。) s9 y% p" z+ Y' M( v
  
* N0 w+ n  j( c, J2 C* O三、关于企业价格策略; s; H) L# Z6 h1 g% A5 ]
0 N, H0 s' [2 I1 q6 c+ k% Z3 p
  3 J  g/ V2 ]2 r0 Q4 X% M9 B- g
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?   q5 X- M9 \. `+ }* z. q9 _
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
2 m! T1 v; B' @* c1 X  以下三个定义:; z; `6 i6 ]- P4 h0 j2 `; Y
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
6 a! ]' D/ K) G$ {4 N4 i  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
, p+ \/ ]: I: q; g) h  l# T; Z  所谓的双方优势策略则是指双方利益总和最大的策略。  ! D- O* m8 g- F" m, \8 E
[编辑本段]严格优势策略举例分析# l, F! [8 e9 Q+ p. ~. K# n) \0 s
  一、经典的囚徒困境 6 y$ Z) Y7 j/ ^* Q% U. n
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
, \; }/ ?1 r8 C6 {  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
) q+ h+ j4 }* ], Q% N  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
3 ^: Z8 F1 f/ f. a5 `  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
1 B; U. c4 _' b7 g/ k  若二人都互相检举(互相“背叛”),则二人同样判监2年。3 {) [! R* [9 b' A
  / a( W2 Z) t- O: M4 `
用表格概述如下:
  a4 r$ l6 `& o' }7 ]$ {: H5 }5 W% f5 j
    甲沉默(合作)  甲认罪(背叛)  
$ J6 ~, n) D) ?2 |2 P乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
  H3 [$ T4 P3 d4 L6 a6 D! y6 N乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  9 H  D- G5 i5 @6 q
6 |2 B1 h, R1 I7 ~  ^
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 5 f9 Z5 M$ N8 V' d  G+ F
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
  [5 ^5 S3 ?% G3 f2 F7 b( F  若对方沉默、背叛会让我获释,所以会选择背叛。
, }- y* H% n' z5 v  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
5 i4 U, f! P: t, q  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
* V6 _2 u* j( z+ u: L! o$ B7 Z2 U  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 4 u- r6 R* z$ H' t7 r% H; Y
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。6 T( O8 ^  `& k! h- Z- E
[编辑本段]二、智猪博弈理论
8 P/ A8 {; P3 T9 x6 m: O, G  Q  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
- w: B# F+ l" o( K; s% N2 d  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ( g# f8 M- S+ [2 k
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 & Z8 g9 M  n- f2 l$ h) K8 |
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ' E, S+ n! b! Q$ I& J
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
( w7 o7 _4 T) P# Z  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 # Y% y4 R" T2 W) M3 j/ L' q2 ~& K
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
) x& n& T/ O6 ^4 |  # A) v  f; W4 ~+ E$ T5 o
三、关于企业价格策略* _7 ?# N* c8 A( J# d9 }
8 ^- l( C0 T4 S
  
8 }0 R- @" T8 l7 ]9 a- i  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
% x' ^1 k) U) `5 ~0 I. c- c( n1 |  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )