关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
4 i& {( h0 t9 s% u( K/ f+ x+ ?1 Y5 T( h# Q$ _
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);& C$ c4 C' C" ]& I) }
  以下三个定义:
2 l6 M0 K  A5 d, P6 Q* u5 [  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 " ^6 b( H: z" G. l) ~3 D7 U; w
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
. m7 R7 ~0 ]. n' @, l6 k2 v  所谓的双方优势策略则是指双方利益总和最大的策略。  
7 |+ D9 k4 U; i4 \5 I# H[编辑本段]严格优势策略举例分析& t7 w! h& C# b4 v1 }( P5 j
  一、经典的囚徒困境 3 W" l1 r, [+ z7 K: f) G- V* k
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: : J% g+ r- J! W( \. h8 i) |
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
$ x& p2 }6 Q& }2 k! ]# P. t% |. P  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
7 h/ y! v- ^) ?9 o5 j; @: D4 u. N  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
1 n; T5 s: B- C/ `7 m- Q0 B  若二人都互相检举(互相“背叛”),则二人同样判监2年。8 \: c. P; A) _2 U- `4 E7 c: `
  9 R. D- d" M; d+ S
用表格概述如下:4 f7 {" y) R7 R  {- T

1 ?; f* s& Y" o; L3 o9 s7 P    甲沉默(合作)  甲认罪(背叛)  
' s9 S* D5 j, B3 b9 C' X乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  * `5 h% t2 V' v4 y, m
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年    N2 ?  F: t$ ?; X0 {0 {0 A9 P

8 A9 L9 W' b9 O  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 7 z7 W0 \. k; X1 U' b% z( M
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:   }0 ~  \' T8 W- {' u$ a. D) F
  若对方沉默、背叛会让我获释,所以会选择背叛。 . h: f; W0 i8 D! t# W' \# q! U
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
/ E2 `4 v1 M: i- d& z8 [  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
8 I9 [$ j4 i& h7 h/ g  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
8 E! _+ H3 i, I  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。  G$ t& i* q6 `1 Z9 O0 C& n
[编辑本段]二、智猪博弈理论. r7 N, E* n' J
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
% s. \" J  w$ ]' l  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 # O, D/ _- v! c2 \* M
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
( a$ B2 B# n% j. }3 a8 y* L- U  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 # ]( d0 n1 u3 |' N2 x
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
0 `; K3 G% z  m3 d; d- Q+ Q  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
' i: m% r3 @$ s5 k) |( _  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。; r- @/ S1 g6 ]1 G0 c/ X8 T
  ( j1 b' v( q+ I* K
三、关于企业价格策略, X& A3 S  W% q/ A9 g
8 [: m, X, g/ A
  : @! l' L9 f5 K3 ?: m" o
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
* Q8 L) Q, N5 N  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);0 G; j! g) |# l
  以下三个定义:* P- k. s7 e. n$ F7 j" y
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。   C0 p  e/ E6 D' _% R/ ^
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 1 H+ u1 W4 Q  |' c
  所谓的双方优势策略则是指双方利益总和最大的策略。  9 e8 R, X  g' k0 V: Q4 c7 J+ y
[编辑本段]严格优势策略举例分析  v0 Y) B( |% F+ x0 D8 X8 H
  一、经典的囚徒困境
. d) _2 Z5 e0 B. b; n# N  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 2 U& v# G5 J' K) U6 P
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
/ Q# a# E0 ^6 {! ^4 u  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
; i) O+ m7 K3 P! R1 f+ \  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
% g* z( M* w' h8 B  若二人都互相检举(互相“背叛”),则二人同样判监2年。
& d; n& C7 E! r! j& G+ n  
$ b# M- u6 `& Y% a2 G, @( ~用表格概述如下:
3 ?( |) ]# I5 h
7 l( {, [- m3 K    甲沉默(合作)  甲认罪(背叛)  " F- h# q( x) A0 R
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
4 P2 i" }( b; ?7 k( _乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
5 e# j0 }! N. R6 K
3 y# g, J6 K% w0 X  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ! x7 w4 d  B" I8 s; Q% f
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 6 v! T  w# K# z8 c
  若对方沉默、背叛会让我获释,所以会选择背叛。 ; e( k& |8 ]+ _; u- h
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
* m2 r' y+ I: @6 ^$ |3 |5 u  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
% y$ z* F4 g) A( Z$ r9 X  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
# a( K0 D2 A4 A6 ?4 L- U, P  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
+ c; a* k" _# @% e3 n! C# e[编辑本段]二、智猪博弈理论2 _" Q6 \  H: j- Z2 H$ I; D
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
/ e" E+ k6 q% X% }  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 . g8 G' a3 S8 d/ f% j) `
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 " m+ d2 w+ S7 U5 L4 i6 i
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
7 |0 J4 f( R9 `/ f/ R: v  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 2 V1 w- }; B+ j! v, o( ^$ b3 \- O% N( g
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
4 i) q! [4 s( x7 n; p0 J$ \% x  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。0 l' C1 h9 `: k) Z
  
7 c( c5 ]( ]  Q% b三、关于企业价格策略
" e3 x: f8 C9 _# Y' _) v
: g7 k/ ?7 i1 @5 g9 A  
1 ~- d: d% ~. S% w/ s$ Z  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
* U% Y) O7 j9 s9 p$ `9 V  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
4 k9 J2 z9 E4 U+ C7 G( b  以下三个定义:
6 Z: l0 y4 V3 t# v  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
$ c" K, M3 T( O7 J+ N  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 & L4 x9 I. b) P( s; Y+ m% X
  所谓的双方优势策略则是指双方利益总和最大的策略。  
9 G" P8 p# g; H* g' H3 f9 w7 T[编辑本段]严格优势策略举例分析
1 b5 g2 }; O7 a9 ^0 f' r$ L$ z/ S  一、经典的囚徒困境
# V! c5 ^9 v( x9 K  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
, ]! e7 s  {' c, U8 q1 A' X8 m  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
7 |; W# p+ Z/ p& a' V  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
" Q; n) Z  l2 R+ L8 Z3 C1 _) [  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
6 M+ b1 U  K! A  若二人都互相检举(互相“背叛”),则二人同样判监2年。0 a* e+ T& [5 p, ^
  
% Z, A7 V+ Q/ Y4 Y1 f用表格概述如下:
5 p: F3 S9 Z$ J8 w, _! K) W# k  L, r0 j, j) J3 D* s$ g" l+ v! i$ i* j
    甲沉默(合作)  甲认罪(背叛)  
0 f# F! Q% {! O3 \% s. i4 n乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
/ ], G! j& M8 }乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
; ~5 D" j0 O$ i7 ~+ Y* p
) Z. f' q0 A3 b) }9 w. }. U# R  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
1 D" `3 `5 `( }5 Q  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ' U* Z) c' C: Z6 i  _/ j) d
  若对方沉默、背叛会让我获释,所以会选择背叛。 $ K5 H) A/ p7 i* p
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 2 Q5 `, i7 Q. x$ I
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 & \) _7 Y3 [: @  g
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。   F6 V0 D* B1 x5 X- z/ P# @. a
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。9 Y& _; o' Q5 w, i
[编辑本段]二、智猪博弈理论: V: \5 `' z2 P9 Z& g
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
: S! n! K) J8 g; K  O4 }) w  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 6 f8 o0 K* v  G5 ?" ]
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 : Z/ P( S3 [3 M7 G4 |& m' K
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 % j" x! Z/ o# F: j  _7 y4 R
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
! ?+ k5 T9 J; ?% m3 w9 L1 l# h4 c  s  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
/ O' i$ v1 [% W0 p* C# i  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。2 {8 b  t% ]* |) ~- {/ N0 _8 D
  5 J2 T1 x  U5 e; K3 m0 H
三、关于企业价格策略
4 [0 }6 f) O6 m$ q: }
- T, N6 B- o  H9 b! J/ Z$ v  2 ]; G$ J9 z, C; |  J; [, V9 v
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? . t: W1 Z1 l# e0 R$ c. o
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
  y% y  e( `$ U  以下三个定义:) f( {. D0 g, k8 W$ G- ^
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 : u( l. X: m( {
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
: K& ]. s' @* A. }+ N4 b  所谓的双方优势策略则是指双方利益总和最大的策略。  
) J6 p+ V1 C% I$ o7 ?7 a[编辑本段]严格优势策略举例分析
+ O- b+ g8 z0 I5 j: }6 L  一、经典的囚徒困境 . @2 W# g6 D$ l5 y2 B( J' f) g
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
$ W5 Z* f, P# A( X( _6 W  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: : t4 f# Q8 o$ Y9 J  ^
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 $ O& q& i- ^. S" j; G3 S3 f
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 " {- m% a$ u, _- k8 }
  若二人都互相检举(互相“背叛”),则二人同样判监2年。  p, Y6 V! G; r1 V0 p
  : ~5 i7 N: `  i' \3 r
用表格概述如下:
4 r" \' I) q: k" ~! b0 K" @
: Q0 u% x0 V7 h8 D+ ^# B/ S    甲沉默(合作)  甲认罪(背叛)  ! v* @8 s; {7 J" p7 b
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年    O4 r. C- ~0 v0 p4 r) v- t
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
2 H& R' S& V6 c( X" x+ q
) T4 J. Z# ?9 `: e9 D+ ]% {  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ! O5 i# F( v" `& P1 o7 A
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
9 g) x- q: X! F& U2 e# H; ^. I: R  若对方沉默、背叛会让我获释,所以会选择背叛。
0 L) J1 ?0 [; p* n* v1 u; ?  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 * z# g  I9 }9 y: D
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 + l, m7 V- U# C% t  M% z
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
* W& S% D: g  z& [. R) J  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
0 \& f  G8 j" N6 A[编辑本段]二、智猪博弈理论
. k' d; c1 V1 [( K) n3 e  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
/ X- C. d2 _0 J/ J7 p# ?  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
1 x+ b; |& o  |# m7 @  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
9 ]: b* J# t) m( E1 o8 b9 M- r/ n  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 - m1 B9 o/ f# N- T
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。   G6 j, k" k* `- \3 u% X' c
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
2 C( ]: ^! Z+ L2 A! N, F  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。  |" J8 {* c5 @/ W  B( \
  
, z' ?* _) f6 P9 o三、关于企业价格策略) [2 |2 u3 A) o+ d6 t1 C1 l# X- K

; q* N9 k4 _2 k. k5 M. M- O) Y2 x  ' J4 ]7 t9 [. u( m  v. H( C7 D  o
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? / p: A- [- A& c9 q
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )