老秘网_材夜思范文

标题: 人生有许多无耐 [打印本页]

作者: lzqggg    时间: 2015-12-31 11:31
标题: 人生有许多无耐
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 : O3 ?% w/ |& F7 O' u% f3 N

& |4 E, _$ j- m1 I严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
( F# Z% }1 B5 D3 E  以下三个定义:! S- N( d+ |9 D+ a9 p$ L, o" @* \
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
% h+ A+ x( F  Z1 }  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
# B6 `: S' z9 ~! M. C" k3 h+ F+ u  所谓的双方优势策略则是指双方利益总和最大的策略。  $ B8 b0 x  }. g+ t. Y5 [
[编辑本段]严格优势策略举例分析3 I. l: h* B$ Q& P6 {: |/ m6 `
  一、经典的囚徒困境 : T" W% T; c& Z' m  c
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
! R6 S& R  X2 w# q$ p  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
: T$ j# @4 y' F7 O" F( \0 c1 ?. z  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
& j0 G; A; u* Z; b/ ]4 _: Q  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
: }$ y5 C; V1 }, t/ X  若二人都互相检举(互相“背叛”),则二人同样判监2年。
3 g$ `. g7 q! I$ c1 ~  
) F9 o% J! R6 b- W/ }0 ^用表格概述如下:
/ p" H! t- s7 [7 g
! _! g+ }$ d) v( D3 \    甲沉默(合作)  甲认罪(背叛)  
! m( `' e( _" M; M! n5 ~) s乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  % i1 D, m; `4 j6 u
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
7 }# G( N& `: D. z' W5 ^, `6 U7 f; i
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ) G* L9 k" k) j4 p+ t5 _5 y' u8 Y
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
* S( f; y0 _4 ]" K1 ~9 V6 a  若对方沉默、背叛会让我获释,所以会选择背叛。 - Z  S) S' z9 Q" ~4 k9 Z/ H& a
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
% G9 n0 c/ ?- r. l% x8 F  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 1 e5 S/ G4 q) H
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 " \4 t% K1 F" B4 x, N+ u3 r
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
. A$ C" }' D( S2 K[编辑本段]二、智猪博弈理论* P& q3 C. O! r# Z
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
/ k9 ^  H$ j: s1 g& U" l. @8 A' v  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
' [; P! y7 [( D  k  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ! |/ w& p% i+ a4 h/ _" P. e
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ! O2 _( e+ G' p
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 0 [% P) {7 g+ c# n$ K
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
* z+ B' ^7 D) k8 ^" y  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。: D& Y1 S; m3 Y( E! m0 Y5 S
  , F. I( m) y" \6 |9 {1 Y
三、关于企业价格策略
/ k8 i4 V* F  s% o4 D- b9 ^' b' ^, O" k
  2 h. z, C+ @  A7 W( I) T0 t
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ( }' m# C4 l9 p) ?4 v# R
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
! t4 G& g2 n$ P" Y  以下三个定义:) d" p/ m! h4 x/ M/ ~0 i
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 9 q5 L4 q# s$ L; y6 }1 c
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ! u  H3 r- b7 T) q4 y
  所谓的双方优势策略则是指双方利益总和最大的策略。  
7 I9 d! j/ b! u6 u2 X[编辑本段]严格优势策略举例分析
: _2 R0 M: |8 o/ _  一、经典的囚徒困境 0 H7 c# b2 s: {  e
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 7 z+ p/ R5 b) v- p6 P; q3 E
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ; L$ C$ g' R! W# z. F) w/ e/ W
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ( W: C% z% C4 k% e% b) P
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 + j, e6 R/ g7 Y7 X# Q( i; B
  若二人都互相检举(互相“背叛”),则二人同样判监2年。! m2 J3 H+ @1 O/ X& n
  . i; I+ j- i' H& B
用表格概述如下:/ S* `! {% P& F2 }& U% e8 z

. A4 D4 m: o! E    甲沉默(合作)  甲认罪(背叛)  4 g6 ]7 Q4 d: O5 T. z# V- Z7 C
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
+ k2 b: A  n6 A, G+ S0 P, @% i乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
3 k* ?. }0 ?1 f" u( ?; r, l5 x0 b/ s7 {+ J
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
+ w8 X/ I& L5 k. f8 _0 _  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: + F( h, z" }2 c. p  P5 o
  若对方沉默、背叛会让我获释,所以会选择背叛。
* b3 Y5 l; [( l: p1 K. ^. Z  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 , E' p0 `, b+ \- s( U) x: {8 X
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
/ L" B& s5 x% s: ]- a  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。   v; V) z  B# B: Q* C
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。. x) e7 v3 }1 f1 s7 b6 g
[编辑本段]二、智猪博弈理论
& N( q% X$ e. x& L* }& A0 ]* X  o  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
5 n& d& [4 w) E2 J  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
) H8 U, r8 l  t6 P7 `  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
# e. B5 s7 Q$ t2 A  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 % \0 B5 f, i8 S) i
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
! T! l" S& \+ ^, q% i8 _+ u5 l+ }  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
8 X# b9 J3 d! D( r8 N: k! h5 j4 y! o; T. O  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。% O8 ~# m7 M6 X
  
9 d& R; m4 O" p) v5 H- e) F( h三、关于企业价格策略3 M' d9 b9 R# T2 @! g

/ H$ w5 c+ t/ s' X3 ~2 w0 ?  
; p/ B5 g) d6 e, R9 \' U1 {) N8 V5 f  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 0 t, i# q3 ^1 u1 d2 `. h0 A# [
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
: Q3 N3 F4 n4 x/ J, j- v. C2 \  以下三个定义:# f  n( ~: v0 O6 a" {, [0 }
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 : o5 y/ H; Z6 B* Q* h/ X" L6 p& S1 j
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
, u! T# N5 \: y0 V  所谓的双方优势策略则是指双方利益总和最大的策略。  $ ~$ b% w. m. J5 K/ G5 d
[编辑本段]严格优势策略举例分析/ w+ ]! F: O2 v  U1 E
  一、经典的囚徒困境
+ R( [$ e, h. Z( Z* S& M' ~  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 1 x. v) p' p/ B
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: & O- r- o! c3 S0 G
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
2 `) }2 {1 Z. C6 Y: ^" r  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
3 `0 c* |0 D+ o& }3 j  若二人都互相检举(互相“背叛”),则二人同样判监2年。
( U- B9 w0 y3 o  3 [2 J: s+ B0 T5 q! T4 Z
用表格概述如下:
0 s( A8 T# P, J9 W3 N9 k
1 k) c" W' e8 R4 f5 _% f' s2 P    甲沉默(合作)  甲认罪(背叛)  * s/ P) y( }7 `: }2 ?* u
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ; v. u: [6 v+ q* p7 t
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
* |# S. [, a( l3 {
, n( z/ W! r9 J3 ?: s  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 * k& s5 E- }, l- V$ J# ?$ J6 b
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: # W" C3 `5 h( d, O! B* {
  若对方沉默、背叛会让我获释,所以会选择背叛。
* `7 G% _# m, h  G  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 " z8 a) {  _& l5 h4 n
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
2 N3 V" i+ t; ]% r8 z3 N; j5 c  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
7 a9 A5 A0 U1 L5 f  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
& h. o. ~8 }7 t% M6 Q[编辑本段]二、智猪博弈理论' h+ J" m- H4 |3 `, M
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
+ b/ E3 R" n* c6 i  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 : q0 \6 C8 @% W0 ~& k" O
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 + i" t: S& {% P+ I% ]
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
& [( M$ y* N. F1 o9 F' r  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
$ d% B+ h6 J# g  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ! n) w! }8 H8 ?7 d: Q; U: I* [: N  q
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。$ {4 U* r" g# R5 \
  
( S7 C6 V0 D! v5 ^1 q5 T3 a' F& X三、关于企业价格策略
$ ?  W! D2 U+ ?9 {, `% B/ k& T" @% G2 p7 N. E% C2 I+ n
  
: R2 b9 |/ Q# d. ]5 c2 ]9 E" c  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
5 E, l+ E6 Q$ x8 R- T0 [  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);3 ?# Y" S5 P0 ~- j3 S  v
  以下三个定义:
$ n; t4 a$ T3 W& l! l, z; K$ G  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 % f& E* X" o3 P6 ^
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 * l3 K* T0 D5 y9 {+ K0 y
  所谓的双方优势策略则是指双方利益总和最大的策略。  
% Y0 h! @2 ^8 n$ t, |9 P9 o- T[编辑本段]严格优势策略举例分析0 p* F) y4 J0 a' z7 A6 J
  一、经典的囚徒困境
- n0 t9 W- y7 G+ u, {  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:   N1 ~5 u7 S: X4 \) n$ K/ U7 D1 C
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
/ {8 J  w1 s  N% D7 F; Q  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 7 O0 x# @/ N2 t7 G
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 6 l8 b* m8 G" C! c9 ?$ K& v
  若二人都互相检举(互相“背叛”),则二人同样判监2年。/ Z$ q1 H+ `8 E- A
  
) I% v+ {3 K' c8 d" s9 D用表格概述如下:
; q4 v" L; N: N$ \3 P8 e) Q* }9 S4 X5 |; v6 C8 W
    甲沉默(合作)  甲认罪(背叛)  
, R/ w, m. W* Z) H$ @乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  6 _3 ~  e4 Z' P1 Q3 V/ a' ~( H
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
1 i) l" a- O; A# ], i! X6 M' w3 X3 y; b8 u" |+ I0 }* X
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
  }" @5 ~1 J$ n  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: " b2 @7 L! |# J' O
  若对方沉默、背叛会让我获释,所以会选择背叛。 5 s, F% h6 j3 |7 t  x. }7 e5 y
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
0 F  L; D' M8 B- f+ p& q  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
$ k. @- ]+ E% ?2 D: b5 Y  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。   s3 y/ `6 }( I( \$ z/ r7 _
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。) @8 C8 h7 V* U3 t* K
[编辑本段]二、智猪博弈理论6 G: ~7 H- Z+ E( q- B$ J( G% |
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
( v" l. \" R2 F& m  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
, i/ i: h) F2 O) Z1 ?9 K+ k  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
8 C* S8 U" U) q0 @+ a  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 4 m; a- ], t# ]6 l2 c
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 # G' k- G7 J) D; \5 f
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 - M! h2 s& X0 W
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
" l& b! O' Q4 d8 i0 u, W% `% x  
# V1 b" z7 }) M) h' M$ W+ S三、关于企业价格策略/ E6 X; ~# O% o5 E' r1 ^5 X

, Q& L8 q+ [; b7 l. D: b  9 X- t; P( O5 T" C
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
, E0 C# A; A* X9 @% M$ ~. }8 P  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局




欢迎光临 老秘网_材夜思范文 (http://caiyes.cn/) Powered by Discuz! X3.4