老秘网_材夜思范文

标题: 人生有许多无耐 [打印本页]

作者: lzqggg    时间: 2015-12-31 11:31
标题: 人生有许多无耐
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
7 ?7 L) j& d+ m2 X: e5 Z7 U  U4 B
! L# M1 [; R+ C# E+ f: |% r1 o严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
# T1 C. T, P! l  以下三个定义:
  u! v' i9 W  r0 m% }. y. x+ j  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。   q3 c  n$ M& d/ V4 [2 O1 q
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 + W( n& Z& Y% m' @7 l
  所谓的双方优势策略则是指双方利益总和最大的策略。  - O. l# w+ n* L9 |
[编辑本段]严格优势策略举例分析
  v7 G& z0 W/ i( {- s& w9 D0 u  一、经典的囚徒困境
% l$ p* p0 p' k: o. ~  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: # k$ P% K/ c+ H6 T$ e! G: t
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: + Q1 y: j7 q; \) S( i
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
4 {) P2 k6 W) M/ K- F+ f# T  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
( b% v# W# B: u7 ^+ ?  若二人都互相检举(互相“背叛”),则二人同样判监2年。/ O* ^( p0 U6 s1 V
  
! @- a: G8 a# r用表格概述如下:2 w; ?; e) @, J) R5 T

) S  [& S# T/ G    甲沉默(合作)  甲认罪(背叛)  
$ ~0 V" R, X0 l乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
* h* U  m4 q- b, W乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  ! x" d7 \/ T; @, ?2 n: U0 r% Q

& ?$ W. f8 [9 q: l' _  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 " E* o- R2 y1 y9 K: G. o4 y" [
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
( a4 ]8 b9 o/ A' s$ \  若对方沉默、背叛会让我获释,所以会选择背叛。 , x  ~' M/ X/ J& ]6 K2 w* q+ i" X
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 3 l. Q6 U4 ~* m2 c; w8 [
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 4 T) y" g2 K6 |8 Z$ y
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 # v2 F. v2 A4 l2 I( [
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
* P0 F2 A* I$ u% z2 j0 X% r( A) g[编辑本段]二、智猪博弈理论! Q6 A; W! {/ H: v" d+ x
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 " |2 v- l+ U  q5 Q4 a/ I  T
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
& c9 [9 h% c3 T; R& S* U5 P7 k  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
' S: u9 s+ B; E, l% E/ `7 ]# c) C! N  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 . _+ B3 R- a) T5 Z& D
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
, J! o2 ?% g# G" b0 R  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 8 ^1 |  k3 r' S8 |- P" |" v
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。% L3 q. {9 d/ i2 V0 D$ [) e
  % ?: s! J, `) R- n! K* H  Q. q6 f8 g- a
三、关于企业价格策略1 W: p+ [: ]! f& F! D

, _1 U+ R( x6 g! g: [4 Q, _  
2 n  Y) z6 s$ ]$ W5 @  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
2 _0 D; L" e, t; C8 ?  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);# O( J' q1 \9 s- D7 P  m
  以下三个定义:
6 B9 T% e& Q1 k1 a/ e! f, n+ b  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
6 a/ M, @! ~% z* J- I( k8 w6 Y  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
/ |' w* T# x8 ]: O0 b- r1 G9 z( c( P/ J  所谓的双方优势策略则是指双方利益总和最大的策略。  ! u* S! J0 u( @* |9 C2 I, n
[编辑本段]严格优势策略举例分析
8 r1 A- K7 t  M/ {- m1 B  一、经典的囚徒困境 # t, m2 P7 {" c3 C. b4 T3 m9 C
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
9 a9 l% L6 {$ S  O0 {) Z3 ^* \, C( e  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: : n; t! Q# d' p( S
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
* J! A  S8 i2 [3 s9 O2 |  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ) J: I/ q1 {# p
  若二人都互相检举(互相“背叛”),则二人同样判监2年。& ^8 c- H+ \) D6 X
  
  l3 ?# p6 {5 `; s" b+ |( h" T用表格概述如下:
" E; E0 o# d; Y2 P. i$ C  c4 x- b% o3 f/ Q7 b
    甲沉默(合作)  甲认罪(背叛)  
4 M2 s$ Q& v" n- }* d0 g乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  8 Z# U3 j6 h# a
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
/ p- q2 ]) o" d2 o6 f: q
; E; ~  w, d# a  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
  `9 k* g& I) y0 m  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ) ^! a( H2 I" r8 ?4 D+ X
  若对方沉默、背叛会让我获释,所以会选择背叛。
( h6 m" ~2 S" A% Q1 y  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 * b5 d" H% Y, t
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
; c8 d) m* p9 V' P* E8 b& T  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 4 ]8 y6 g- @7 K. F. {
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。7 Q% {9 W2 U7 z* H
[编辑本段]二、智猪博弈理论
  _2 ^) z, w8 a, r5 B( N3 P  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 & S0 b- o( F) t0 b
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ) Y  D& ]2 C% `9 X
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
; K+ ^' a) y& D0 q  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
8 r  e2 M) `# [4 ^. U) q8 S- P  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 0 V! W2 y0 v$ q. w" {5 g8 L" }* w
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 + c# W7 d0 |. N% R
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
  F+ i' V; |  q- k' \, @  H  
' y4 w+ y1 y* Z( K$ [+ a三、关于企业价格策略* y, I* v8 t; W3 x
- }5 [7 {: M( j; r2 [( D8 P! e  q
  2 q! z4 m) {! k
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? # t- f0 _: \) x* t; [
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
& Y& R) ~: i% {( |) Y+ ?8 G# @& [  以下三个定义:8 ]6 F: w  v' g7 ^9 L5 O
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
0 f- [/ w7 Z5 b  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
% b$ F3 @8 m% N0 D  所谓的双方优势策略则是指双方利益总和最大的策略。  
4 i+ l2 Y0 s' D5 `( I% J' r$ m[编辑本段]严格优势策略举例分析$ t# j2 L6 ~, e; \9 C) S  P# m# X
  一、经典的囚徒困境 - D# x7 X# ]5 p) j
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: # O& a" t( d* g  H& Z' i/ H) Z5 Q/ p
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
' x* A4 @: Q$ f" o) x( ]- |  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 1 S# n2 [1 J, I$ D9 ~9 R; n
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
- E, c3 B; L- R2 z# t. Q5 }  若二人都互相检举(互相“背叛”),则二人同样判监2年。! b$ ], o+ A' _
  / G# T3 V' p5 N. @+ X  u; v
用表格概述如下:
0 j, c+ ^, \$ J8 }4 w2 ~) U$ a
/ b* q# l7 q4 Z9 s& ?4 F$ ]1 u    甲沉默(合作)  甲认罪(背叛)  6 u# O2 t$ W5 L: B
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
6 ?/ L) P3 S2 t* L  ?乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
; Q5 \) G% `# _. Y3 `( [! r. {) a0 c2 N1 e5 a
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 , H* k4 K$ v. ^
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: % B: P( H" I! y2 L* n
  若对方沉默、背叛会让我获释,所以会选择背叛。
# R7 c+ a/ |$ m1 c- k  U  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
" u9 F3 x+ ^0 E- Y+ x  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 1 i( A! s9 Q, V. P& r" b$ _3 N
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 9 J8 N2 {( g2 R: T& e+ f
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。/ j" c( x& V3 _; N
[编辑本段]二、智猪博弈理论0 m% u; \8 K7 J/ \
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。   h. i+ P  S# ^* M: @6 A# W
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 6 Y  x1 @! C# y+ ?
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ) ^+ _: a# L. C# Z6 \- }! Q2 ~
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 " s$ g# _* o) B' j
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ! t/ e) c3 S. l) N* Y8 i2 k# C
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 $ x+ l' C3 L5 ^& `+ _; C& r3 i: Y
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。; m; F2 L  v" {" Z
  # F' p1 h- L& N" B& J
三、关于企业价格策略6 H7 R$ F/ M5 z3 G5 _' ?! H- D& l2 K
2 S: _; P" U( @
  $ ?& W% }9 [! l
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ) t, C, W. `) y- E* R
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
$ f* G8 y$ B+ R  以下三个定义:
1 `1 Z1 ^/ O8 m" F7 W  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
; s: f9 v) i$ {+ y# v9 l8 X- v6 e( t  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
+ S$ D( `  I# p% U( |  所谓的双方优势策略则是指双方利益总和最大的策略。  2 u& h& o. ^. A1 b5 _/ d
[编辑本段]严格优势策略举例分析
2 f$ j: `# j! Y6 J2 y7 z6 h  一、经典的囚徒困境 7 X" ]; N% z6 P5 c' N- a! u
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
/ e+ G" j! e3 n- @1 i; F% L  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ' X* p7 J* b. {3 K2 \) f$ T; K
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 9 r$ A- ~) Z/ j) O
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 1 F6 l  H% r1 z. z1 N3 n# _
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
2 j( X/ S: o8 q  
. i$ j, h7 x. [- j* k( G: P4 Q用表格概述如下:% u5 I. R% z5 _3 B6 H$ m/ }
3 `4 l7 t, U' E
    甲沉默(合作)  甲认罪(背叛)  : y9 v1 A# Q$ r" W
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
# v' z' H9 `4 F+ h, u- R" Z% h乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  8 z3 u7 N$ p5 V! t% A$ v
0 P5 \& Q; {( z& W. h
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
3 ], m9 R8 i/ S* k* g  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
# F( N- v2 S# d5 m& ]! G  若对方沉默、背叛会让我获释,所以会选择背叛。 % j5 c$ ~3 Q9 |9 R# I& }% O) }0 S; \
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
+ t+ n, J) N" V) b* h7 v  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
  Y# ^* \) Y, e  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
1 q  ~; J: G4 _- d9 a" Z  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
" L8 p) X/ n% y5 U% w[编辑本段]二、智猪博弈理论- N' j" L% [. j+ ~  S8 s
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 2 ^* I" ^/ E* @6 ]
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ! _, o. m' o- \
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 " N1 @& f( l, }1 x
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 3 N/ w2 d# R2 U. E5 j4 z
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ! Z; @; N8 N6 ^! h$ {
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
; O9 \: F. H8 s; Z* ?, o4 a8 Z8 e  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。1 g( J9 `) S- A# R$ a9 ~  f4 @
  ' F  E, _8 ~' J5 s  _4 h
三、关于企业价格策略# s& ?" r8 B( `% M, H

+ {# E: ]  {* v9 L  " c  [2 \# ~0 S. n
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
+ I+ c  [4 @( m7 U( H: C  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局




欢迎光临 老秘网_材夜思范文 (http://caiyes.cn/) Powered by Discuz! X3.4