老秘网_材夜思范文
标题:
人生有许多无耐
[打印本页]
作者:
lzqggg
时间:
2015-12-31 11:31
标题:
人生有许多无耐
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
: O3 ?% w/ |& F7 O' u% f3 N
& |4 E, _$ j- m1 I
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
( F# Z% }1 B5 D3 E
以下三个定义:
! S- N( d+ |9 D+ a9 p$ L, o" @* \
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
% h+ A+ x( F Z1 }
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
# B6 `: S' z9 ~! M. C" k3 h+ F+ u
所谓的双方优势策略则是指双方利益总和最大的策略。
$ B8 b0 x }. g+ t. Y5 [
[编辑本段]严格优势策略举例分析
3 I. l: h* B$ Q& P6 {: |/ m6 `
一、经典的囚徒困境
: T" W% T; c& Z' m c
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
! R6 S& R X2 w# q$ p
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
: T$ j# @4 y' F7 O" F( \0 c1 ?. z
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
& j0 G; A; u* Z; b/ ]4 _: Q
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
: }$ y5 C; V1 }, t/ X
若二人都互相检举(互相“背叛”),则二人同样判监2年。
3 g$ `. g7 q! I$ c1 ~
) F9 o% J! R6 b- W/ }0 ^
用表格概述如下:
/ p" H! t- s7 [7 g
! _! g+ }$ d) v( D3 \
甲沉默(合作) 甲认罪(背叛)
! m( `' e( _" M; M! n5 ~) s
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
% i1 D, m; `4 j6 u
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
7 }# G( N& `: D. z
' W5 ^, `6 U7 f; i
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
) G* L9 k" k) j4 p+ t5 _5 y' u8 Y
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
* S( f; y0 _4 ]" K1 ~9 V6 a
若对方沉默、背叛会让我获释,所以会选择背叛。
- Z S) S' z9 Q" ~4 k9 Z/ H& a
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
% G9 n0 c/ ?- r. l% x8 F
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
1 e5 S/ G4 q) H
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
" \4 t% K1 F" B4 x, N+ u3 r
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
. A$ C" }' D( S2 K
[编辑本段]二、智猪博弈理论
* P& q3 C. O! r# Z
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
/ k9 ^ H$ j: s1 g& U" l. @8 A' v
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
' [; P! y7 [( D k
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
! |/ w& p% i+ a4 h/ _" P. e
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
! O2 _( e+ G' p
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
0 [% P) {7 g+ c# n$ K
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
* z+ B' ^7 D) k8 ^" y
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
: D& Y1 S; m3 Y( E! m0 Y5 S
, F. I( m) y" \6 |9 {1 Y
三、关于企业价格策略
/ k8 i4 V* F s% o
4 D- b9 ^' b' ^, O" k
2 h. z, C+ @ A7 W( I) T0 t
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
( }' m# C4 l9 p) ?4 v# R
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
! t4 G& g2 n$ P" Y
以下三个定义:
) d" p/ m! h4 x/ M/ ~0 i
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
9 q5 L4 q# s$ L; y6 }1 c
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
! u H3 r- b7 T) q4 y
所谓的双方优势策略则是指双方利益总和最大的策略。
7 I9 d! j/ b! u6 u2 X
[编辑本段]严格优势策略举例分析
: _2 R0 M: |8 o/ _
一、经典的囚徒困境
0 H7 c# b2 s: { e
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
7 z+ p/ R5 b) v- p6 P; q3 E
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
; L$ C$ g' R! W# z. F) w/ e/ W
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
( W: C% z% C4 k% e% b) P
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
+ j, e6 R/ g7 Y7 X# Q( i; B
若二人都互相检举(互相“背叛”),则二人同样判监2年。
! m2 J3 H+ @1 O/ X& n
. i; I+ j- i' H& B
用表格概述如下:
/ S* `! {% P& F2 }& U% e8 z
. A4 D4 m: o! E
甲沉默(合作) 甲认罪(背叛)
4 g6 ]7 Q4 d: O5 T. z# V- Z7 C
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
+ k2 b: A n6 A, G+ S0 P, @% i
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
3 k* ?. }0 ?1 f" u( ?; r
, l5 x0 b/ s7 {+ J
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
+ w8 X/ I& L5 k. f8 _0 _
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
+ F( h, z" }2 c. p P5 o
若对方沉默、背叛会让我获释,所以会选择背叛。
* b3 Y5 l; [( l: p1 K. ^. Z
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
, E' p0 `, b+ \- s( U) x: {8 X
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
/ L" B& s5 x% s: ]- a
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
v; V) z B# B: Q* C
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
. x) e7 v3 }1 f1 s7 b6 g
[编辑本段]二、智猪博弈理论
& N( q% X$ e. x& L* }& A0 ]* X o
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
5 n& d& [4 w) E2 J
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
) H8 U, r8 l t6 P7 `
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
# e. B5 s7 Q$ t2 A
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
% \0 B5 f, i8 S) i
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
! T! l" S& \+ ^, q% i8 _+ u5 l+ }
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
8 X# b9 J3 d! D( r8 N: k! h5 j4 y! o; T. O
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
% O8 ~# m7 M6 X
9 d& R; m4 O" p) v5 H- e) F( h
三、关于企业价格策略
3 M' d9 b9 R# T2 @! g
/ H$ w5 c+ t/ s' X3 ~2 w0 ?
; p/ B5 g) d6 e, R9 \' U1 {) N8 V5 f
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
0 t, i# q3 ^1 u1 d2 `. h0 A# [
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
: Q3 N3 F4 n4 x/ J, j- v. C2 \
以下三个定义:
# f n( ~: v0 O6 a" {, [0 }
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
: o5 y/ H; Z6 B* Q* h/ X" L6 p& S1 j
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
, u! T# N5 \: y0 V
所谓的双方优势策略则是指双方利益总和最大的策略。
$ ~$ b% w. m. J5 K/ G5 d
[编辑本段]严格优势策略举例分析
/ w+ ]! F: O2 v U1 E
一、经典的囚徒困境
+ R( [$ e, h. Z( Z* S& M' ~
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
1 x. v) p' p/ B
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
& O- r- o! c3 S0 G
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
2 `) }2 {1 Z. C6 Y: ^" r
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
3 `0 c* |0 D+ o& }3 j
若二人都互相检举(互相“背叛”),则二人同样判监2年。
( U- B9 w0 y3 o
3 [2 J: s+ B0 T5 q! T4 Z
用表格概述如下:
0 s( A8 T# P, J9 W3 N9 k
1 k) c" W' e8 R4 f5 _% f' s2 P
甲沉默(合作) 甲认罪(背叛)
* s/ P) y( }7 `: }2 ?* u
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
; v. u: [6 v+ q* p7 t
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
* |# S. [, a( l3 {
, n( z/ W! r9 J3 ?: s
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
* k& s5 E- }, l- V$ J# ?$ J6 b
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
# W" C3 `5 h( d, O! B* {
若对方沉默、背叛会让我获释,所以会选择背叛。
* `7 G% _# m, h G
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
" z8 a) { _& l5 h4 n
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
2 N3 V" i+ t; ]% r8 z3 N; j5 c
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
7 a9 A5 A0 U1 L5 f
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
& h. o. ~8 }7 t% M6 Q
[编辑本段]二、智猪博弈理论
' h+ J" m- H4 |3 `, M
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
+ b/ E3 R" n* c6 i
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
: q0 \6 C8 @% W0 ~& k" O
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
+ i" t: S& {% P+ I% ]
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
& [( M$ y* N. F1 o9 F' r
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
$ d% B+ h6 J# g
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
! n) w! }8 H8 ?7 d: Q; U: I* [: N q
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
$ {4 U* r" g# R5 \
( S7 C6 V0 D! v5 ^1 q5 T3 a' F& X
三、关于企业价格策略
$ ? W! D2 U+ ?9 {, `% B/ k& T
" @% G2 p7 N. E% C2 I+ n
: R2 b9 |/ Q# d. ]5 c2 ]9 E" c
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
5 E, l+ E6 Q$ x8 R- T0 [
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
3 ?# Y" S5 P0 ~- j3 S v
以下三个定义:
$ n; t4 a$ T3 W& l! l, z; K$ G
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
% f& E* X" o3 P6 ^
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
* l3 K* T0 D5 y9 {+ K0 y
所谓的双方优势策略则是指双方利益总和最大的策略。
% Y0 h! @2 ^8 n$ t, |9 P9 o- T
[编辑本段]严格优势策略举例分析
0 p* F) y4 J0 a' z7 A6 J
一、经典的囚徒困境
- n0 t9 W- y7 G+ u, {
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
N1 ~5 u7 S: X4 \) n$ K/ U7 D1 C
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
/ {8 J w1 s N% D7 F; Q
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
7 O0 x# @/ N2 t7 G
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
6 l8 b* m8 G" C! c9 ?$ K& v
若二人都互相检举(互相“背叛”),则二人同样判监2年。
/ Z$ q1 H+ `8 E- A
) I% v+ {3 K' c8 d" s9 D
用表格概述如下:
; q4 v" L; N: N$ \3 P8 e) Q* }9 S
4 X5 |; v6 C8 W
甲沉默(合作) 甲认罪(背叛)
, R/ w, m. W* Z) H$ @
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
6 _3 ~ e4 Z' P1 Q3 V/ a' ~( H
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
1 i) l" a- O; A# ], i! X6 M
' w3 X3 y; b8 u" |+ I0 }* X
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
}" @5 ~1 J$ n
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
" b2 @7 L! |# J' O
若对方沉默、背叛会让我获释,所以会选择背叛。
5 s, F% h6 j3 |7 t x. }7 e5 y
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
0 F L; D' M8 B- f+ p& q
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
$ k. @- ]+ E% ?2 D: b5 Y
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
s3 y/ `6 }( I( \$ z/ r7 _
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
) @8 C8 h7 V* U3 t* K
[编辑本段]二、智猪博弈理论
6 G: ~7 H- Z+ E( q- B$ J( G% |
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
( v" l. \" R2 F& m
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
, i/ i: h) F2 O) Z1 ?9 K+ k
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
8 C* S8 U" U) q0 @+ a
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
4 m; a- ], t# ]6 l2 c
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
# G' k- G7 J) D; \5 f
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
- M! h2 s& X0 W
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
" l& b! O' Q4 d8 i0 u, W% `% x
# V1 b" z7 }) M) h' M$ W+ S
三、关于企业价格策略
/ E6 X; ~# O% o5 E' r1 ^5 X
, Q& L8 q+ [; b7 l. D: b
9 X- t; P( O5 T" C
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
, E0 C# A; A* X9 @% M$ ~. }8 P
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
欢迎光临 老秘网_材夜思范文 (http://caiyes.cn/)
Powered by Discuz! X3.4