老秘网_材夜思范文
标题:
人生有许多无耐
[打印本页]
作者:
lzqggg
时间:
2015-12-31 11:31
标题:
人生有许多无耐
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
7 T* p! i- j( b2 T( C9 A
+ _$ Z* K, U: d' L. E! ?% }# t
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
; \$ O) p0 ?* t- p: _& }
以下三个定义:
* y+ a/ ?# }$ t& R
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
* h" |1 f! j& B+ X
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
( ?: N# ]7 _9 R, r$ B# A2 w
所谓的双方优势策略则是指双方利益总和最大的策略。
! u: h, V' N* Q) b8 G* M
[编辑本段]严格优势策略举例分析
% U. _8 J% ~( C9 U+ }, P$ I' z
一、经典的囚徒困境
% ] F T7 G, K: J' P! X
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
; d: J( [9 @3 D5 _- x
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
n- g+ j8 v6 J3 y1 |% @8 N) G1 R
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
5 c c3 V* d3 L; }# }
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
$ M3 E2 ^# o% M) C3 r
若二人都互相检举(互相“背叛”),则二人同样判监2年。
) i- p$ Y% w0 a
; {6 q( A& U, H
用表格概述如下:
# c! V1 D& L) r$ d" ~
9 G8 G# s$ Z; y2 ~+ M' _4 \
甲沉默(合作) 甲认罪(背叛)
8 R$ n4 n. ]1 \
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
3 g9 Q- N8 |' V! J6 x' V0 k. N+ h2 M1 L
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
( v7 K, z; O8 w# b! h
* d1 ~0 \7 m6 B: z& b% v
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
8 {% r" O, q. x9 a
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
/ l. j; E( C1 t
若对方沉默、背叛会让我获释,所以会选择背叛。
3 T) K3 N) V0 y2 |- h$ ~
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
- `% S" h( g& L# i9 H. k3 Y! x
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
0 y/ Z( U0 `5 O9 V v
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
7 e' `9 O ^( m5 l
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
I( ]/ t4 F9 @7 e+ Z( u2 o
[编辑本段]二、智猪博弈理论
! p' \# k0 g2 W% A9 k
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
! c- S6 t2 v" v
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
8 `: w2 x, l0 ?
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
1 W7 ]8 f' [2 ]' V, B
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
0 M! {' |% P4 D' g2 p# E
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
* H) Q- E. F8 a( v3 G$ W* C/ D
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
" z3 K. \* h: A) E0 k# w5 R5 h. c
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
t7 r# o0 ?4 \7 s7 f
0 _7 o8 E% g- Y' }) f3 t8 T5 n0 t3 a
三、关于企业价格策略
! I3 D. w% j/ x
2 D* ?" l$ G% i
1 {3 R# ?% m# M5 e8 o
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
0 s7 x' E3 V6 p: d1 L3 m
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
i) v% A1 O1 P' Y9 G
以下三个定义:
6 E6 z( ?7 t( u! \( S/ I5 t
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
; c* ~. C6 K3 H4 A# |3 j
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
3 \, H) W$ N, c# U0 ]# H
所谓的双方优势策略则是指双方利益总和最大的策略。
8 n7 V7 m: j8 u; F- @
[编辑本段]严格优势策略举例分析
y9 d5 g& ]% B, {& v
一、经典的囚徒困境
) [6 M6 \- A! p9 r/ C9 u
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
: x) `# p* Z) Q9 V7 a* p$ E. ?8 E
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
6 V3 o! a1 } V {3 L7 H; J6 o3 e
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
; f% I1 x' J( y" m- A, H* Z2 e
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
8 Z8 H* g$ W3 C" _
若二人都互相检举(互相“背叛”),则二人同样判监2年。
8 Q+ M2 _9 c) A$ p0 |
2 }: i0 ]# k. p% O# l
用表格概述如下:
7 I% |! l6 a. k7 v, t' E! v
* C6 [3 U- q, F. }
甲沉默(合作) 甲认罪(背叛)
+ w! n% j8 e7 c" T6 b- E7 _! h" {
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
% h. r n* b( N8 {8 E2 {: Z* i
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
& I1 |! l( o! g
- R5 i1 z3 C8 Y# [. M! @
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
9 j" `1 q3 m) J+ p; }0 ]. K3 L' N
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
" Z# {7 x# L% y% g
若对方沉默、背叛会让我获释,所以会选择背叛。
) T+ A: }9 y% }6 l$ g
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
. ~9 r& H0 l, j) v
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
0 j! C' a2 Z; Q+ S8 f. n8 R
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
/ g0 u9 C# x" J! @3 G
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
4 v1 q$ L' F/ J
[编辑本段]二、智猪博弈理论
; H% p* X1 G$ s$ B! {2 [
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
# D7 K" {! Z; L* m4 [
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
. C) Q; S9 K6 v! n8 s( n
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
: }' O. k* w) O5 @
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
9 o# F3 P5 J- M5 L9 j0 b/ V
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
3 b( @3 i; W4 W6 y
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
3 f. ?/ r* r4 t4 [( \/ f) E3 q& p
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
# f# f: J6 ?2 o5 Q" m) L
/ }/ u/ |) B& n+ C& L
三、关于企业价格策略
1 w8 j6 m+ J: P- I6 j2 K m
}. x# W" N% |' a) g; T
; m }9 D4 u: k+ l# L# ~! N
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
5 j9 d0 c2 ~5 A
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
0 S# q1 [8 x" M4 T( ~9 h0 O
以下三个定义:
3 F' s6 M9 ]$ d( j+ s
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
. \7 k: o9 g- N: Q7 i+ B: O
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
. q- U f" b" w% l' E
所谓的双方优势策略则是指双方利益总和最大的策略。
! q$ y' Q, S" Y8 s2 E8 H
[编辑本段]严格优势策略举例分析
' c B+ w) ^, v: U' g8 m$ G
一、经典的囚徒困境
2 g2 f4 X0 @7 f& Y7 r2 j1 @6 J: r7 H
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
: H" v( j1 z7 j: F9 B
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
' R+ f4 J. u/ ]$ r- k% L- y& |
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
- ]9 U3 ?4 Y6 B8 B% `" U% u0 e7 i
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
& v& I8 U% E9 A7 S; d! n. p' t
若二人都互相检举(互相“背叛”),则二人同样判监2年。
% G4 |' ~" Z# m8 V
) E# d* ]$ d5 F; a& C: D
用表格概述如下:
7 v# g' R/ U/ w9 o+ _3 ?% K
/ [; p: E( e' g% t
甲沉默(合作) 甲认罪(背叛)
# m& y3 L3 F) A s# G% I1 d
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
" J& s1 ]& q9 f) H. g% q
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
# E4 N$ g5 Y/ b, X" C3 A. m
/ c, M, b- A$ }2 {, x' {* S0 w7 N+ V
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
2 G8 S* ^( h6 L
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
6 [ n# e, \; W& C( s0 W
若对方沉默、背叛会让我获释,所以会选择背叛。
6 `. F/ C- i7 E7 j5 t( B+ Z
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
0 l( |; Y @ H& ^
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
; I+ {1 {# W/ N6 j, F
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
9 D% r* n) q5 [! s0 ~1 N
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
; t6 q* F* Z* i% d( |/ u
[编辑本段]二、智猪博弈理论
: U* A! P2 H& Y) u0 b/ \' q2 O
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
7 T: u* K. [" \9 E. W! p! C
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
( ?/ L- _5 ?' O7 k: D2 M
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
3 u+ w" p) r4 j8 A) S# @
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
% P0 }# q" U5 h( s! Y( [
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
2 L6 a1 J9 Y4 F* V B& x
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
5 [% j7 c9 u) z5 |* {
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
6 |6 f; {/ K8 u6 Z4 a, N4 o1 b
! V0 K$ u4 e) ]
三、关于企业价格策略
/ C% d" o: Q( |- ~: _
- S9 J% R I6 u$ Z3 o
3 e A5 v! D- X+ L( u8 u
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
% G5 Z+ J% W' p1 L: h' Q& b
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
+ b& ^; R( K: P$ F+ x& n; ?
以下三个定义:
( c U" c8 o1 b) r& Q6 i) { ~. ?
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
1 [: y6 p7 K/ |
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
0 p7 y6 N, u( R
所谓的双方优势策略则是指双方利益总和最大的策略。
& }8 I% {$ v6 G7 G- _2 ~, v! |
[编辑本段]严格优势策略举例分析
- B ^+ g( F2 N# r8 t, t; W9 j
一、经典的囚徒困境
! V+ Q; j3 P ^/ f
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
8 T) ?! \; O( ?
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
2 U; R3 E8 a; k3 s5 V7 M& r
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
# V9 G' C, Q+ o# I* @3 I* q
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
: s# r* s% N7 }- s: a7 x
若二人都互相检举(互相“背叛”),则二人同样判监2年。
3 ?. _; n" G) W+ M+ _# v8 S
0 \5 t( h; S% ~# X, Q J
用表格概述如下:
- G' o7 J; P: U' J4 b
! Q3 i I+ b+ d5 V. v% L8 o1 W
甲沉默(合作) 甲认罪(背叛)
: J' n9 Q" B0 @* v& x
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
) v. W, m* v2 s
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
- R+ _* y( S. o1 V
: D% w D4 D! [/ {0 A$ R' C& H
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
- Q i9 k$ |& U- m
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
& Z" Y* `7 ]( G, e2 B# U, g5 ?
若对方沉默、背叛会让我获释,所以会选择背叛。
$ n) j3 q; x6 _
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
' \; F3 J+ l$ s, a
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
+ K, P+ Z3 r8 x, E
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
# v9 N6 A- ~, p" ]/ o W1 d
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
5 _2 s: l+ g+ d2 c6 [1 e$ `$ f
[编辑本段]二、智猪博弈理论
- ?! `( c: B6 v) r% v
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
# |( ~8 V4 z" |2 ^# s+ g- r, W9 A
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
, N( H% N2 v; `- d4 z" U
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
. o- J& S8 d+ Z0 E6 W2 t
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
6 h+ \2 y! i. a5 q, d
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
) y) g' D+ e) X1 \
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
6 b* t/ q. N) A( h
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
( I. B6 O5 t$ O& p% o0 G# p) `8 U
' k: L9 S% L$ e8 [( H, `* }
三、关于企业价格策略
& G0 z/ Y5 K4 {1 ]
7 ]+ A% v. V) Z
! x) [) c6 R v+ a8 i9 _6 R& E
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
" \$ i' C9 [" \$ q! v% k. R
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
欢迎光临 老秘网_材夜思范文 (http://caiyes.cn/)
Powered by Discuz! X3.4