本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
0 O' ^/ @: s4 q1 l7 O. f: \3 j8 n; K( Q; {% u+ T& \
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
, G# ~) D+ U5 p9 h9 U. R$ H4 p6 U 以下三个定义:8 C! c) U# v% M4 }$ Y2 h( W
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
( C, Y! Y* l* r" _7 ~# y; A9 V3 Z 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 4 ^) C1 Z; x$ a K% ~8 h
所谓的双方优势策略则是指双方利益总和最大的策略。 ( m1 c" N# H8 l/ U/ c) F7 ?
[编辑本段]严格优势策略举例分析
7 D( |6 {' x6 j' m 一、经典的囚徒困境 , ]+ l- C* a5 o
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: " Y8 C$ K2 k5 s0 _5 J
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 9 N2 x4 ]$ O1 |6 z( |1 {
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 / l' p9 r6 j* W; ~: \
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
; X' H) y1 q2 r8 \: |% d+ H 若二人都互相检举(互相“背叛”),则二人同样判监2年。6 C/ y, E% ^3 Z) g
/ n* O( N% S" t" n+ v3 p" `1 [ R3 ^
用表格概述如下:
8 ?8 U; E' \% d7 V2 F7 i# B j2 I" O0 G
甲沉默(合作) 甲认罪(背叛) ' c& H; ]3 H8 A n# V; v
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ; b) R) X- [- A( l- ^
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 - `- g9 I# C \8 j" e9 e3 D
% a% A" h, ~ q9 L: \* x
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ( l' w5 ~+ k9 \ E8 M
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 6 v! Y! W& d7 V1 s. L0 x
若对方沉默、背叛会让我获释,所以会选择背叛。 6 ]2 i# _$ g3 C$ u I, W- ?6 M; N' Y
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 8 x* C) k8 n, v, U
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ) \' V! ^5 I8 t2 G% M# o& u' O
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
6 r! S# H, r B ~ G 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。! M2 I2 Q* I+ H+ u o! e9 ^
[编辑本段]二、智猪博弈理论$ Q2 h" \4 l" Q! d. k0 I2 T
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
- H! `! ~$ l( b0 }% }4 Q/ m 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
" V; n5 ?; |, Q2 q 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 4 J! V( r" p$ Q( b$ o
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ' `3 `: D, j& I
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ! T9 f# x1 D! V _# W% V
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
9 z* Y" W2 d1 K2 U R4 M$ W( S+ m" } 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
3 k# ^* |" r/ r* u& H
$ x- q) M1 O5 `8 E8 ]. G6 ~' B6 Q三、关于企业价格策略0 _- u5 X, w. w6 q- ?5 [
% E* u4 O. n8 {% z
9 E% z1 ?2 Z2 {: F$ q* L4 I 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
, H& W6 u5 v+ N0 C- t 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy); `, d7 J6 r0 z' ~' b
以下三个定义:
! R3 ]" i9 {4 B+ ?5 [1 ]0 e 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 8 }: S+ _% M# q- ?5 d" Y
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 * ^* b7 J$ c( V# q4 H
所谓的双方优势策略则是指双方利益总和最大的策略。
' M- G3 g3 K! y3 s1 U8 G[编辑本段]严格优势策略举例分析
# Z3 `* a+ o. ^% b 一、经典的囚徒困境
( L( I8 ]' f% i 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: : R3 b5 _% V! r5 u1 w
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: : m& N7 z) r/ d2 x
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 : w) k3 G5 b' V; z3 f; F
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
3 b3 c* m2 c- S" ?. N5 u) _' } 若二人都互相检举(互相“背叛”),则二人同样判监2年。
8 L& D$ v e2 N0 H7 y$ {. v7 D 3 ?9 `% n( C0 ]9 R
用表格概述如下:
x, K8 v7 ^% j0 ~7 I) C
1 {4 c0 e1 a, A# e( ` 甲沉默(合作) 甲认罪(背叛) ; {4 { l6 p8 S1 ^# V# k( P5 c$ m
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
$ T+ a( @; o0 \乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 3 j# T$ w& n! v, ?% t4 B! q
% k. V) J+ m* m: S x 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 3 i8 r9 t5 ?) F
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
) }% H( k% U3 `- F8 h+ x2 R* `# n+ K 若对方沉默、背叛会让我获释,所以会选择背叛。 , r% a/ `/ ~: O" f2 ~8 \; s
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
, M3 I$ c; y9 F% z4 ^ 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
9 S4 m1 q: ]: g* b+ _1 m1 j3 q 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
; u9 ~8 M2 P' O/ B; u) u 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。7 P- O1 o. o9 P6 k5 `9 r
[编辑本段]二、智猪博弈理论9 c; r& ^' a5 T+ I0 T' e
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
9 D( _# y& \! G* Y2 P& f8 k 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 8 t) Q/ P$ i! k* Q
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 - Y' z% w/ b" A- t8 v
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ! h/ G, N+ p% D; v
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
; i9 D( T) ~4 y% W. V; h 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 7 ]' }3 O( \- u) d
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
* l7 [# ]& o1 t8 k) t5 H
7 p) K- i+ m( h" w4 y h三、关于企业价格策略 I' Q, s: t# b
H$ R6 Q7 ~7 x1 b- a
5 L8 m3 q8 Y: S- J+ X1 C 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
7 ?, c1 ]# z$ Z. z 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);5 W4 _ x! A# ]$ w: o( x
以下三个定义:' b7 L/ B! O5 k$ q9 I. i1 W
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
0 S) w3 m6 z0 S# a, }; p' ^ 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 " p2 O3 l. n1 Q7 T3 I! o
所谓的双方优势策略则是指双方利益总和最大的策略。 ' V7 p) a! n8 ^, r
[编辑本段]严格优势策略举例分析& e" k- |7 D# Y! i5 n5 \
一、经典的囚徒困境
2 I: D5 Q3 X, x' \2 R2 l& t7 w 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ; Q( D* W$ R+ t
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
* _) ]) Y" i/ q' U% l- }. Q: q 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ( U$ ]. Q$ ~/ h+ \& ?4 f# A
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 * \7 ^- D7 ]- @* |4 t" o0 g* q+ G
若二人都互相检举(互相“背叛”),则二人同样判监2年。
: b9 }' H! b: V5 o2 c7 S! `. H9 J ; l% W* P/ ?5 ^
用表格概述如下:# L# F) l% b8 e9 B0 c( j
- c( ~5 R9 q7 H 甲沉默(合作) 甲认罪(背叛)
% T# w$ x8 t( Z6 B# Y6 M乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 S) h+ [5 h A6 w7 O
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 " C. F" @: {: b* q" m% G
( G% N2 Q! Y8 K& w0 j& E3 R: v 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 1 j) G# D! g6 {9 D3 @8 i
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
% ^7 T& Z6 [9 p& _3 k 若对方沉默、背叛会让我获释,所以会选择背叛。
- \5 m! t8 a: q" F 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 2 u) s+ n7 g! G5 o( M
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
/ t& [6 B; ?9 A$ o 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ) K- c$ e& i1 z8 g e
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。! T' @. |9 C7 Q2 A& d8 g8 q" o
[编辑本段]二、智猪博弈理论" h( |6 \9 R5 y" e4 Z
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 + W( [) k7 m9 H+ L% e/ B
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 " p* ~8 Y4 O0 v3 y1 E
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
8 ~7 I! o. {% D* S$ i8 z 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 " G- I! R) Q' @( u* T
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 + Z, W5 o- ?5 Q2 m; ~6 P* b5 c
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 % z- M+ q3 H8 A9 i$ E; v5 Q, u8 t
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
; w: R. M$ v" g6 U7 z Y. ~2 G
% t; d7 ^4 ]! g- x# ]% D三、关于企业价格策略8 X8 G s: y! [. j
8 m# X: ^1 a( o' j2 U) q
6 I; F7 @& u2 P6 Q3 n, K
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
( B! A% q, p: t2 Q c0 e& A. A 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);5 `% a% u5 F6 M, Q# E0 j# R, G
以下三个定义:
' \* A3 N1 l; F0 ~$ X 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
1 I% g* r+ d. G' e6 w1 y* F+ n 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ) r0 [# k- }2 n$ }# N. p4 e
所谓的双方优势策略则是指双方利益总和最大的策略。
- [/ U1 h2 q+ \; M[编辑本段]严格优势策略举例分析; I& T$ l" R9 g* V( ^; w$ [# u1 l
一、经典的囚徒困境 . ~, U& V. h5 o8 @$ |. Y
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
0 _# n" N' [3 Z7 D- F4 o3 A' W 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 7 v6 `: I* O# o- l
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
7 Y1 u! E0 I* i1 A, S ~# \ 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
, r* \; C5 J* W8 j# y 若二人都互相检举(互相“背叛”),则二人同样判监2年。$ E4 ]2 \ g' V$ C& b4 X
! b9 ]9 M9 Y* A6 W9 B( I0 P t用表格概述如下:
- M* w* z5 I1 d# j* w2 |8 t8 ^9 z+ K _
甲沉默(合作) 甲认罪(背叛) ! }! H. p2 t+ E5 Z7 t6 n) v
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
i: b, W! P( Z5 q* Z' m( ^6 I乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ) O' w' D# O$ d' k( _9 N3 O
% n2 J, w7 a( w 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 1 j# {" r: c& L( C" g/ A( f
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
2 O |$ q5 H2 a0 B5 E 若对方沉默、背叛会让我获释,所以会选择背叛。
9 _% m% } F( ^9 ]) ]6 S9 } 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
/ S- ? H5 J' w* u; S 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 6 q8 {7 ?& C8 `# W9 V7 a5 n, V
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
! z8 M- I9 K, ^9 c) m6 R 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。* B/ T; l5 o% m7 U* [% @6 [
[编辑本段]二、智猪博弈理论
/ D) }& U+ H3 ~6 O# u) d4 } 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 : u0 D8 T' c. t$ l8 |: ~! p4 ?7 P9 ]
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
$ v7 r7 M! z* ? c& Q. I* J 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
. ~5 ~" U& K! p" l3 ] 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
! v, y# _/ u) P" ]; V9 L9 n+ h “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 8 m; T2 o ^; a8 `0 L4 \1 G
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
6 G i w9 R5 Z 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
; N$ }0 m9 x' T0 r$ {5 i5 d( w/ [ 6 ~. |* T) v& C6 v
三、关于企业价格策略& ^, S3 A4 i" \* i: G
6 U/ [* `9 f5 P; }0 @4 W/ C
5 S4 w/ M- J; I% ^
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
$ S# N! b8 E S, q# R* K1 |- } 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |