間違ったゲーム理論の解説:その1


日経ビジネスアソシアは出た当初から「なんかはずしてるなあ」と思って横目で見てたんだが、明らかに間違ったゲーム理論の解説をしてたので、つっこんどく。ちなみに僕は大学時代にゲーム理論を習っただけなので専門でもなんでもない。


もっとクールに仕事をするための使える「ゲーム理論」<第2回> (ビジネス基礎体力)
http://business.nikkeibp.co.jp/article/skillup/20060824/108569/



最初のケース:「支配戦略」と「ナッシュ均衡

Q.ライバルも出店を考える中、どちらに出店すればいい?
T社とS社の2つのコンビニチェーンがA駅、B駅のどちらかの駅前への出店を計画している。A駅前に出店すれば1日に700人、B駅前だと300人の来客が見込めるという。互いに別々の駅前に出店すればそこで見込める客は総取りできるが、同じ駅前に出店してしまった場合は想定顧客を半分ずつに分けてしまうとする。あなたはT社の出店責任者だとすれば、A駅とB駅のどちらの駅前に出店するだろうか。


これは利得行列を書けば一発。T社、S社ともにA駅前に出店するのが支配戦略。つまりT社はS社がどっちの選択をしてもB駅前よりはA駅前のほうに出すほうが利益が大きい(350>300、700>150)から、どうあってもA駅前に出店する。S社も同様。なのでこの場合はA駅前で二社が並ぶ。これはナッシュ均衡であり、このケースは正しい。ただ次の例からがおかしい。

S_A S_B
T_A (350,350) (700,300)
T_B (300,700) (150,150)

二つ目のケース:「混合戦略」で考えるべき問題

Q.A駅600人、B駅400人ではどうなるか?

この利得行列ではT社、S社とも支配戦略が存在しない。こうなった場合、本来は戦略の確率を考えた上で、その期待値を最大化するような「混合戦略」を考えることになる。T社、S社に支配戦略がない以上、相手がどう出るかは確率的にしかわからない。


この場合では、T社がA駅前に出店する確率をp(0≦p≦1)、B駅前に出店する確率を(1-p)、S社がA駅前に出店する確率をq(0≦q≦1)、B駅前に出店する確率を(1-q)として、それぞれの戦略の確率と期待値を求めるべき。細かい計算は省くが、この場合、ナッシュ均衡はp=q=4/5で、そのときの期待値は360。この場合、T社、S社ともに5面体の鉛筆でも転がして出店戦略を決めることになる。


このケースでの利得行列を確率と併せて書いておく。この確率に従って加重平均すれば360になる。

S_A S_B
T_A (300,300) 64% (600,400) 16%
T_B (400,600) 16% (200,200) 4%


で、この記事はここで大きな間違いを犯している。

 双方が別々の駅前に出店するのが最良の結果となる。両社がともにA駅前に出店して客を分け合った場合、1店当たり300人の客しか獲得できないからだ。それならB駅前に出店して、400人の客を独占する方がマシである。

これは間違い。もし別の駅に出そうよという話を両社がしたとしても、どちらもA駅前を譲らないのでこの話し合い自体意味がない。この利得行列をゲーム理論で考えるのであれば、両社が妥協することはありえない。

自社が600人の利得を獲得するためには、他社より早くA駅に出店することが条件となる。

で、もっとひどいのがこれだ。もし、自分のほうが早く出店戦略を決められるのであれば、これは利得行列を使った分析ではなく、デシジョンツリーを使った分析を行うべき。利得行列を使う場合、普通プレーヤーは同時に意思決定することが前提だ。


出店戦略を相手よりも早く決められる場合のデシジョンツリーは次のようになる。

                  A
                 /パターン1(300,300)
   プレーヤーYの決定 □
               / \パターン2(600,400)←これが最適戦略
              A   B
プレーヤーXの決定 □
              B   A
               \ /パターン3(400,600)
   プレーヤーYの決定 □
                 \パターン4(200,200)
                  B


このデシジョンツリーでは、「Backward Induction」といって、後ろのほうから考えてどのような戦略になるかを考えることになる。


まず、パターン1と2の括弧の後ろの数字(これが後で戦略を選ぶ人の利得になる)を比べると、パターン2のほうが大きい。なのでパターン1は消す。次にパターン3と4を比べるとパターン3のほうが大きいので4を消す。そして、パターン2と3の括弧の前の数字(これが最初に意思決定できるほうの利得)を見る。するとパターン2のほうが大きいから、最終的な戦略はパターン2となる。


つまり、「出店計画を先に決められる」というのはゲームのルールを変えたということになる。だからこの記事からビジネス的なインプリケーションを無理やり引き出すとすれば、「他社より先にいい物件は押さえろ!」というもの凄く当たり前の示唆が得られるわけだ。



三つ目のケース:「囚人のジレンマ」の間違った例


こんな有名なケースを間違うのもどうなのよって話なんだが。この記事では次世代DVD規格を例にとって説明しようとしてるんだが、これの説明の仕方がすごく間違い。


まずこの記事に従って利得行列を書くと以下のようになる。

譲歩 拒否
譲歩 (6,6) (2,8)
拒否 (8,2) (3,3)


この場合、両陣営にとって「拒否」することが支配戦略になる(相手がどう出ようと譲歩よりも拒否のほうが利得が大きい)。そのため、両陣営が歩み寄ることはなく、結局協力するよりも低い利得にお互いが甘んじるという結果になる(パレート最適ではない均衡になってしまう)。これが有名な「囚人のジレンマ」だ。このケースで両陣営が歩み寄ることはゲーム理論上ありえない


ゲーム理論を謳うのであれば、この記事の結論は「だからBD陣営とHD陣営が歩み寄ることはないんですよ、バカですね」としなくてはいけない。


では、この記事で言っている「双方が譲歩して“中間的な規格”に統一すれば消費者は混乱せず、市場が盛り上がるので利得は(6・6)となる。双方が協力することが一番好ましい。」という結論をゲーム理論では導き出すことが出来ないのか?


いや、できるんだな、これが。


そもそも、この記事のケースでは、この規格の対立を一回限りのゲームとしてみていることに注意。この一回限りのゲームでは協調することはありえないんだが、通常ビジネスでは将来にわたっての競争や協力関係が存在するのが普通だ。なので「囚人のジレンマ」を繰り返し型に拡張してあげれば協調的行動をとることが合理的選択になることもある。このケースで言えば、いずれまたなんらかの規格上の対立がおきることが容易に想像されるので、お互い歩み寄って繁栄を分け合いましょうや、という合意が成立する可能性はある(ただし有限回に限定するとこれまた「囚人のジレンマ」は発生してしまうんだが)。


このへんは「しっぺ返し戦略」とか「パブロフ戦略」とかでググれば出てくる。




ともかくも、この記事はひどいねえ。引き続き、第3回目の記事の間違いも突っ込んでみる。