間違ったゲーム理論の解説：その１ - I 慣性という名の惰性 I

日経ビジネスアソシアは出た当初から「なんかはずしてるなあ」と思って横目で見てたんだが、明らかに間違ったゲーム理論の解説をしてたので、つっこんどく。ちなみに僕は大学時代にゲーム理論を習っただけなので専門でもなんでもない。

もっとクールに仕事をするための使える「ゲーム理論」＜第２回＞ (ビジネス基礎体力)
http://business.nikkeibp.co.jp/article/skillup/20060824/108569/

最初のケース：「支配戦略」と「ナッシュ均衡」

Ｑ．ライバルも出店を考える中、どちらに出店すればいい？
Ｔ社とＳ社の2つのコンビニチェーンがＡ駅、Ｂ駅のどちらかの駅前への出店を計画している。Ａ駅前に出店すれば1日に700人、Ｂ駅前だと300人の来客が見込めるという。互いに別々の駅前に出店すればそこで見込める客は総取りできるが、同じ駅前に出店してしまった場合は想定顧客を半分ずつに分けてしまうとする。あなたはＴ社の出店責任者だとすれば、Ａ駅とＢ駅のどちらの駅前に出店するだろうか。

これは利得行列を書けば一発。Ｔ社、Ｓ社ともにＡ駅前に出店するのが支配戦略。つまりＴ社はＳ社がどっちの選択をしてもＢ駅前よりはＡ駅前のほうに出すほうが利益が大きい（350>300、700>150）から、どうあってもＡ駅前に出店する。Ｓ社も同様。なのでこの場合はＡ駅前で二社が並ぶ。これはナッシュ均衡であり、このケースは正しい。ただ次の例からがおかしい。

	S_A	S_B
T_A	(350,350)	(700,300)
T_B	(300,700)	(150,150)

二つ目のケース：「混合戦略」で考えるべき問題

Ｑ．Ａ駅600人、Ｂ駅400人ではどうなるか？

この利得行列ではＴ社、Ｓ社とも支配戦略が存在しない。こうなった場合、本来は戦略の確率を考えた上で、その期待値を最大化するような「混合戦略」を考えることになる。Ｔ社、Ｓ社に支配戦略がない以上、相手がどう出るかは確率的にしかわからない。

この場合では、Ｔ社がＡ駅前に出店する確率をp（0≦p≦1）、Ｂ駅前に出店する確率を(1-p)、Ｓ社がＡ駅前に出店する確率をq（0≦q≦1）、Ｂ駅前に出店する確率を(1-q)として、それぞれの戦略の確率と期待値を求めるべき。細かい計算は省くが、この場合、ナッシュ均衡はp=q=4/5で、そのときの期待値は360。この場合、Ｔ社、Ｓ社ともに５面体の鉛筆でも転がして出店戦略を決めることになる。

このケースでの利得行列を確率と併せて書いておく。この確率に従って加重平均すれば360になる。

	S_A	S_B
T_A	(300,300) 64%	(600,400) 16%
T_B	(400,600) 16%	(200,200) 4%

で、この記事はここで大きな間違いを犯している。

　双方が別々の駅前に出店するのが最良の結果となる。両社がともにA駅前に出店して客を分け合った場合、1店当たり300人の客しか獲得できないからだ。それならＢ駅前に出店して、400人の客を独占する方がマシである。

これは間違い。もし別の駅に出そうよという話を両社がしたとしても、どちらもＡ駅前を譲らないのでこの話し合い自体意味がない。この利得行列をゲーム理論で考えるのであれば、両社が妥協することはありえない。

自社が600人の利得を獲得するためには、他社より早くＡ駅に出店することが条件となる。

で、もっとひどいのがこれだ。もし、自分のほうが早く出店戦略を決められるのであれば、これは利得行列を使った分析ではなく、デシジョンツリーを使った分析を行うべき。利得行列を使う場合、普通プレーヤーは同時に意思決定することが前提だ。

出店戦略を相手よりも早く決められる場合のデシジョンツリーは次のようになる。

　　　　　　　　　　　　　　　　　　Ａ
　　　　　　　　　　　　　　　　　／パターン１(300,300)
　　　プレーヤーＹの決定　□
　　　　　　　　　　　　　　　／　＼パターン２(600,400)←これが最適戦略
　　　　　　　　　　　　　　Ａ　　　Ｂ
プレーヤーＸの決定　□
　　　　　　　　　　　　　　Ｂ　　　Ａ
　　　　　　　　　　　　　　　＼　／パターン３(400,600)
　　　プレーヤーＹの決定　□
　　　　　　　　　　　　　　　　　＼パターン４(200,200)
　　　　　　　　　　　　　　　　　　Ｂ

このデシジョンツリーでは、「Backward Induction」といって、後ろのほうから考えてどのような戦略になるかを考えることになる。

まず、パターン１と２の括弧の後ろの数字（これが後で戦略を選ぶ人の利得になる）を比べると、パターン２のほうが大きい。なのでパターン１は消す。次にパターン３と４を比べるとパターン３のほうが大きいので４を消す。そして、パターン２と３の括弧の前の数字（これが最初に意思決定できるほうの利得）を見る。するとパターン２のほうが大きいから、最終的な戦略はパターン２となる。

つまり、「出店計画を先に決められる」というのはゲームのルールを変えたということになる。だからこの記事からビジネス的なインプリケーションを無理やり引き出すとすれば、「他社より先にいい物件は押さえろ！」というもの凄く当たり前の示唆が得られるわけだ。

三つ目のケース：「囚人のジレンマ」の間違った例

こんな有名なケースを間違うのもどうなのよって話なんだが。この記事では次世代DVD規格を例にとって説明しようとしてるんだが、これの説明の仕方がすごく間違い。

まずこの記事に従って利得行列を書くと以下のようになる。

	譲歩	拒否
譲歩	(6,6)	(2,8)
拒否	(8,2)	(3,3)

この場合、両陣営にとって「拒否」することが支配戦略になる（相手がどう出ようと譲歩よりも拒否のほうが利得が大きい）。そのため、両陣営が歩み寄ることはなく、結局協力するよりも低い利得にお互いが甘んじるという結果になる（パレート最適ではない均衡になってしまう）。これが有名な「囚人のジレンマ」だ。このケースで両陣営が歩み寄ることはゲーム理論上ありえない。

ゲーム理論を謳うのであれば、この記事の結論は「だからBD陣営とHD陣営が歩み寄ることはないんですよ、バカですね」としなくてはいけない。

では、この記事で言っている「双方が譲歩して“中間的な規格”に統一すれば消費者は混乱せず、市場が盛り上がるので利得は（6･6）となる。双方が協力することが一番好ましい。」という結論をゲーム理論では導き出すことが出来ないのか？

いや、できるんだな、これが。

そもそも、この記事のケースでは、この規格の対立を一回限りのゲームとしてみていることに注意。この一回限りのゲームでは協調することはありえないんだが、通常ビジネスでは将来にわたっての競争や協力関係が存在するのが普通だ。なので「囚人のジレンマ」を繰り返し型に拡張してあげれば協調的行動をとることが合理的選択になることもある。このケースで言えば、いずれまたなんらかの規格上の対立がおきることが容易に想像されるので、お互い歩み寄って繁栄を分け合いましょうや、という合意が成立する可能性はある（ただし有限回に限定するとこれまた「囚人のジレンマ」は発生してしまうんだが）。

このへんは「しっぺ返し戦略」とか「パブロフ戦略」とかでググれば出てくる。

ともかくも、この記事はひどいねえ。引き続き、第３回目の記事の間違いも突っ込んでみる。