fc2ブログ

記事一覧

立ち回りの理論 ―― ナッシュ均衡

年度内には上げるとかいっていたのに半年かかってしまいました。忙しかった――というよりもMTG Arenaに嵌まってポケモンどころじゃなかったんですよ。この間『あれ? USUMの環境ってそろそろ終わり?』と気づいたので慌ててレートに参戦したり、こうして第7世代のうちに上げておきたかった記事を書いたり。やっぱり俺は複数のゲームを同時にできるほどキャパシティが大きい人間じゃない……。

ソードシールドの情報も段々揃ってきましたね。メガシンカ廃止は……まあ、頑張って調整してきたんだから何も廃止せんでもとも思いますが、ダイマックス一本に絞ると開発側いうのならば仕方がない。自分は出てきたものを粛々と受け止めるだけです。一つだけ願いをいうのならば、次世代ではリストラされるポケモンもいるらしいですが、ヌケニンとチェリムだけは何とか生き残って欲しい(グラフィックを作るのが大変というのがリストラの理由らしいから、フォルムが複数あるチェリムは厳しい気がする……)。

 

 

今回は試合中の立ち回りについての話をします。理詰めで語れることなんかあるのかと思うかもしれませんし、実際に自分も立ち回りについての記事なんかを読むと辟易することが多いです。試合中にどういう選択をすればいいかなんてのは、最終的には勘で決めるしかない部分が大きいものだから、主観的な意見を完全に否定するのは難しいです。でも、『勘に頼らずに理詰めで語れる要素』も確実にあります。

 

立ち回りについては『ゲーム理論』の話に終始することになります。

『ゲーム理論』という言葉自体は結構有名ですが、その正確な定義や本質的な部分をちゃんと理解している人はそこまで多くないかもしれません。というか自分も、単に『利己的遺伝子』が面白かったから個人的に調べたことがあるというだけで、専門的に勉強したわけではありません。専門で勉強している人たちからすれば割と適当なことをいっている可能性もあります。間違ったことを話していたら申し訳ありません。

 

『ゲーム理論』というのは『戦略的状況』を扱って研究する学問です。「戦略的状況」とは自分の利得が自分の行動の他、他者の行動にも依存する状況のことで、主に経済学が扱う状況が該当しますが、経営学・政治学・法学・社会学・人類学・心理学・生物学・工学・コンピュータ科学なんかにも見られる状況なので、様々な分野に応用されています(以上、Wikipediaより)

 

……正直、適当なサイトをじっくり読んでもらう方が自分のような門外漢の説明よりもわかりやすいと思いますが、一応はもう少し噛み砕いて解説します(ゲーム理論の何たるかを既に理解している人はここからしばらくは読み飛ばしてくれていいです)。

 

ゲーム理論が扱う『戦略的状況』というのは、ざっくりいえば『プレイヤーが複数存在して』『全てのプレイヤーには数値で表せる利得が存在して』『全てのプレイヤーは自分の利得が最大になるよう行動しようとして』『他のプレイヤーの行動によって自分の利得が変化する』状況です。要するに、現実的にあり得る状況を数値で表せるようにモデル化したものだと考えてくれればいいです。別に『テレビゲームやボードゲームを扱った学問』というわけではなく、『モデル化することでテレビゲームやボードゲームのように利得がはっきりした状況を扱った学問』ということです。

 

この理論の本質は、『全てのプレイヤーが、自分の利得を最大化しようとしているということを相互に理解した上で自分の利得を最大化しようとする』という所にあります。要するに、相手は相手の一番得になる行動をする→そのことを踏まえた上で自分は自分の一番得になる行動をする→そのことを踏まえた上で相手は相手の一番得になる行動をする→……という話ですね。こうした状況を『読み合い』という言葉で片付けるのは簡単ですが、それをちゃんと数学的に扱ったのがゲーム理論です。

 

ゲーム理論で一番有名なのは『囚人のジレンマ』でしょうが、あれに関しては世間的に若干誤解がまかり通っているような気がします。それに関して書きたい気持ちもありますが、ポケモンとは関係がない話になるので割愛します(あれはポケモンとは違って非ゼロサムゲームの話です)。

 


ポケモンの試合が扱うのは『プレイヤーが2人だけの』『非協力の』『ゼロサムゲーム』という、ある種一番簡単な状況です(ゼロサムゲームというのは、全てのプレイヤーの利得の合計が、プレイヤーの行動に関係なく決まっているゲームのことです)。何故ちゃんと考察している人がいないのか不思議なくらい、全てがゲーム理論で扱えます。というか全ての試合に数学的な解が理論上存在します。『試合の数学的な解って何?』と思うかもしれませんが、今回の記事を最後まで読めば分かります。

 

では、まずは一番単純な状況から考えてみましょう。

 

salamence-mega.gif

A・ボーマンダ@ボーマンダナイト H4  A244 C4  D4  S252 せっかち

恩返し 流星群 龍の舞 守る

 

VS

 

salamence-mega.gif

B・ボーマンダ@ボーマンダナイト H4  A244 C4  D4  S252 せっかち

恩返し 流星群 龍の舞 守る

 

※お互いに威嚇を受けてAランク-1

 

『こんなもんお互いに流星群打って同速ゲーをするだけに決まってるだろ』という状況で、実際にその通りなんですが、いくつかの簡単な考え方の説明のために持ち出しました。

 

まず

・2体が同じ行動をした場合→お互いに状況が全く同じなので勝率は50

Aが流星群・Bが恩返しの場合→Aは恩返しを一発は耐える・Bは流星群を一発も耐えない故に、流星群が当たれば必ずAが勝つため、Aの勝率は90%以上

Aが流星群・Bが龍の舞の場合→上と同じでAの勝率は90%以上

Aが流星群・Bが守るの場合→状況が変わらないので勝率は50

Aが恩返し・Bが龍の舞の場合→Bが次に流星群を選択して当たればAは負けるので、勝率は10%以下

Aが恩返し・Bが守るの場合→状況が変わらないので勝率は50

Aが龍の舞・Bが守るの場合→次にAが流星群を選択して当たればAが勝つので、Aの勝率は90%以上

 

ABを入れ替えた場合には勝率がひっくり返るだけなので、表にすると下のようになります。

 

表1

 

表を見てすぐに分かることは、Aが流星群を選択した場合の勝率は、Bどの行動を選択したとしても、Aが恩返しを選択した時の勝率以上である』ということです。ABをひっくり返した場合にも同じことがいえます。

これをゲーム理論ではAが恩返しを選択するという戦略は、Aが流星群を選択するという戦略に支配されていると呼びます。また、同様に、『Aが守るを選択するという戦略』は、『Aが流星群を選択するという戦略』に支配されています。

では『Aが龍の舞を選択する』はどうでしょう? この段階ではまだ『Aが流星群を選択する』に支配されてはいません。『Bが守るを選択した場合』は、龍の舞を選択した場合の方が勝率が高いからです。

ただし、ここで『お互いに利得が最大になるように行動する』という前提が活きてきます。ABが立場を入れ替えた場合にもさっきの理屈は同じになるので、Bが守るを選択するという戦略』は『Bが流星群を選択するという戦略』に支配されています。つまり、Bが守を選択するのは流星群を選択することに比べて絶対に損するので、『お互いに利得が最大になるように行動する』という前提が存在する限り、Bが守るを選択することはないと考えてもいいんです。

この前提がある限り、自分も相手も、守る・恩返しを選択することはないと考えてもいいです。それらを表から差し引いて、流星群と龍の舞だけを残した場合、相手がどの選択をしようとも流星群を選択した方が勝率が高いです。すなわち、『龍の舞を選択するという戦略』は『流星群を選択するという戦略』に支配されています。

 

こうして順番に選択肢を排除していった結果、『お互いに利得が最大になるように行動する』という前提を置く限り、『この状況ではお互いに流星群を選択する』という結論に落ち着きました。

 

この状況を、ゲーム理論では『純粋戦略のナッシュ均衡』と呼びます。ナッシュ均衡の定義は、『どのプレイヤーも、その均衡状態から自分の戦略を変更することによってより高い利得を得ることができない戦略の組み合わせの均衡状態』です。この状況に関して言えば、相手が流星群を選択する限り、自分も流星群を選択する以上に勝率の高い行動はあり得ない状態になっており、それは相手から見ても同じということです。

 

前提としてこうした考え方を共有していないことには次の説明が難しかったので、まあわかりきったことを説明するのに随分と長々と文章を連ねました。さて、では複雑さを増した次の状況を考えてみましょう。

 

相手

tapukoko.gifcresselia.gif

カプ・コケコ@デンキZ H4  C244 B4  D4  S252 控え目 エレキメイカー

10万ボルト マジカルシャイン 草結び 守る

HP全快

クレセリア@メンタルハーブ H252 B4 C4  D244 S4   穏やか 浮遊

サイコキネシス 凍える風 サイドチェンジ トリックルーム

※既に瀕死寸前で、どんな攻撃を受けてもHP0になる状態

 

vs

 

自分

swampert-mega.gif

ラグラージ@ラグラージナイト H12  A236 B4  D4  S252 意地っ張り すいすい

滝登り 地震 岩雪崩 守る

HP全快

 

戦場:雨(残り5ターン)、エレキフィールド(残り5ターン)

 

 



選択肢を全部書き出すとかなり多いです。コケコの選択肢が4つ、クレセリアの選択肢が4つ、ラグラージの選択肢が「滝登り→コケコ・滝登り→クレセリア・地震・岩雪崩・守る」の5つなので、4×4×5で合計80パターンあります。ただ、この中でも『明らかに他の選択肢に支配されている選択肢』があるので、さっきと同様の方法で順番に消していきましょう。計算が面倒くさくなるので、トリル・雨のターン切れは考えないことにします。

 

・『コケコが10万ボルト・マジカルシャインを使う戦略』は明らかに『コケコが草結びを使う戦略』に支配されている(コケコが行動できなかった場合は勝率は同じ・守られた場合の勝率も同じ・攻撃が当たった場合の勝率は草結びは100%で、10万ボルト・マジカルシャインは100%未満)。


・『クレセリアがサイコキネシス・凍える風を使う戦略』は『クレセリアがトリックルームを使う戦略』に支配されている(クレセリアが行動できなかった場合の勝率は同じ・クレセリアの行動前にラグラージが倒されている場合も同じ・クレセリアが行動できるがその時点でカプ・コケコが倒されている場合も次のターンにクレセリアが倒されるだけなので同じ・そのターンに全員が生き残った場合は、トリックルームを打っていた場合は100%勝てるが、サイコキネシスか凍える風を使った場合は100%未満)

 

ここまでは簡単ですが、次からは少しややこしいです。

 

・『コケコ守る+クレセリアサイドチェンジの戦略』は、次にどんな選択肢をとるとしても元よりも状況が悪くなっている(コケコの守るの失敗率が上がっている)ので、最初からその選択肢をとる場合の戦略に支配されている。

 

上の理屈は厳密に取り扱おうとすると結構ややこしい話だったりもしますが、そこに深入りするのも何なのでひとまず受け入れてください。

 

・『ラグラージが滝登り→コケコ』の戦略が『ラグラージが地震』の戦略よりも勝率が高くなるのは、『コケコ守る+クレセリアサイドチェンジ』の場合だけだが、それは上の理屈によって別の戦略に支配されているので、残った選択肢の中では『ラグラージ滝登り→コケコの戦略』は『ラグラージ地震』の戦略に支配されている。


・『コケコ草結び+クレセリアサイドチェンジの戦略』が『コケコ草結び+クレセリアトリックルームの戦略』よりも勝率が高くなるのは、『ラグラージが滝登り→コケコの場合』だけだが、それは『ラグラージ地震の戦略』に支配されているので、残った選択肢の中では、『コケコ草結び+クレセリアサイドチェンジの戦略』は『コケコ草結び+クレセリアトリックルームの戦略』に支配されている。


・ここまでで、クレセリアの選択肢はトリックルームのみ・コケコの選択肢は草結びか守るのみということになった。するとラグラージが守った場合には100%負けるので、ラグラージが守るという戦略は他3つの戦略に支配されている。

 

ということで、支配されている戦略を順番に消していった結果、残ったのは、

 

相手

・コケコ守る+クレセリアトリックルーム

・コケコ草結び+クレセリアトリックルーム

 

自分

・滝登り→クレセリア

・岩雪崩

・地震

 

と、2×3の6パターンだけになりました。

 

6パターン全ての勝率を考えてみますと、

 

敵が

『コケコ守る+クレセリアトリックルーム』

の場合、

 

自分が

・滝登り→クレセリア 次にコケコに地震を打てば勝ちなので勝率100%

・地震 次からコケコに草結びを打たれ続ければ負けなので勝率0%

・岩雪崩 クレセリアに当たれば勝ち、外せば負けなので勝率90%

 

敵が

『コケコ草結び+クレセリアトリックルーム』

の場合、

 

自分が

・滝登り→クレセリア 草結びが当たって負けなので勝率0%

・地震 草結び前にコケコを倒せるので勝率100%

・岩雪崩 両方に当たってコケコを怯ませた場合は勝ち・それ以外のパターンは負けなので、0.9×0.9×0.3で、勝率24.3

 

となります。表にすると下のような形です。

 

表2

 

お互いに『どの選択肢も他の選択肢に支配されていることはない』と分かります。じゃあどれ選ぶのが正解なのかといえば、こうなると『相手次第』です。それをもう少し数字で扱ってみましょうというのが今回の主旨です。

どういうことかといえば、『相手が特性の戦略を選ぶ』と決めるのではなく、『相手が特定の戦略を選ぶ確率を考える』ということです。

 

相手が『守る+トリックルーム』を選ぶ確率pとすると、必然、草結び&トリックルームを選ぶ確率1-pなので、


滝登り→クレセリアを選んだ際の勝率:1×p+0×(1-p)p

地震を選んだ際の勝率:0×p1×(1-P)1-p

岩雪崩を選んだ際の勝率:0.9×p0.243×(1-p)0.657p0.243

 

となります。グラフにすると下のような勝率の分布です。


表3

 


また、

岩雪崩と地震の勝率が等しくなる際のpは、1-p0.657p0.243を解いて、p0.462

岩雪崩と滝登りの勝率が等しくなる際のpは、p0.657p0.243を解いて、p0.682

 

故に、

 

相手が守る&トリックルームを選ぶ確率をpとした時、

 

p46.2ならば、地震を選ぶ

46.2%≦p68.2ならば、岩雪崩を選ぶ

68.2%≦pならば、滝登り→クレセリアを選ぶ

 

のが正解、ということになります。

 

実際のpがどの程度か、というのは、まあ人次第ですから統計データを取ってみないことには分かりませんが、ゲーム理論的には解があります。相手側からみたときの勝率を少しでも上げるような戦略を選ぶはずだという考え方がゲーム理論です。表を見れば分かるとおり、こちらが最善の選択をした場合にも、相手側の勝率が一番高くなるのはp=0.462です。

つまり、相手は守る&トリックルームを46.2%、草結び&トリックルームを53.8%の確率で選択すれば最も勝率が高くなるということです。

 

 

一方、同じことを相手側から考えてみましょう。

自分が滝登りを選ぶ確率q地震を選ぶ確率rとすると、岩雪崩を選ぶ確率1-q-rなので、

 

相手が『守る+トリックルーム』を選んだ際の勝率:q×0r×1+(1-q-r)×0.1=0.1-0.1q+0.9r

相手が『草結び+トリックルーム』を選んだ際の勝率:q×1+r×0+(1-q-r)×0.766=0.766+0.243q-0.766r

 

この勝率が等しくなるとき、0.1-0.1q+0.9r=0.766+0.234q-0.766r

r=(0.666+0.334q)/1.666

故に、r<(0.666+0.334q)/1.666ならば、相手は『守る+トリックルーム』を選択

r>(0.666+0.334q)/1.666ならば、相手は『草結び+トリックルーム』を選択

 

するのが正しい、ということになります。どちらを選んでも勝率が同じ場合は、r=(0.666+0.334q)/1.666となります。

 

そのときの勝率は、上に代入すると、

0.1-0.1q+0.9(0.666+0.334q)/1.666=0.460+0.080q

こちら側としては相手の勝率を可能な限り下げたいので、q=0とすることになります。

すると、r=0.666/1.666=0.400

1-q-r=0.600

となります。その際の相手の勝率は、

0.1-0.1q+0.9r=0.460

です。つまり、こちらは地震を4割、岩雪崩を6割の確率で選択するのがもっとも勝率が高く、その際の勝率は54だということです。

 

自分と相手側の状況をまとめると、


自分:地震を40%、岩雪崩を60%の確率で選択

相手:『守る+トリックルーム』を46.2%、『草結び+トリックルーム』を53.8%の確率で選択

 

の状態だと、お互いに勝率を変化させられなくなります。このような状態を、ゲーム理論では混合戦略のナッシュ均衡』と呼びます。

生物の世界や経済の世界なんかだと、大体の現象はこのナッシュ均衡に落ち着くようになっています。負けたものから排除されていく世界だからです。例えば、守る&トリックルームを0%の確率でしか取らないものがいると、ラグラージ側は地震を選択する奴が有利になる→地震を選択する奴が生き残る→守る&トリックルームを0%の確率でしか取らない奴が淘汰される、という風に、均衡状態を崩した方が排除されます。

 

ゲーム理論の世界ではこう説明します。しかし、非常にありがたいことに、自分たちはポケモンで負けても死なないので、ポケモンバトルの世界は必ずしもナッシュ均衡には収束しません。じゃんけんのナッシュ均衡はグー・チョキ・パーをお互い1/3の確率で出すことですが、あれも厳密に全部の確率が1/3にならないというのと同じです。

 

だから割と偏ります。現実には、この状況において自分側が地震を打つ確率は40%ではなく、相手が『守る+トリックルーム』を選択する確率は46.2%ではないでしょう。勝率が低くなったとしても死ぬわけじゃないので、勝率の高い人と低い人が存在します。ポケモンのプレイングがうまい人、というのは、つまり、こうした『現実に存在するナッシュ均衡からのズレ』を感覚的に理解している人、ということなのでしょう。別に、高レートの人はテレパシー能力を持っているわけでも、100%勝てるパーティを使っているわけでもありません。うまい人はリスクのあるプレイをしないというのは単なる妄想です。

 


 

もう一つ例題を出しましょう。

 

相手

greninja.giftapubulu.gif

ゲッコウガ@達人の帯 H4  A4  C244 D4  S252 無邪気 変幻自在

冷凍ビーム ダストシュート けたぐり 守る

カプ・ブルル@突撃チョッキ H108 A156  B4  D4  S236 意地っ張り グラスメイカー

ウッドホーン ウッドハンマー 馬鹿力 ストーンエッジ

 

vs

 


自分

salamence-mega.gifsnorlax.gif

ボーマンダ@ボーマンダナイト H4  A244 C4  D4  S252 せっかち スカイスキン

恩返し 流星群 龍の舞 守る

(既にメガシンカ済み)

+

カビゴン@カビゴンZ H4  A252  B252 勇敢 厚い脂肪

ギガインパクト 恩返し 10万馬力 守る

+(控え)

tyranitar.gif

バンギラス@弱点保険 H44  A204 B4  D4  S252 陽気 砂起こし

岩雪崩 噛み砕く 冷凍パンチ 守る

 

戦場:グラスフィールド(残り5ターン)

 




この勝負のナッシュ均衡はどうなるでしょう?

 

支配されている選択肢を全て取り除くと(理屈を全て書くと長くなりすぎるので割愛します)、このターンの行動は、

 

相手

『ウッドハンマー→カビゴン+けたぐり→カビゴン』

or

『ウッドハンマー→カビゴン+冷凍ビーム→ボーマンダ』

 

自分

『守る+本気を出す攻撃→ゲッコウガ』

or

『恩返し→カプ・ブルル+本気を出す攻撃→ゲッコウガ』

 

だけになります。

他の選択肢もあるんじゃないの? と思うかもしれませんが、お互いがこの2択の範囲内で行動を取る限り、これらよりも勝率が高くなる戦略はありません(勝率が等しい戦略はあります)。

 

お互いに2×2パターンなので、それぞれの勝率を考えてみると、

 

自分が『守る+本気を出す攻撃→ゲッコウガ』の場合

・相手が『ウッドハンマー→カビゴン+けたぐり→カビゴン』の場合

カビゴンが倒されて、次のターンから次のターンから『ウッドハンマー→バンギラス+冷凍ビーム→ボーマンダ』を続けられれば100%負けなので、勝率0

 

・相手が『ウッドハンマー→カビゴン+冷凍ビーム→ボーマンダ』

ウッドハンマーが急所に当たってカビゴンが倒された場合以外は、本気を出す攻撃でゲッコウガを倒せるので次のターンにボーマンダが恩返しを打って勝ち。急所に当たってカビゴンが倒された場合は次のターンからウッドハンマー→バンギラス+冷凍ビーム→ボーマンダを続けられれば100%負けなので、勝率93.75

 

 

自分が『恩返し→カプ・ブルル+本気を出す攻撃→ゲッコウガ』

・相手が『ウッドハンマー→カビゴン+けたぐり→カビゴン』の場合

けたぐり→カビゴンが急所に当たらなければこのターンの間に敵が2体とも倒されてこちらの勝ち。急所に当たったとしてもその後でバンギラスを出して岩雪崩&恩返しの連打で、岩雪崩を外さない限りは勝ちなので、勝率1-0.0625×0.10.9937599.375

 

・相手が『ウッドハンマー→カビゴン+冷凍ビーム→ボーマンダ』

ウッドハンマーが急所に当たれば2体とも行動前に倒されてバンギラスだけになるので、その後ウッドハンマー+けたぐりの連打でどうあがいても負け。

ウッドハンマーが急所に当たらなければ、下の状況に

 

相手

tapubulu.gif

カプ・ブルル@突撃チョッキ H108 A156  B4  D4  S236 意地っ張り グラスメイカー

ウッドホーン ウッドハンマー 馬鹿力 ストーンエッジ

HP残り半分割程度

 

vs

 

自分

snorlax.giftyranitar.gif

カビゴン@カビゴンZ H4  A252  B252 勇敢 厚い脂肪

ギガインパクト 恩返し 10万馬力 守る

※(HP残り2割程度)

バンギラス@弱点保険 H44  A204 B4  D4  S252 陽気 砂起こし

岩雪崩 噛み砕く 冷凍パンチ 守る

 

戦場:グラスフィールド(残り4ターン)砂嵐(残り5ターン)

 

この状況の勝率を求めるためには、また混合戦略のナッシュ均衡解を考える必要があります。お互いの支配されている選択肢を取り除くと、

 

相手

『ウッドホーン→カビゴン』or『ウッドホーン→バンギラス』

自分

『冷凍パンチ+守る』or『守る+ギガインパクト』

 

が残ります。まあ正確には、『自分:冷凍パンチ+ギガインパクト』も完全に支配されている選択肢ではないんですが(片方が倒されたとしてももう片方の攻撃が急所に当たれば勝てます)、明らかにナッシュ均衡解には含まれないので除外します。

 

自分が『冷凍パンチ+守る』の場合

・相手が『ウッドホーン→カビゴン』

冷凍パンチが直撃して100勝ち(乱数で耐えても砂ダメージで死亡)

 

相手が『ウッドホーン→バンギラス』

バンギラスが倒されて勝率0%

 

自分が『守る+ギガインパクト』

・相手が『ウッドホーン→カビゴン』

カビゴンが先手で倒されて勝率0%

 

・相手が『ウッドホーン→バンギラス』

ギガインパクトが直撃して100勝ち

 

これはお互いに2つの選択肢を50%ずつで選択するのがナッシュ均衡で、勝率が50になるということはすぐに分かります。

 

ということで、最初の状況に戻って

 

自分が『恩返し→カプ・ブルル+本気を出す攻撃→ゲッコウガ』、相手は『ウッドハンマー→カビゴン+冷凍ビーム→ボーマンダ』

 

の場合の勝率は、急所に当たらない確率93.75×急所に当たらなかった場合の勝率50で、46.875

 

となります。

 

上の計算と合わせて表にすると下の形です。

 

 表4

 

この状態におけるナッシュ均衡は、

 

相手が『ウッドハンマー→カビゴン+けたぐり→カビゴン』を選択する確率pとすると、自分がどちらの選択をしても勝率が変わらない時、

 

p×0+(1-p)×0.9375p×0.99375(1-p)×0.46875

p=0.321

 

逆に、自分が『守る+本気を出す攻撃→ゲッコウガ』を選択する確率qとすると、相手がどちらの選択をしても勝率が変わらない時、

 

q×1+(1-q)×0.00625=q×0.0625+(1-q)×0.53125

q=0.359

 

つまり、

相手:『ウッドハンマー→カビゴン+けたぐり→カビゴン』を32.1%の確率、『ウッドハンマー→カビゴン+冷凍ビーム→ボーマンダ』を67.9%の確率で選択

自分;『守る+本気を出す攻撃→ゲッコウガ』を35.9%、『恩返し→カプ・ブルル+本気を出す攻撃→ゲッコウガ』を64.1%の確率で選択

 

となるのがこの状況におけるナッシュ均衡です。この混合戦略を行うと、お互いに何を動かしてもより高い勝率を出すことができなくなります。その際の自分の勝率は、(1-0.321)×0.937563.7です。


逆にいえば、相手の行動がこの混合戦略からズレているならば、自分にとってはより得な行動が存在し得ます。相手が『ウッドハンマー→カビゴン+けたぐり→カビゴン』を選択する確率が32.1%以上ならば、こちらは『恩返し→カプ・ブルル+本気を出す攻撃→ゲッコウガ』を、32.1%未満ならば『守る+本気を出す攻撃→ゲッコウガ』を選択すればいい、ということです。

相手からすれば、こちらが『守る+本気を出す攻撃→ゲッコウガ』を選択する確率が35.9%より高いと考えたなら『ウッドハンマー→カビゴン+けたぐり→カビゴン』を、35.9%未満だと考えたなら『ウッドハンマー→カビゴン+冷凍ビーム→ボーマンダ』を選択することになります。

 


しかし、現実にこの状況で自分側になった時に、守る+本気を出す攻撃→ゲッコウガを選択する人は35.9%どころでは絶対に済まないと思います。自分の感覚では最低でも5割、下手をすれば7割を越えている。

どうも、人間には『一撃で倒されることのデメリットを実際よりも多く見積もってしまう』という『習性』があるようなんです。直感的には行動できずに倒されることの方がリスクが大きいと感じてしまう。それが正しいかどうかは、『リスク』という言葉の定義にもよりますが、少なくともこの場合、裏目を引いた後でより勝率が低くなるのは守った場合の方です。そして実際のケースでもこういうことは結構多いです。相手が冷凍ビーム→ボーマンダとする確率が64.1%を超えていると考えるのならば、この状況で守るのが間違いだとはいえませんが(実際には6割くらいな気がします)。

 

縛られているポケモンが守ってはいけない、というわけではないですが、安直に『一撃で倒されるポケモンを交代したり守ったりしないのは下手なプレイングである』というような考え方をするのは止めた方がいいです

『守らずにそのまま倒された場合の勝率』『守らずに攻撃されなかった場合の勝率』『守って相手も攻撃してきた場合の勝率』『守って相手が攻撃してこなかった場合の勝率』『相手が攻撃してくる確率』まですべてを考慮した上で、守った方がいいか殴った方がいいかを考えるのが、勝率を少しでも上げようと思った際には正しいあり方です。

 

また、今回の記事全般をみれば分かると思いますが、『怯み』『急所』『技外し』等はきちんと数値として考慮できる類のものです。そもそもすべての勝負で100%勝てるわけなんかないので、あらゆる勝利は運勝ちであり、あらゆる敗北は運負けです。プレイヤーは少しでも勝てる確率を上げるよう立ち回るだけであって、運要素がどうこうというのは本質的に意味がない考え方です。

 

 

ただ、たかが一分程度の制限時間の間にこれだけの計算をできるほど普通の人の脳は優秀ではありません。少なくとも、自分はそんなサヴァン症候群じみた芸当はできません。そもそも相手の行動の確率分布なんか正確なところは分かりませんし、本当の試合では、相手の技構成や振り方やアイテムだってこんな風に都合良く分かっているわけじゃないです。だから究極的には勘で決めるしかない。


ただ、あまりにも勘に頼りすぎると、別の選択肢に支配されてしまっている選択肢を取ってしまったり、よくよく考えれば100%勝てる状況なのに敢えて勝率を下げるようなプレイングをしてしまったりします。『プレイングというのは本質的にこういうものだ』という認識を持っておくこと自体は有用なのではないかと。

 


理論の話をしていたはずが、いつの間にか単なる心構えの話になってしまったような気がしますが、まあ分かりやすい結論が出る問題でもないので勘弁してください。

 

 

今回は立ち回りの理論でしたが、実のところ、見せ合いの選出段階からこのナッシュ均衡解は決まっていたりします。それどころか、理論上はパーティ構築段階での『解』も存在はするはずなんです。レートで対戦している人の中で、パーティAを使っている人の存在比率が何%、パーティBの存在比率が何%……というような『解』が存在するはずです(そしてその状態ならば存在する全てのパーティの勝率が50%になります)。ただそこまでいったら、囲碁や将棋の完全解を求めるよりもずっと多いレベルの計算量になるでしょうから、人間どころかスーパーコンピュータを使っても解くのは無理でしょうけどね。

 

 

次回は、今回も多少触れた『ナッシュ均衡と現実の分布のズレ』をテーマに書こうと思っていました。負けた人が死ぬ世界ならこのナッシュ均衡に収束しますが、非常にありがたいことに自分たちはポケモンで負けても死なないので、ポケモンバトルは必ずしも今回扱った均衡状態に落ち着きません。

その際に発生する分布には偏りがあります。これはおそらく人間全般が持っている『習性』という奴で、自分は数年のポケモンの経験で、この偏りに関してある程度の法則を発見しています。今回話した『一撃で倒されるポケモンが守るや交代を選択する確率はナッシュ均衡よりも高くなりやすい』もその1つです。

 

それらに関して書こうかと思っていたんですが……やっぱりまずいかなと思い直しました。自分の立ち回り方を全部バラすのと同じですから、記事を読んだ人に自分が勝てなくなってしまいます。いや、何を器が小さいことをいってんだと自分でも思いますが、努力値の振り方とかパーティの作り方とかとは次元が違う話です。全部の行動をピンポイントで読まれれば試合ではまず勝てません。まあこのブログを読んでいる人なんかそんなに多くないだろとも思いますが、勝率が確実に下がるようなことをわざわざ話すのもなあと。

なので、立ち回りの理論については、理詰めで語れる今回の内容のことだけに留めておくことにします。次回はパーティ構築に関する話の予定です(いつになるかは未定です)。


 

 

最後にもう一つだけ問題を。答えが多少直感と反するものになりますから、ちょっと面白い問題だと思うので。

 

相手

bangiras.giftapulele.gif

バンギラス@バンギラスナイト H244 B4  A4  D4  S252 陽気 砂起こし

岩雪崩 噛み砕く 馬鹿力 守る

(メガシンカ済み)

カプ・テテフ@気合いのタスキ H4  C252 S252 控え目 サイコメイカー

サイコキネシス ムーンフォース マジカルシャイン 守る

 

vs

 

自分

kangaskhan-mega.gif

ガルーラ@ガルーラナイト H4  A244 B4  D4  S252 意地っ張り 親子愛

恩返し けたぐり 猫騙し 守る

 

戦場:サイコフィールド(残り5ターン) 砂嵐(残り1ターン)

 


自分側は敵を2体とも一撃で倒せる(親子愛の前にはタスキは意味がない)が、敵側は急所に当てない限りはこちらを一撃では倒せない。素早さが一番早いのは自分だが、相手の方が数が多いので、的確に守られて合計2発分の攻撃を受ける、または攻撃が急所に当たればやられてしまう、という状況です。

せっかくなので、その気がある人はちょっとしたクイズだと思ってこの状況のナッシュ均衡を考えてみてください。

正解はしばらく下(証明略)。

 

 

 

 

 














 

 

 



 

 

 

 

 

 

 

ヒント:2連守るの成功率は1/3

 

 

 

 

 

 

 

 


 

 

 











 

相手

守る+サイコキネシス:32.9

馬鹿力+守る:32.9

馬鹿力+サイコキネシス:34.2

 

自分

けたぐり→バンギラス:17.1

恩返し→カプ・テテフ:17.1

守る:65.8

 

実際にこの状況になった時、ガルーラが守るという選択肢があることに気づける人はそんなに多くない気がします。まあバンギラスに龍の舞がないことを知っていない限りは選んではいけない選択肢ですが。

スポンサーサイト



コメント

管理人のみ閲覧できます

このコメントは管理人のみ閲覧できます

コメントの投稿

非公開コメント

プロフィール

ジロウ

Author:ジロウ
ポケモンダブル勢。好きなポケモンはヌケニンとチェリム、クチート、あとランターン。
ブログ名通りにポケモンの机上論をつらつら書き連ねる予定。