日本シリーズ4連勝(07) [確率統計]
2連勝から4連勝までのAチームの実力について事後確率分布を計算してみる
前回の復習
まず、対戦前の事前分布を一様分布としたときの確率分布関数や各統計量は前回計算したとおり…… 確率密度
…… Aチームの実力(勝つ確率)
…… 事前分布
…… 期待値
…… 確率を二等分するの値。自己流。中央値に相当するか?
…… Aチームが強い確率が弱い確率の何倍か。自己流。オッズ比に相当するか?
続いて、1勝後の事後確率分布関数や各統計量は前回計算したとおり
…… 事後分布
上を正規化(1勝した確率の合計を1に調整する)すると
…… 正規化後の分布
…… 期待値
…… 確率を二等分するの値。自己流。中央値に相当するか?
…… Aチームが強い確率が弱い確率の何倍か。自己流。オッズ比に相当するか?
2連勝後の事後分布(1)
初期状態の事前分布はAチームが2連勝する確率は だから これが2連勝後のグラフとなる。事前分布とこれを重ねると
青の部分の面積は 正規化すると(青の部分の面積を1にする。すなわち、全事象の確率(2連勝の確率の合計)を1にする。) これが、事後分布となる。
2連勝後の事後分布(2)
これをベータ分布で考えると、ベータ分布の一般式は下記のとおりで ここで、…… 右辺での確率密度
…… 全事象確率を1にするための調整定数
…… Aチームの実力(勝つ確率)
…… Aチームが負ける確率
…… Aチームの勝利数
…… Aチームの敗北数
2勝0敗だから としてやる。
前記と同様に全事象の確率が1となるようにすると事後分布は ベータ分布の期待値は である。
期待値以下の面積(確率)は 期待値以上の面積(確率)は Aチームの実力(勝率)が期待値以上である確率は期待値以下の確率の1.37倍大きい。
左右の確率が等しくなる点は
次にAチームの実力(勝率)がBチームより強いか、弱いかを確率で示す。 が五分五分だから左(弱い)右(強い)に分けて確率を求める。 だから その結果が下図。
2連勝した時点でAチームの方が強い確率が弱い確率よりも7倍も大きくなる。ベイズの定理を使って事後確率分布を計算していると自分では思っているのだが、それが正しいと考えれば、オッズ比(?)は7倍だから3戦目はAチームが負ける方に1万円賭け、Aチームが負けると8万円戻るという賭けとAチームが勝つ方に7万円賭け、Aチームが勝つと8万円戻るという賭けが平等ということになる。素人考えでは、負ける方に賭けるのが有利に感じる。
3連勝した
初期状態の事前分布はAチームが3連勝する確率は だから これが3連勝後のグラフとなる。事前分布とこれを重ねると
青の部分の面積は 正規化すると(青の部分の面積を1にする。すなわち、全事象の確率を1にする。) これが、事後分布となる。
3連勝後の事後分布(2)
これをベータ分布で考えると、 3勝0敗だから としてやる。前記と同様に全事象の確率が1となるように正規化すると事後分布は となり、ベータ分布の期待値は である。
期待値以下の面積(確率)は 期待値以上の面積(確率)は Aチームの実力(勝率)が期待値以上である確率は期待値以下の確率の1.44倍大きいが、2連勝と3連勝では大して変わらない。
左右の確率が等しくなる点は
Aチームの実力(勝率)がBチームより強いか、弱いかを確率で示す。 の左(弱い)右(強い)に分けて確率を求める。 だから その結果が下図。
4連勝した
初期状態の事前分布はAチームが4連勝する確率は だから これが4連勝後のグラフとなる。事前分布とこれを重ねると
青の部分の面積は 正規化すると(青の部分の面積を1にする。すなわち、全事象の確率を1にする。) これが、事後分布となる。
4連勝後の事後分布(2)
これをベータ分布で考えると、 4勝0敗だから としてやる。 前記と同様に全事象の確率が1となるように正規化すると事後分布は となり、ベータ分布の期待値は である。期待値以下の面積(確率)は 期待値以上の面積(確率)は Aチームの実力(勝率)が期待値以上である確率は期待値以下の確率の1.49倍大きいが、伸びは2連勝、3連勝、4連勝となるごとに鈍化している。
左右の確率が等しくなる点は
Aチームの実力(勝率)がBチームより強いか、弱いかを確率で示す。 の左(弱い)右(強い)に分けて確率を求める。 だから その結果が下図。
Aチームの方が強い確率が約97%(0.96875)だということになる。実力が互角ならどちらかが4連勝する確率は16分の2で0.125となるにもかかわらず、ベイズの定理に従って(自分ではそう思っている)計算したら、4連勝したら五分五分ではない確率が約97%であるというわけだ。
腑に落ちない。
ベイズ推定の逐次合理性
今回は、対戦前の事前確率分布から1勝、2連勝、3連勝、4連勝後の事後確率分布を計算したが、ベイズ推定の逐次合理性というものがあって、順々に計算できるらしい。つまり
事前分布→事後分布
として
対戦前→1勝後
1勝後→2連勝後
2連勝後→3連勝後
3連勝後→4連勝後
と事前分布を逐次更新していって計算できるとのこと。
次回、これで計算してみる。
コメント 0