SSブログ

Gen0010(07)ハートレイ検定を勝敗分布に使う [確率統計]

ハートレイの等分散性検定

MAクラスでの対戦成績について勝ち星の分布に世代間おいて差があるかどうか検討してみる。
MAクラスのメンバーの能力値は最初は初期設定値であるが、1世代ごと成績下位のメンバーがJ1クラスに陥落し、J1クラスの成績上位メンバーが昇格することにより変動している。
その変動が統計学的に検出できるかどうかを検討する。
平均値は使えない。どの世代でも平均値は7.5勝7.5敗である。中央値も7勝か8勝でこれも使えない。
そこで分散を検討する。
検討前の予想では、能力値の成長とメンバー入れ替えのため少しずつ分布に差が出て、そのうち定常状態になるというものである。
さて、統計学的検討をするまえに度数分布のグラフを作り鑑賞する。
勝敗分布Gen0001-0010w646.png
S2は不偏分散である。)
Gen0007MAが一番バラツキが大きいように見える。これは偶然なのだろうか、又は能力値分布に異常があったのか。統計学的には不偏分散に利用者が定めた有意差があるかどうかを示すだけで、偶然かどうかは分からない。通常ならばそこで終わるのだが、このシミュレーションでは能力値が分かるのだから、偶然かどうかが分かるはずだ。宮城リョータ視点で成績を見ることができるのである。最後の手段としてこれを使う。
グラフを見るとGen0001MAは能力が初期値であるのでこのバラツキを初期値としていいだろう。成長に従って上位下位との差が広がりバラツキも大きくなるだろう。グラフの雰囲気ではGen0001MAは他の世代とバラツキが異なっている気がする。

世代間に分散の差があるかどうかを検定するのには2つの考え方がある。
1 2つの世代を比較し分散の差の有無を検定する
2 複数の世代をまとめて比較し分散の差の有無を検定する

1の方法をGen0001~Gen0010までで具体的に考えると
(01) Gen0001とGen0002を比較
(02) Gen0001とGen0003を比較
   ...
(09) Gen0001とGen0009を比較
(10) Gen0002とGen0003を比較
(11) Gen0002とGen0004を比較
   ...
(45) Gen0009とGen0010を比較
こんなに沢山比較をするとき有意水準5%とするのは論外。本当は差がなくても当然のように偶然有意差があると判定されるものが出てくる。有意水準1%でも偶然有意差があると判定されるものが出るだろう。ということは、差が偶然なのかどうか判断できなくなるので検定する意味がない。
こういったとき、多数の検定をするときには「ボンフェローニ補正」が使われる。これは簡単で単に有意水準を検定回数で割るというもの。今回の例では45検定あるのだから5%の有意水準で行う検定では0.05÷45≒0.0011を各検定の有意水準とするということ。有意水準1%なら0.00022にする。

検定を使うとき、
1 本当は有意差があるのに検出されないと困る
2 本当は有意差がないのに検出されると困る
のどちらの立場に立つかで使い分けをする必要がある。今回は、メンバーの能力値に世代間の差がありその結果として成績に差があり、それは偶然の可能性が少ないということを言いたいから2の立場で検定する。
星取表シミュレーションをやってきて偶然の力を目の当たりにしているのでこの立場を採用するのは当然である。

そもそも2の立場でまずGen0001~Gen0010全体で勝ち星の分布に差があるかどうかを検定すれば良い。つまり、どれとどれがと特定できなくてもとりあえず差があるのかないのかを知りたい。平均値はどの世代でも7.5勝7.5敗なので分散の差異を調べるだけでよい。各世代の人数が同数なので「ハートレイの検定」で済む。

ハートレイの検定はGen0001~Gen0010までの勝ち数の各不偏分散について最小値を最大値で割った値(Fmax)を使って検定する。全く各不偏分散に差がなければ最小値と最大値は等しいのでFmax=1となり、最小値と最大値の差が広がるとFmaxが大きくなる。Fmaxの数表を見てそれよりFmaxがそれより大きければ有意差ありとなる。

今回の場合
最小値 2.33
最大値 13.28
Fmax = 5.69957
df(水準内の自由度) = 29
k(水準数)= 10
Fmaxの数表から
上限5%点 (df=30, k=10) 3.27
    (df=20, k=10) 4.35
上限1%点 (df=30, k=10) 3.97
    (df=20, k=10) 5.57

有意差ありとなった。Gen0001~Gen0010までまとめて検討すると等分散仮定は棄却された。
最初の度数分布グラフを見た段階で等分散ではないという感覚はつかんでいたので統計学的にもその感覚が支持されたということ。

nice!(0)  コメント(0) 
共通テーマ:趣味・カルチャー

nice! 0

コメント 0

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。