Welchの自由度の求め方-06


これらの式,

一般的なWelchの自由度

 

\(\Large \displaystyle f = \frac{ \displaystyle \frac{s_X^2}{m}
+ \frac{ s_Y^2}{n} }
{ \displaystyle \frac{\left( \frac{ s_X^2}{m} \right)^2}{m-1}
+ \frac {\left( \frac{ s_Y^2}{n} \right)^2}{n-1} } \)

 

Welch_1947-(28)

\(\Large \displaystyle f = \frac{ \displaystyle \left( \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2} \right)^2}
{ \displaystyle \frac{\left( \frac{ \sigma_1^2}{n_1} \right)^2}{n_1 - 1} + \frac{\left( \frac{ \sigma_2^2}{n_2} \right)^2}{n_2 - 1}} \)

 

Welch_1947-(29)

\(\Large \displaystyle f = \frac{ \left( \displaystyle \frac{ s_1^2}{n_1} + \frac{ s_2^2}{n_2} \right)^2 - 2 \left( \displaystyle \frac{ s_1^4 }{n_1^2 (n_1 +1)} + \frac{ s_2^4 }{n_2^2 (n_2 +1)} \right)}
{ \displaystyle \frac{ s_1^4 }{n_1^2 (n_1 +1)} + \frac{ s_2^4 }{n_2^2 (n_2 +1)} } \)

の自由度の値を検討してみましょう.

方法は,
・二つの母集団を考える(母平均,母分散を指定)
・それぞれからある数をピックアップ(標本平均,標本分散が計算できる)
・Welch_1947-(28),のみ母分散を使っているので,いつも値は一定,それ以外の二つの式は母分散が一定でないのでばらつく)
・これを複数回(今回は1,000回)繰り返して,推定される自由度を1,000回求めて,その平均,偏差を検討する
・今回は,
一般的なWelchの自由度/Welch_1947-(28), Welch_1947-(29)/Welch_1947-(28),という比を求める
です.

第1回:データ数がある程度多い場合

 μ01= 5, sd01=3, n01=30

 μ02= 8, sd02=4, n01=40

で行ってみました.

これから見ると,

Welchの自由度/Welch_1947-(28)

 最大の比が1,なので平均は1以下(0.97)

, Welch_1947-(29)/Welch_1947-(28)

 最大の比が1以上,でも平均は1

となりました.

第2回:データ数が少ない場合

 μ01= 5, sd01=3, n01=10

 μ02= 8, sd02=4, n01=15

と少しデータ数を減らしてみました.

第1回の時と同じ傾向でしたが,ばらつきが大きくなりました.

 

結局,どれが一番正しかったのだろうか....

残念ながらよくわかりません.

このWelchの検定の導出に関しては,ネット上ではほとんど記載がありませんでした.

今度図書館に行って調べてみます.

となると...現在の私個人の結論は,

 Welchの検定も近似値なので,これがベストではないんじゃないか

 一般のt検定でも十分じゃないか(母分散が等しい場合)

 でも,発表するときはWelchの検定を使った方が風当たりが弱いかな???

という何とも言えず消極的な結論でした.

 

 

l t