Welchの自由度の求め方-02


vという統計量は,

\(\Large \displaystyle v = \frac{\bar{X} - \bar{Y}}{ \sqrt{\frac{s_X^2}{m} + \frac{s_Y^2}{n}} }
\)

\(\Large \displaystyle = \frac{Z }
{ \sqrt{ a \chi_X^2 \ + b \chi_Y^2 } }\)

ここで,

\(\Large \displaystyle \chi_X^2= \frac{(m - 1) s_X^2}{ \sigma_X^2}
\)

\(\Large \displaystyle \chi_Y^2= \frac{(n - 1) s_Y^2}{ \sigma_Y^2}
\)

\(\Large \displaystyle a = \frac{\frac{ \sigma_X^2}{m(m-1)} }{\frac{\sigma_X^2}{m} + \frac{\sigma_Y^2}{n}} \)

\(\Large \displaystyle b = \frac{\frac{ \sigma_Y^2}{n(n-1)}}{\frac{\sigma_X^2}{m} + \frac{\sigma_Y^2}{n}} \)

でした.ここで,さらに,

\(\Large \displaystyle w = a \chi_X^2 \ + b \chi_Y^2 \)

とおきます.これは,二つのカイ二乗分布の定数倍の和なので,たぶん,一つのカイ二乗分布に従うのではないか? と考えます.

そこで, 自由度nのカイ二乗分布の確率密度関数は,

\(\Large \displaystyle f_n (x) = \frac{1}{2^{ \frac{n}{2}} \ \Gamma \left( \frac{n}{2} \right)} \ x^{ \frac{n}{2}-1} \ exp \left( - \frac{x}{2} \right) \)

ガンマ分布は,

\(\Large \displaystyle G ( \alpha, \beta) = \frac{1}{\beta^{ \alpha } \ \Gamma ( \alpha )} \ x^{ \alpha -1} \ exp \left( - \frac{x}{ \beta} \right) \)

α:形状母数,β:尺度母数

となりますので,α=f/2,β=2gとおくと,

\(\Large \displaystyle G \left( \frac{f}{2},2 g \right) = \frac{1}{(2g)^{ \frac{f}{2} } \ \Gamma ( \frac{f}{2} )} \ x^{ \frac{f}{2} -1} \ exp \left( - \frac{x}{ 2g} \right) \)

となります.α=f/2,はわかるのですが,β=2g,が難題です.ここが一番苦労しました.

 

期待値は,

\(\Large \displaystyle E[w] = E[ a \chi_X^2 \ + b \chi_Y^2] = E[ a \chi_X^2] + E[ b \chi_Y^2] = a \ E[ \chi_X^2] + b \ E[ \chi_Y^2]\)

\(\Large \displaystyle \chi_X^2, \ \chi_Y^2 \)

それぞれ,自由度n-1のカイ二乗分布に従うことは全ページに示しましたので,ガンマ分布に置き換えると,

自由度n-1のカイ二乗分布:

\(\Large \displaystyle = \frac{1}{ 2^{ \frac{n-1}{2}} \ \Gamma \left( \frac{n-1}{2} \right)} x^{ \frac{n-1}{2} -1} \ exp \left( - \frac{x}{2} \right) \)

であり,ガンマ分布は,

\(\Large \displaystyle G( \alpha, \beta) = \frac{1}{ \beta^{ \alpha} \ \Gamma ( \alpha)} x^{ \alpha -1} \ exp \left( - \frac{x}{ \beta} \right) \)

ガンマ分布の期待値,分散は,ここ,から,

\(\Large \displaystyle E[ G( \alpha, \beta)] = \alpha \ \beta =\frac{n-1}{2} \cdot 2 = n-1\)

となります,したがって,それぞれの自由度はm-1,n-1なので,

\(\Large \displaystyle E[w] = a \ E[ \chi_X^2] + b \ E[ \chi_Y^2] = a(m-1) + b(n-1) \)

となります.

分散は,

\(\Large \displaystyle V[w] = V[ a \chi_X^2 \ + b \chi_Y^2] = V[ a \chi_X^2] + V[ b \chi_Y^2] = a^2 \ V[ \chi_X^2] + b^2 \ V[ \chi_Y^2]\)

\(\Large \displaystyle V[ G( \alpha, \beta)] = \alpha \ \beta^2 =\frac{n-1}{2} \cdot 2^2 = 2(n-1)\)

したがって,

\(\Large \displaystyle V[w] = V[ a \chi_X^2 \ + b \chi_Y^2] = a^2 \ V[ \chi_X^2] + b^2 \ V[ \chi_Y^2] = 2 \{ a^2 (m-1) + b^2 (n-1) \}\)

 

ここで,

\(\Large \displaystyle G \left( \frac{f}{2},2 g \right) \)

の期待値,分散は,ガンマ分布の期待値・分散の式から,

 期待値:gf

 分散:2g2f

となりますので,

\(\Large \displaystyle gf = a(m-1) + b(n-1) \)

\(\Large \displaystyle 2 g^2 f = 2 \{ a^2 (m-1) + b^2 (n-1) \}\)

が成り立つことになります.したがって,g, fは,

\(\Large \displaystyle g = \frac{ a^2 (m-1) + b^2 (n-1) }{a (m-1) + b (n-1)} \)

\(\Large \displaystyle f = \frac{\left\{ a (m-1) + b (n-1) \right\}^2}{ a^2 (m-1) + b^2 (n-1) } \)

ここで,wが \(\Large \displaystyle G \left( \frac{f}{2},2 g \right) \)に近似的に従うとしたので,

 w/gという確率変数は自由度fのカイ二乗分布に従う

とありますが,これがわからなかったです....結構悩みました...

1938年の論文にも,

With these values of f and g we see from (5) that w/g is distributed approximately as χ2 withf degrees of freedom

としか記述がありません....

次ページに私の理解での導出方法をお示しします.

 

 

 

l t r