F検定-02

F分布の式を見てみると,

\(\Large \displaystyle f_X (x) = \frac{\Gamma \left( \frac{n_1 + n_2 }{2} \right)}{ \Gamma \left( \frac{n_1 }{2} \right) \Gamma \left( \frac{ n_2 }{2} \right)}
n_1^{ \frac{n_1}{2}} n_2^{ \frac{n_2}{2}}
\left( \frac{1}{ n_1 x + n_2} \right)^{ \frac{n_1 + n_2}{2}}
x^{ \frac{n_1}{2} -1} \)

実は,各分散の値自体は関係なく,データ数のみの関数となっていることがわかります.

実際に,n1=10, n2=8とすると,

となることがわかります.

データ数を倍にして,n1=20, n2=16とすると,

となり,分布が狭まることがわかります.

つぎに,シミュレーション.ある分散値を設定して,正規分布を発生させます.その分布から上記の数だけ取り出して不偏分散を算出し,これを2セット用意します.その比の分布のヒストグラムにして表すと,

n1=10, n2=8

n1=20, n2=16

とよく合うことがわかります.

つぎに,実際に具体的なデータを用意してF検定をしてみましょう.

 

ltr