F検定-03
実際に数値を入れてエクセルで計算してみましょう.
こちら,のサイトの値を使わさせていただきました(桁数を変え,名前は変えています)
A | B | |||
A_01 | 6,000 | B_01 | 3,800 | |
A_02 | 5,800 | B_02 | 6,500 | |
A_03 | 5,300 | B_03 | 4,000 | |
A_04 | 4,200 | B_04 | 2,500 | |
A_05 | 7,500 | B_05 | 3,400 | |
A_06 | 5,000 | B_06 | 3,600 | |
A_07 | 3,300 | B_07 | 5,300 | |
A_08 | 6,800 | B_08 | 4,200 | |
A_09 | 5,600 | B_09 | 6,000 | |
B_10 | 3,400 | |||
B_11 | 3,700 | |||
AVG | 5,500 | 4,218 | ||
n | 9 | 11 | ||
s2 | 1,607,500 | 1,471,636 |
不偏分散の比は,
\(\Large \displaystyle F= \frac{1,607,500}{1,471,636} = 1.092 \)
となります.
エクセルの”データ分析”を使うと,
F-検定: 2 標本を使った分散の検定 | ||
変数 1 | 変数 2 | |
平均 | 5,500 | 4,218.182 |
分散 | 1,607,500 | 1,471,636 |
観測数 | 9 | 11 |
自由度 | 8 | 10 |
観測された分散比 | 1.092321 | |
P(F<=f) 片側 | 0.439038 | |
F 境界値 片側 | 3.071658 |
このF境界値は,右側の値で,5%の時には,
F.INV(0.95, n1-1, n2-1)=3.072
を示すようです.また,二つのデータセットの順番は,
不偏分散が大きい方 / 不偏分散が小さい方
と一般的には定義しているようです.(ちゃんとした理由はわかりません)
F値(1.092)がF境界値より小さいので,帰無仮説は成り立ち,両者の分散値に差はないことになります.
左側は?も一応調べてみましょう.エクセルでは,
F.INV.RT(0.95, n1-1, n2-1)=0.299
となりました.これまたF値は範囲内なので,両者の分散値に差はないことになります.
しかし,ここ,を見ると,”右側確率”,とあります?右???左じゃないの?でもたしかにRT≒Right,かしら..
・分散値を大きくした場合
では,つぎに,データセットの値をいじって,ぎりぎりF値を境界値までもっていくようにしてみましょう.
A群のデータを変化させました.
データ数は変えていません
A | B | |||
A_01 | 7,000 | B_01 | 3,800 | |
A_02 | 6,000 | B_02 | 6,500 | |
A_03 | 2,800 | B_03 | 4,000 | |
A_04 | 5,000 | B_04 | 2,500 | |
A_05 | 900 | B_05 | 3,400 | |
A_06 | 1,500 | B_06 | 3,600 | |
A_07 | 3,300 | B_07 | 5,300 | |
A_08 | 6,000 | B_08 | 4,200 | |
A_09 | 4,800 | B_09 | 6,000 | |
B_10 | 3,400 | |||
B_11 | 3,700 | |||
AVG | 5,500 | 4,218 | ||
n | 9 | 11 | ||
s2 | 4,530,278 | 1,471,636 |
不偏分散の比は,
\(\Large \displaystyle F= \frac{4,530,278}{1,471,636} = 3.078 \)
となります.
エクセルの”データ分析”を使うと,
F-検定: 2 標本を使った分散の検定 | ||
変数 1 | 変数 2 | |
平均 | 4144.444 | 4218.182 |
分散 | 4,530,278 | 1,471,636 |
観測数 | 9 | 11 |
自由度 | 8 | 10 |
観測された分散比 | 3.078395 | |
P(F<=f) 片側 | 0.049684 | |
F 境界値 片側 | 3.071658 |
このように分散値の比は,F境界値ギリギリになっています.
F.INV(0.95, n1-1, n2-1)=3.071
左側(右?)は
F.INV.RT(0.95, n1-1, n2-1)=0.299
となりました.
・分子と分母を入れ替えると?
次に,F値を計算する際に,分子と分母を逆にしてみましょう.当然ながら従来のF値の逆数となります.
\(\Large \displaystyle F= \frac{1,471,636}{4,530,278} = 0.3248 \)
F.INV(0.95, n2-1, n1-1)=3.3471
左側(右?)は
F.INV.RT(0.95, n2-1, n1-1)=0.3256
となり,F値の評価は左側の0.3256で議論することになります.
この結果を見ても,F値を求める際には,分子と分母,どちらをとってもいいように思えます.
ただ,F分布自体が右に大きく広がっているので,検定の精度が上がるのかもしれません(ちゃんとした理由は不明です)