対応のないデータの場合で,母分散が未知で等しい場合を次に考えていきましょう.
\(\Large \displaystyle - t_{\alpha/2} (n-1) \hspace{12 pt}\leq \hspace{12 pt} \frac{\bar{X}_1 - \bar{X}_2}
{\sqrt{ \left(\frac{1}{n_1} + \frac{1}{n_2} \right)
s_p^2 }} \hspace{12 pt} \leq \hspace{12 pt} t_{\alpha/2} (n-1) \)
サンプルデータは,統計ウェッブ 24-4,を参考にさせていただきました.
このサイトでは,
1組の生徒30人の平均点は75点、標準偏差は5点、2組の生徒32人の平均点は70点、標準偏差は8点
とあったので,具体的な数値を作ってみました.
Class-01 | Class_02 | |
1 | 70 | 62 |
2 | 70 | 62 |
3 | 70 | 62 |
4 | 70 | 62 |
5 | 70 | 62 |
6 | 70 | 62 |
7 | 70 | 62 |
8 | 70 | 62 |
9 | 70 | 62 |
10 | 70 | 62 |
11 | 70 | 62 |
12 | 70 | 62 |
13 | 70 | 62 |
14 | 70 | 62 |
15 | 70 | 62 |
16 | 80 | 62 |
17 | 80 | 78 |
18 | 80 | 78 |
19 | 80 | 78 |
20 | 80 | 78 |
21 | 80 | 78 |
22 | 80 | 78 |
23 | 80 | 78 |
24 | 80 | 78 |
25 | 80 | 78 |
26 | 80 | 78 |
27 | 80 | 78 |
28 | 80 | 78 |
29 | 80 | 78 |
30 | 80 | 78 |
31 | 78 | |
32 | 78 | |
n | 30 | 32 |
Average | 75 | 70 |
SD | 5 | 8 |
s2 | 25.86 | 66.06 |
プールした分散は,
\(\Large \displaystyle s^2 = \frac{(30-1) \times 25.86+(32-1) \times 66.06}{30+32-2} = 46.63 \)
統計ウェッブ 24-4,と値が異なるのが気になりますが(不偏分散ではなく分散を使っている?)...
t値は,
\(\Large \displaystyle t = \frac{75-70}{\sqrt {46.63 \times \left( \frac{1}{30} + \frac{1}{32} \right) }} = 2.88 \)
t境界値(両側)は,エクセル関数から,
\(\Large \displaystyle =T.INV(1-0.05/2,30+32-2) = 2.000298 \)
となり,t値は,推定した区間の外なので,仮説,
二つの母集団の母平均には差がない
が認められないため,
二つの母平均に差がある
ことになります.
エクセル
の,データ分析,でも,
t-検定: 等分散を仮定した2標本による検定
変数 1 | 変数 2 | |
平均 | 75 | 70 |
分散 | 25.86207 | 66.06452 |
観測数 | 30 | 32 |
プールされた分散 | 46.63333 | |
仮説平均との差異 | 0 | |
自由度 | 60 | |
t | 2.881121 | |
P(T<=t) 片側 | 0.002744 | |
t 境界値 片側 | 1.670649 | |
P(T<=t) 両側 | 0.005489 | |
t 境界値 両側 | 2.000298 |
と一致しています.
では,同じデータを,母分散が未知で等しいかどうか不明の場合で計算してみましょう(Welchの検定)