対応のないデータの場合で,母分散が未知で等しい場合を次に考えていきましょう.
\(\Large    \displaystyle  - t_{\alpha/2} (n-1)  \hspace{12 pt}\leq   \hspace{12 pt} \frac{\bar{X}_1 - \bar{X}_2}
{\sqrt{ \left(\frac{1}{n_1} + \frac{1}{n_2} \right)
s_p^2 }} \hspace{12 pt} \leq  \hspace{12 pt}   t_{\alpha/2} (n-1) \)
サンプルデータは,統計ウェッブ 24-4,を参考にさせていただきました.
このサイトでは,
 1組の生徒30人の平均点は75点、標準偏差は5点、2組の生徒32人の平均点は70点、標準偏差は8点
とあったので,具体的な数値を作ってみました.
| Class-01 | Class_02 | |
| 1 | 70 | 62 | 
| 2 | 70 | 62 | 
| 3 | 70 | 62 | 
| 4 | 70 | 62 | 
| 5 | 70 | 62 | 
| 6 | 70 | 62 | 
| 7 | 70 | 62 | 
| 8 | 70 | 62 | 
| 9 | 70 | 62 | 
| 10 | 70 | 62 | 
| 11 | 70 | 62 | 
| 12 | 70 | 62 | 
| 13 | 70 | 62 | 
| 14 | 70 | 62 | 
| 15 | 70 | 62 | 
| 16 | 80 | 62 | 
| 17 | 80 | 78 | 
| 18 | 80 | 78 | 
| 19 | 80 | 78 | 
| 20 | 80 | 78 | 
| 21 | 80 | 78 | 
| 22 | 80 | 78 | 
| 23 | 80 | 78 | 
| 24 | 80 | 78 | 
| 25 | 80 | 78 | 
| 26 | 80 | 78 | 
| 27 | 80 | 78 | 
| 28 | 80 | 78 | 
| 29 | 80 | 78 | 
| 30 | 80 | 78 | 
| 31 | 78 | |
| 32 | 78 | |
| n | 30 | 32 | 
| Average | 75 | 70 | 
| SD | 5 | 8 | 
| s2 | 25.86 | 66.06 | 
プールした分散は,
\(\Large \displaystyle s^2 = \frac{(30-1) \times 25.86+(32-1) \times 66.06}{30+32-2} = 46.63 \)
統計ウェッブ 24-4,と値が異なるのが気になりますが(不偏分散ではなく分散を使っている?)...
t値は,
\(\Large \displaystyle t = \frac{75-70}{\sqrt {46.63 \times \left( \frac{1}{30} + \frac{1}{32} \right) }} = 2.88 \)
t境界値(両側)は,エクセル関数から,
\(\Large \displaystyle =T.INV(1-0.05/2,30+32-2) = 2.000298 \)
となり,t値は,推定した区間の外なので,仮説,
二つの母集団の母平均には差がない
が認められないため,
二つの母平均に差がある
ことになります.
エクセル
の,データ分析,でも,
t-検定: 等分散を仮定した2標本による検定
| 変数 1 | 変数 2 | |
| 平均 | 75 | 70 | 
| 分散 | 25.86207 | 66.06452 | 
| 観測数 | 30 | 32 | 
| プールされた分散 | 46.63333 | |
| 仮説平均との差異 | 0 | |
| 自由度 | 60 | |
| t | 2.881121 | |
| P(T<=t) 片側 | 0.002744 | |
| t 境界値 片側 | 1.670649 | |
| P(T<=t) 両側 | 0.005489 | |
| t 境界値 両側 | 2.000298 | 
と一致しています.
では,同じデータを,母分散が未知で等しいかどうか不明の場合で計算してみましょう(Welchの検定)