検定-03

 

対応のないデータの場合で,母分散が未知で等しい場合を次に考えていきましょう.

\(\Large \displaystyle - t_{\alpha/2} (n-1) \hspace{12 pt}\leq \hspace{12 pt} \frac{\bar{X}_1 - \bar{X}_2}
{\sqrt{ \left(\frac{1}{n_1} + \frac{1}{n_2} \right)
s_p^2 }} \hspace{12 pt} \leq \hspace{12 pt} t_{\alpha/2} (n-1) \)

サンプルデータは,統計ウェッブ 24-4,を参考にさせていただきました.

このサイトでは,
 1組の生徒30人の平均点は75点、標準偏差は5点、2組の生徒32人の平均点は70点、標準偏差は8点
とあったので,具体的な数値を作ってみました.

Class-01 Class_02
1 70 62
2 70 62
3 70 62
4 70 62
5 70 62
6 70 62
7 70 62
8 70 62
9 70 62
10 70 62
11 70 62
12 70 62
13 70 62
14 70 62
15 70 62
16 80 62
17 80 78
18 80 78
19 80 78
20 80 78
21 80 78
22 80 78
23 80 78
24 80 78
25 80 78
26 80 78
27 80 78
28 80 78
29 80 78
30 80 78
31 78
32 78
   
n 30 32
Average 75 70
SD 5 8
s2 25.86 66.06

 

プールした分散は,

\(\Large \displaystyle s^2 = \frac{(30-1) \times 25.86+(32-1) \times 66.06}{30+32-2} = 46.63 \)

統計ウェッブ 24-4,と値が異なるのが気になりますが(不偏分散ではなく分散を使っている?)...

 

t値は,

\(\Large \displaystyle t = \frac{75-70}{\sqrt {46.63 \times \left( \frac{1}{30} + \frac{1}{32} \right) }} = 2.88 \)

t境界値(両側)は,エクセル関数から,

\(\Large \displaystyle =T.INV(1-0.05/2,30+32-2) = 2.000298 \)

となり,t値は,推定した区間の外なので,仮説,

 二つの母集団の母平均には差がない

が認められないため,

 二つの母平均に差がある

ことになります.

エクセル

の,データ分析,でも,

t-検定: 等分散を仮定した2標本による検定

  変数 1 変数 2
平均 75 70
分散 25.86207 66.06452
観測数 30 32
プールされた分散 46.63333
仮説平均との差異 0
自由度 60
2.881121
P(T<=t) 片側 0.002744
t 境界値 片側 1.670649
P(T<=t) 両側 0.005489
t 境界値 両側 2.000298  

と一致しています.

では,同じデータを,母分散が未知で等しいかどうか不明の場合で計算してみましょう(Welchの検定)

 

l t r