対応がある場合で,母分散がわからない場合をまず考えていきましょう.
\(\Large \displaystyle - t_{\alpha/2} (n-1) \hspace{12 pt}\leq \hspace{12 pt} \frac{ \bar{x}_d}{ \sqrt{\frac{\color{red}{s_d}^2}{n}}} \hspace{12 pt} \leq \hspace{12 pt} t_{\alpha/2} (n-1) \)
サンプルデータは,統計ウェッブ 24-5,を参考にさせていただきました.
そのまま値を使うのはあまりよくないかな?と思い,少し値を変えています.
before | after | difference | |
1 | 170 | 140 | 30 |
2 | 150 | 155 | -5 |
3 | 160 | 140 | 20 |
4 | 140 | 135 | 5 |
5 | 150 | 150 | 0 |
Average | 154 | 144 | 10 |
ここで,n=5,なので,差分の不偏分散は,
\(\Large \displaystyle s_d^2 = \frac{(30-10)^2+(-5-10)^2+(20-10)^2+(5-10)^2+(0-10)^2}{5-1} = 212.5 \)
t値は,
\(\Large \displaystyle t = \frac{10}{\sqrt {\frac{212.5}{5}}} = 1.53393 \)
t境界値(片側)は,エクセル関数から,
\(\Large \displaystyle =T.INV(1-0.05,5-1) = 2.131847 \)
となり,t値は,推定した区間の中に入っているので,仮説,
二つの母集団の母平均には差がない
が認められるため,
二つの母平均に差がないことが確率的に実証される
ことになり,before -> after,で変化があったとは言えない,ことになります.
エクセル
の,データ分析,でも,
t-検定: 一対の標本による平均の検定ツール
変数 1 | 変数 2 | |
平均 | 154 | 144 |
分散 | 130 | 67.5 |
観測数 | 5 | 5 |
ピアソン相関 | -0.08006 | |
仮説平均との差異 | 0 | |
自由度 | 4 | |
t | 1.53393 | |
P(T<=t) 片側 | 0.099915 | |
t 境界値 片側 | 2.131847 | |
P(T<=t) 両側 | 0.199829 | |
t 境界値 両側 | 2.776445 |
と一致しています.
次は,対応のないデータの場合で,母分散が未知で等しい場合です.