・ 二つの母集団の母平均には差がない,と仮定した場合
対応がある場合で,母分散がわからない場合をまず考えていきましょう.
\(\Large \displaystyle - t_{\alpha/2} (n-1) \hspace{12 pt}\leq \hspace{12 pt} \frac{ \bar{x}_d}{ \sqrt{\frac{\color{red}{s_d}^2}{n}}} \hspace{12 pt} \leq \hspace{12 pt} t_{\alpha/2} (n-1) \)
サンプルデータは,統計ウェッブ 24-5,を参考にさせていただきました.
そのまま値を使うのはあまりよくないかな?と思い,少し値を変えています.
| before | after | difference | |
| 1 | 170 | 140 | 30 |
| 2 | 150 | 155 | -5 |
| 3 | 160 | 140 | 20 |
| 4 | 140 | 135 | 5 |
| 5 | 150 | 150 | 0 |
| Average | 154 | 144 | 10 |
ここで,n=5,なので,差分の不偏分散は,
\(\Large \displaystyle s_d^2 = \frac{(30-10)^2+(-5-10)^2+(20-10)^2+(5-10)^2+(0-10)^2}{5-1} = 212.5 \)
t値は,
\(\Large \displaystyle t = \frac{10}{\sqrt {\frac{212.5}{5}}} = 1.53393 \)
t境界値(片側)は,エクセル関数から,
\(\Large \displaystyle =T.INV(1-0.05,5-1) = 2.131847 \)
となり,t値は,推定した区間の中に入っているので,仮説,
二つの母集団の母平均には差がない
が認められるため,
二つの母平均に差がないことが確率的に実証される
ことになり,before -> after,で変化があったとは言えない,ことになります.
エクセル
の,データ分析,でも,
t-検定: 一対の標本による平均の検定ツール
| 変数 1 | 変数 2 | |
| 平均 | 154 | 144 |
| 分散 | 130 | 67.5 |
| 観測数 | 5 | 5 |
| ピアソン相関 | -0.08006 | |
| 仮説平均との差異 | 0 | |
| 自由度 | 4 | |
| t | 1.53393 | |
| P(T<=t) 片側 | 0.099915 | |
| t 境界値 片側 | 2.131847 | |
| P(T<=t) 両側 | 0.199829 | |
| t 境界値 両側 | 2.776445 |
と一致しています.
・ 差がないと仮定しない場合
次に,新しく考えた計算方法で,同様の計算をしていきましょう.
\(\Large \displaystyle \mu_d = \bar{x}_d \pm t_{\alpha/2} (n-1) \cdot \sqrt{\frac{{s_d}^2}{n}}\)
\(\Large \displaystyle s_d^2 = \frac{(30-10)^2+(-5-10)^2+(20-10)^2+(5-10)^2+(0-10)^2}{5-1} = 212.5 \)
\(\Large \displaystyle \sqrt{ \frac{s_d^2}{n}} = \sqrt{ \frac{212.5}{5}} = 6.52 \)
\(\Large \displaystyle \overline{x}_d = 10 \)
t境界値は,片側・両側ともエクセルで計算すると,
\(\Large \displaystyle t_{\alpha/2} (n-1) = T.INV(1-0.05,5-1) = 2.13\)
\(\Large \displaystyle \hspace{70 pt} = T.INV.2T(0.05,5-1) = 2.78 \)
両側を使うとした場合,
\(\Large \displaystyle \overline{x}_d - t_{\alpha/2} (n-1) \cdot \sqrt{ \frac{s_d^2}{n}} \hspace{10 pt} \leq \hspace{10 pt}\displaystyle \mu_d \hspace{10 pt} \leq \hspace{10 pt}\overline{x}_d + t_{\alpha/2} (n-1) \cdot \sqrt{ \frac{s_d^2}{n}}\)
\(\Large \displaystyle \hspace{40 pt} 10-2.78 \times6.52 \hspace{10 pt} \leq \hspace{10 pt} \mu_d \hspace{10 pt} \leq \hspace{10 pt} 10+2.78 \times6.52 \)
\(\Large \displaystyle \hspace{105 pt} -8.13 \hspace{10 pt} \leq \hspace{10 pt} \mu_d \hspace{10 pt} \leq \hspace{10 pt} 28.13 \)
となり,区間に0を含むことになります.
したがって,母平均の差が0(母平均が等しい),場合も否定できない,ことになり,有意差があるとは言えない,となるのです.
こちらのほうがわかりやすいかな?
次は,対応のないデータの場合で,母分散が未知で等しい場合です.