検定-02

 

・ 二つの母集団の母平均には差がない,と仮定した場合

対応がある場合で,母分散がわからない場合をまず考えていきましょう.

\(\Large \displaystyle - t_{\alpha/2} (n-1) \hspace{12 pt}\leq \hspace{12 pt} \frac{ \bar{x}_d}{ \sqrt{\frac{\color{red}{s_d}^2}{n}}} \hspace{12 pt} \leq \hspace{12 pt} t_{\alpha/2} (n-1) \)

サンプルデータは,統計ウェッブ 24-5,を参考にさせていただきました.

そのまま値を使うのはあまりよくないかな?と思い,少し値を変えています.

 

before after difference
1 170 140 30
2 150 155 -5
3 160 140 20
4 140 135 5
5 150 150 0
       
Average 154 144 10

ここで,n=5,なので,差分の不偏分散は,

\(\Large \displaystyle s_d^2 = \frac{(30-10)^2+(-5-10)^2+(20-10)^2+(5-10)^2+(0-10)^2}{5-1} = 212.5 \)

t値は,

\(\Large \displaystyle t = \frac{10}{\sqrt {\frac{212.5}{5}}} = 1.53393 \)

t境界値(片側)は,エクセル関数から,

\(\Large \displaystyle =T.INV(1-0.05,5-1) = 2.131847 \)

となり,t値は,推定した区間の中に入っているので,仮説,

 二つの母集団の母平均には差がない

が認められるため,

 二つの母平均に差がないことが確率的に実証される

ことになり,before -> after,で変化があったとは言えない,ことになります.

エクセル

の,データ分析,でも,

t-検定: 一対の標本による平均の検定ツール

  変数 1 変数 2
平均 154 144
分散 130 67.5
観測数 5 5
ピアソン相関 -0.08006
仮説平均との差異 0
自由度 4
1.53393
P(T<=t) 片側 0.099915
t 境界値 片側 2.131847
P(T<=t) 両側 0.199829
t 境界値 両側 2.776445  

と一致しています.

 

・ 差がないと仮定しない場合

次に,新しく考えた計算方法で,同様の計算をしていきましょう.

\(\Large \displaystyle \mu_d = \bar{x}_d \pm t_{\alpha/2} (n-1) \cdot \sqrt{\frac{{s_d}^2}{n}}\)

\(\Large \displaystyle s_d^2 = \frac{(30-10)^2+(-5-10)^2+(20-10)^2+(5-10)^2+(0-10)^2}{5-1} = 212.5 \)

\(\Large \displaystyle \sqrt{ \frac{s_d^2}{n}} = \sqrt{ \frac{212.5}{5}} = 6.52 \)

\(\Large \displaystyle \overline{x}_d = 10 \)

 

t境界値は,片側・両側ともエクセルで計算すると,

\(\Large \displaystyle t_{\alpha/2} (n-1) = T.INV(1-0.05,5-1) = 2.13\)

\(\Large \displaystyle \hspace{70 pt} = T.INV.2T(0.05,5-1) = 2.78 \)

両側を使うとした場合,

\(\Large \displaystyle \overline{x}_d - t_{\alpha/2} (n-1) \cdot \sqrt{ \frac{s_d^2}{n}} \hspace{10 pt} \leq \hspace{10 pt}\displaystyle \mu_d \hspace{10 pt} \leq \hspace{10 pt}\overline{x}_d + t_{\alpha/2} (n-1) \cdot \sqrt{ \frac{s_d^2}{n}}\)

\(\Large \displaystyle \hspace{40 pt} 10-2.78 \times6.52 \hspace{10 pt} \leq \hspace{10 pt} \mu_d \hspace{10 pt} \leq \hspace{10 pt} 10+2.78 \times6.52 \)

\(\Large \displaystyle \hspace{105 pt} -8.13 \hspace{10 pt} \leq \hspace{10 pt} \mu_d \hspace{10 pt} \leq \hspace{10 pt} 28.13 \)

となり,区間に0を含むことになります.

したがって,母平均の差が0(母平均が等しい),場合も否定できない,ことになり,有意差があるとは言えない,となるのです.

こちらのほうがわかりやすいかな?

 

次は,対応のないデータの場合で,母分散が未知で等しい場合です.

 

l t r