そんな場合(母集団の平均がわからないのに,分散がわかっているなんて),はまずありえないのですが(普通は母平均も母分散もわからない),この計算が基本となります.
母集団の平均μ,分散σ2の場合,その集団の分布は,
\(\Large \displaystyle p(x) = \frac{1}{\sqrt{ 2 \pi \sigma^2}} exp \left[ - \frac{(x - \mu)^2}{2 \sigma^2} \right]\)
です.n回施行した場合の平均値の分布は,さきの中心極限定理にあるように分散値が1/nとなりますので,
\(\Large \displaystyle p(\bar{x}) = \frac{1}{\sqrt{ 2 \pi \frac{\sigma^2}{n}}} exp \left[ - \frac{(\bar{x} - \mu)^2}{2 \frac{\sigma^2}{n}} \right]\)
という正規分布になります.この正規分布の中で95%の範囲に入っている範囲の値,が平均値からの母平均の推定となります
つまり,
\(\Large \displaystyle \int_{\mu - a}^{\mu + a} \frac{1}{\sqrt{ 2 \pi \frac{\sigma^2}{n}}} exp \left[ - \frac{(\bar{x} - \mu)^2}{2 \frac{\sigma^2}{n}} \right] \ dx = 0.95 \)
となる,a,を求めればいいことになります.
ここでの計算の王道は,標準化,することです.標準化とは,
\(\Large exp \left[ -\frac{(\bar{x} - \mu)^2}{2 \frac{\sigma^2}{n}} \right] \rightarrow exp \left[ - \frac{t^2}{2} \right] \)
と平均μ=0,分散σ2=1を指します.
計算から言うと,変数変換を,
\(\Large exp \left[ -\frac{(\bar{x} - \mu)^2}{2 \frac{\sigma^2}{n}} \right] \rightarrow exp \left[ - t^2 \right] \)
としたほうが簡単なのですが,この,標準化,という統計における中心的考えがありますので,計算を楽にする,というよりは,この王道に従うほうが後々スッキリしそうです.王道に従って,
\(\Large \frac{(\bar{x} - \mu)^2}{ \frac{\sigma^2}{n}} \equiv t^2 \)
とすれば,
\(\Large \frac{\bar{x} - \mu}{ \sqrt{\frac{\sigma^2}{n}}} = t \)
\(\Large \bar{x} = \sqrt{\frac{\sigma^2}{n}} t + \mu \)
\(\Large d \bar{x} = \sqrt{\frac{\sigma^2}{n}} \ dt \)
となるので,\(\Large \bar{x} \)の範囲からtの範囲を計算すると,
\(\Large \mu -a \hspace{12 pt} \rightarrow \hspace{12 pt} \bar{x} \hspace{12 pt} \rightarrow \hspace{12 pt} \mu +a\)
\(\Large \frac{-a}{ \sqrt{\frac{\sigma^2}{n}}} \hspace{17 pt} \rightarrow \hspace{13 pt} t \hspace{14 pt} \rightarrow \hspace{12 pt} \frac{a}{ \sqrt{\frac{\sigma^2}{n}}} \)
したがって,
\(\Large \displaystyle \frac{1}{\sqrt{ 2 \pi \frac{\sigma^2}{n}}} \int_{\mu - a}^{\mu + a} exp \left[ - \frac{(\bar{x} - \mu)^2}{2 \frac{\sigma^2}{n}} \right] \ dx = 0.95 \)
\(\Large \displaystyle = \frac{1}{\sqrt{ 2 \pi \frac{\sigma^2}{n}}} \sqrt{\frac{\sigma^2}{n}} \displaystyle \int_{\frac{-a}{ \sqrt{\frac{\sigma^2}{n}}}}^{\frac{a}{ \sqrt{\frac{\sigma^2}{n}}}} exp \left[ - \frac{t^2}{2 } \right] \ dx = 0.95 \)
\(\Large \displaystyle = \frac{1}{\sqrt{ 2 \pi }} \displaystyle \int_{\frac{-a}{ \sqrt{\frac{\sigma^2}{n}}}}^{\frac{a}{ \sqrt{\frac{\sigma^2}{n}}}} exp \left[ - \frac{t^2}{2 } \right] \ dx = 0.95 \)
この分布は, 平均:0 分散:1 の標準正規分布となります.
\(\Large \displaystyle = \frac{1}{\sqrt{ 2 \pi }} \displaystyle exp \left[ - \frac{t^2}{2 } \right] \)
この分布の95%を占める割合(左右対称)は,累積標準化正規分布関数が,0.975(1-0.05/2)の値を求めればいいので, エクセル関数では,
NORM.INV(0.975,0,1)= 1.969964...=1.96となります. もしくは,ここ,つまり,
\(\Large \displaystyle \pm \frac{ a}{ \sqrt{\frac{\sigma^2}{n}}} = \pm 1.96 \)
\(\Large \displaystyle a =1.96 \times \sqrt{\frac{\sigma^2}{n}} \)
となります,\(\Large \bar{x} \)の範囲は,
\(\Large \mu -a \hspace{12 pt} \rightarrow \hspace{12 pt} \bar{x} \hspace{12 pt} \rightarrow \hspace{12 pt} \mu +a\)
なので,
\(\Large \mu - 1.96 \times \sqrt{\frac{\sigma^2}{n}} \hspace{12 pt}\leq \hspace{12 pt} \bar{x} \hspace{12 pt} \leq \hspace{12 pt} \mu +1.96 \times \sqrt{\frac{\sigma^2}{n}}\)
\(\Large \bar{x} \), と \(\Large \mu \),を入れ替えると,
\(\Large \mu - 1.96 \times \sqrt{\frac{\sigma^2}{n}} - \mu - \bar{x} \hspace{12 pt}\leq \hspace{12 pt} \bar{x} - \mu - \bar{x} \hspace{12 pt} \leq \hspace{12 pt} \mu +1.96 \times \sqrt{\frac{\sigma^2}{n}}- \mu - \bar{x} \)
\(\Large - \bar{x} - 1.96 \times \sqrt{\frac{\sigma^2}{n}} \hspace{12 pt}\leq \hspace{12 pt} - \mu \hspace{12 pt} \leq \hspace{12 pt} - \bar{x} +1.96 \times \sqrt{\frac{\sigma^2}{n}} \)
-1を掛けると,
\(\Large \bar{x} + 1.96 \times \sqrt{\frac{\sigma^2}{n}} \hspace{12 pt}\geq \hspace{12 pt} \mu \hspace{12 pt} \geq \hspace{12 pt} \bar{x} - 1.96 \times \sqrt{\frac{\sigma^2}{n}} \)
左右を入れ替えると,
\(\Large \bar{x} - 1.96 \times \sqrt{\frac{\sigma^2}{n}} \hspace{12 pt}\leq \hspace{12 pt} \mu \hspace{12 pt} \leq \hspace{12 pt} \bar{x} + 1.96 \times \sqrt{\frac{\sigma^2}{n}} \)
もしくは,
\(\Large \displaystyle - 1.96 \hspace{12 pt}\leq \hspace{12 pt} \frac{\mu - \bar{x}}{ \sqrt{\frac{\sigma^2}{n}}} \hspace{12 pt} \leq \hspace{12 pt} 1.96 \)
と母平均,μ,の範囲を推定できます.
さて,1.96,という値は,エクセル関数,もしくは表から求めましたが,きちんと計算(誤差関数を使いますが)できるはずです.
それは,ここ,に記載します.
また,95%という数字に関しての議論は,ここ,に議論します.
つぎに,母平均がわかっていなくて,母分散もわかっていない場合の区間推定,について検討していきましょう.