Welchの自由度の求め方-05
Welchの1947年の論文,
The Generalization of `Student's' Problem when Several Different Population Variances are Involved
B. L. Welch Biometrika, Vol. 34, No. 1/2 (Jan., 1947), pp. 28-35 (8 pages)
https://doi.org/10.2307/2332510
には,以下の記述があります
\(\Large \displaystyle f = \frac{ \left( \displaystyle \sum \lambda_i \sigma_i^2 \right)^2}{ \displaystyle \sum \frac{ \lambda_i^2 \sigma_i^4}{f_i}} \hspace{60pt} (28) \)
とあります.ここで,論文では,
\(\Large \displaystyle \lambda_i = \frac{1}{n_i} \)
\(\Large \displaystyle f_i = n_i - 1 \)
とのことです.
そのあとの文章は,
Not knowing the σi's in (28), there are several ways in which we may now proceed, depending on what weight we may be willing to attach to any vague a priori notions we may possess of their relative magnitudes (cf. Welch, 1938). If we are not willing to assume anything, perhaps the best choice is
翻訳すると(DeepLにお願いしました)
(28)のσiを知らない場合、σiの相対的な大きさについて曖昧な先験的概念をどの程度重視するかによって、いくつかの方法が考えられる(Welch, 1938参照)。もし何も仮定したくないのであれば、おそらく最良の選択は,
\(\Large \displaystyle
f = \frac{ \left( \displaystyle
\sum \lambda_i s_i^2 \right)^2 - 2 \left( \displaystyle
\sum \frac{ \lambda_i^2 s_i^4 }{f_i + 2}\right)}
{ \displaystyle
\left( \sum \frac{ \lambda_i^2 s_i^4 }{f_i + 2}\right)} \hspace{60pt} (29) \)
It may be shown that the numerator of (29) has, in repeated samples, an average value \(\Large \displaystyle \sum \left( \displaystyle \lambda_i \sigma_i^2 \right)^2 \) , and the denominator has average value of X. In a certain sense, therefore,(29) is a fair estimate of (28).
(29)の分子は反復標本において平均値 \(\Large \displaystyle \sum \left( \displaystyle \lambda_i \sigma_i^2 \right)^2 \) を持ち、分母は平均値Xを持つことが示される。したがって、ある意味で(29)は(28)の公正な推定値である。
と現在通常使われている記号とは異なる記号ですね.
ここで,i=1,2,として現在の記号で書き換えると,
(28)
\(\Large \displaystyle = \frac{ \left( \displaystyle \sum \lambda_i \sigma_i^2 \right)^2}{ \displaystyle \sum \frac{ \lambda_i^2 \sigma_i^4}{f_i}} \)
\(\Large \displaystyle
f = \frac{ \displaystyle
\left( \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2} \right)^2}
{ \displaystyle
\frac{\left( \frac{ \sigma_1^2}{n_1} \right)^2}{n_1 - 1} + \frac{\left( \frac{ \sigma_2^2}{n_2} \right)^2}{n_2 - 1}} \)
と今までの議論での式と一致します.
(29)
\(\Large \displaystyle
f = \frac{ \left( \displaystyle
\sum \lambda_i s_i^2 \right)^2 - 2 \left( \displaystyle
\sum \frac{ \lambda_i^2 s_i^4 }{f_i + 2}\right)}
{ \displaystyle
\left( \sum \frac{ \lambda_i^2 s_i^4 }{f_i + 2}\right)} \)
\(\Large \displaystyle
f = \frac{ \left( \displaystyle
\frac{ s_1^2}{n_1} + \frac{ s_2^2}{n_2} \right)^2 - 2 \left( \displaystyle
\frac{ s_1^4 }{n_1^2 (n_1 +1)} + \frac{ s_2^4 }{n_2^2 (n_2 +1)} \right)}
{ \displaystyle
\frac{ s_1^4 }{n_1^2 (n_1 +1)} + \frac{ s_2^4 }{n_2^2 (n_2 +1)} } \)
とかなりややこしくなります.
なぜ,こんな数式になったのかはわかりませんでした...
とりあえず,これらの式の正当性をシミュレーションしてみます.