回帰分析における決定係数について
ここで,実験で得られたデータをグラフ化した際によく使われるのが,
近似曲線
ですね.
エクセルなどでも比較的簡単に利用できます.
その際に,エクセルのオプションにあるのが,
R-2乗値を表示する
があります.
これにチェックを入れると,グラフ上に,0.96....,などの値が表示され,何となく,
1に近いといい近似なんだな
と思っています.
上の図では,
青:0.9941
赤:0.9643
であって,プロットを見ても,青いデータの方が近似曲線によく載っていることがわかります.
では,この値はいったい何を意味するもので,どのような指標なのでしょうか?
どうも,このR2が決定係数と呼ばれるもののようです.
正直...私もまだ回帰分析をよく理解していません.
ですので,わかる範囲での説明となります.
直線近似の求め方
全体のばらつきからの決定係数の求め方
共分散からの決定係数の求め方
二つの方法は一致するか?
直線近似における決定係数の変化
について,説明していきたいと思います.