ウィルコクソンの符号順位統計量
ウィルコクソンの符号順位統計量,は
対応のあるデータのデータの差がプラスかマイナスか
という検定となります.
こちらのサイトを参考にさせていただきました.データ,を少しいじりました,同列の順位があるとややこしいので変えてあります..データをいじっても順位が変わらなければ結果は同じとなります.
10セットのデータを用意します.
今回は単純のため,変化なしのデータ,やタイデータは考慮しないデータセットとしました(変化なしの場合は除く,らしい.タイデータの場合は???)
before | after | |
A | 12 | 8 |
B | 7 | 20 |
C | 19 | 28 |
D | 22 | 23 |
E | 15 | 22 |
F | 15 | 20 |
G | 15 | 23 |
H | 11 | 17 |
I | 15 | 13 |
J | 11 | 8 |
差分をとります.
before | after | 差 | |
A | 12 | 8 | 4 |
B | 7 | 20 | -13 |
C | 19 | 28 | -9 |
D | 22 | 23 | -1 |
E | 15 | 22 | -7 |
F | 15 | 20 | -5 |
G | 15 | 23 | -8 |
H | 11 | 17 | -6 |
I | 15 | 13 | 2 |
J | 11 | 8 | 3 |
絶対値をとり,絶対値による順位を付けます.
before | after | 差 | 差の絶対値 | 絶対値の順位 | |
A | 12 | 8 | 4 | 4 | 4 |
B | 7 | 20 | -13 | 13 | 10 |
C | 19 | 28 | -9 | 9 | 9 |
D | 22 | 23 | -1 | 1 | 1 |
E | 15 | 22 | -7 | 7 | 7 |
F | 15 | 20 | -5 | 5 | 5 |
G | 15 | 23 | -8 | 8 | 8 |
H | 11 | 17 | -6 | 6 | 6 |
I | 15 | 13 | 2 | 2 | 2 |
J | 11 | 8 | 3 | 3 | 3 |
変化量がプラスの場合とマイナスの場合に分けます.
before | after | 差 | 差の絶対値 | 絶対値の順位 | プラスの順位 | マイナスの順位 | |
A | 12 | 8 | 4 | 4 | 4 | 4 | |
B | 7 | 20 | -13 | 13 | 10 | 10 | |
C | 19 | 28 | -9 | 9 | 9 | 9 | |
D | 22 | 23 | -1 | 1 | 1 | 1 | |
E | 15 | 22 | -7 | 7 | 7 | 7 | |
F | 15 | 20 | -5 | 5 | 5 | 5 | |
G | 15 | 23 | -8 | 8 | 8 | 8 | |
H | 11 | 17 | -6 | 6 | 6 | 6 | |
I | 15 | 13 | 2 | 2 | 2 | 2 | |
J | 11 | 8 | 3 | 3 | 3 | 3 | |
合計 | 9 | 46 |
期待値,分散値は,
\(\Large \displaystyle E(T)= \frac{n(n+1)}{4} = \frac{10(10+1)}{4} = 27.5 \)
\(\Large \displaystyle V(T)= \frac{n(n+1)(1n+1)}{24} = \frac{10(10+1)(2 \cdot 10 +1)}{24} = 96.25 \)
となりますので,z値は,
\(\Large \displaystyle z_+ = \frac{T_+-E(T_+)}{\sqrt{V(T_+)}} = \frac{9-27.5}{\sqrt{96.25}} = -1.886 \)
\(\Large \displaystyle z_- = \frac{T_--E(T_-)}{\sqrt{V(T_-)}} = \frac{46-27.5}{\sqrt{96.25}} = 1.886 \)
標準正規分布における両側5%の範囲は,こちらに,記載しましたように,±1.96,となるので,
\(\Large \displaystyle -1.96 < \frac{T-E(T)}{\sqrt{V(T)}} < 1.96 \)
となり,±1.96の範囲内なので,有意さがあるとは言えない,ことになります.
次ページに,期待値と,分散値の求め方を考えていきましょう.