マン・ホイットニーのU検定

 

マン・ホイットニーのU検定,を検討してきます.

私の理解では,

 自分たちのグループはそれぞれ相手に対してどのぐらい勝っているか?

となります.

まずは一番簡単なケースを考えていきましょう.〇と×が以下の順位になった場合を考えます.

× ×

優った数は,U,という記号となり,
 〇は×に対して,2,1ずつ勝っているので合計は3
 ×は丸に対して,1つ優っているので,合計は1

順位の合計は,R,という記号となり,
 〇:1 + 3 = 4
 ×:2+ 4 = 6

となります.これらの関係は,

\(\Large \displaystyle U_i = n_1 n_2 + \frac{n_i (n_i + 1)}{2} -R_i  \)

となりますので,

\(\Large \displaystyle U_O = n_A n_B + \frac{n_A (n_A + 1)}{2} -R_A = 2 \times 2 + \frac{2 (2+1)}{2} - 4 = 3 \)

\(\Large \displaystyle U_{\times} = n_A n_B + \frac{n_B (n_B + 1)}{2} -R_B = 2 \times 2 + \frac{2 (2+1)}{2} - 6 = 1 \)

と一致することがわかります.

 

・データ数が同じ場合

もうすこし複雑は例を,こちらのサイトのデータをすこし改変させて利用させていただきました.

マン・ホイットニーのU検定の利点は,順位で検定するので,素点が変化しても順位が変化しない限り結果は同じになります.

No. A B
1 27 30
2 33 34
3 24 37
4 22 28
5 29 32

この結果を全体に対して順位を付与します.

No. A   B  
    順位   順位
1 27 3 30 6
2 33 8 34 9
3 24 2 37 10
4 22 1 28 4
5 29 5 32 7
合計   19   36

順位で並べ替えていきます.そして,A,Bがそれぞれいくつ優っているかを計算していきます.

A A A B A B B A B B Win
A A A B A B B A B B 5
A A A B A B B A B B 5
A A A B A B B A B B 5
A A A B A B B A B B 4
A A A B A B B A B B 2
Sum_win 21
A A A B A B B A B B 2
A A A B A B B A B B 1
A A A B A B B A B B 1
A A A B A B B A B B 0
A A A B A B B A B B 0
Sum_win                   4

同様に,

\(\Large \displaystyle U_A = n_1 n_2 + \frac{n_1 (n_1 + 1)}{2} -R_1 = 5 \times 5 + \frac{5 (5+1)}{2} - 19 = 21 \)

\(\Large \displaystyle U_B = n_1 n_2 + \frac{n_2 (n_2 + 1)}{2} -R_2 = 5 \times 5 + \frac{5 (5+1)}{2} - 36 = 4 \)

と一致することがわかります.

 

・データ数が異なる場合

上記の例は,データ数が同じ場合でしたが,データ数が異なる場合も検討してきましょう.

上記のデータからBの5番目のデータを削除します.

No. A B
1 27 30
2 33 34
3 24 37
4 22 28
5 29  

この結果を全体に対して順位を付与します.

No. A   B  
    順位   順位
1 27 3 30 6
2 33 7 34 8
3 24 2 37 9
4 22 1 28 4
5 29 5    
合計   18   27

順位で並べ替えていきます.そして,A,Bがそれぞれいくつ優っているかを計算していきます.

A A A B A B A B B Win
A A A B A B A B B 4
A A A B A B A B B 4
A A A B A B A B B 4
A A A B A B A B B 3
A A A B A B A B B 2
Sum_win 17
A A A B A B A B B 2
A A A B A B A B B 1
A A A B A B A B B 0
A A A B A B A B B 0
Sum_win                 3

同様の計算をすると,

\(\Large \displaystyle U_A = n_1 n_2 + \frac{n_1 (n_1 + 1)}{2} -R_1 = 5 \times 4 + \frac{5 (5+1)}{2} - 18 = 17 \)

\(\Large \displaystyle U_B = n_1 n_2 + \frac{n_2 (n_2 + 1)}{2} -R_2 = 5 \times 4 + \frac{4 (4+1)}{2} - 27 = 3 \)

と一致することがわかります.

次に,マン・ホイットニーのU検定の期待値と分散値,を検討してきます.

 

ltr