No.03008 並べ替え検定(U統計量)  【後医は名医】 2007/03/16(Fri) 20:02

次のデータの場合
A<-c(<0.34,3,6)
B<-c(2,5,50,100以上,100以上)を青木先生の並べ替え検定(U統計量)で行った場合,<0.34を0.34,100以上を100にして検定すると

第一群の中央値 = 3.00000 (n1 = 3)
第二群の中央値 = 50.0000 (n2 = 5)
観察されたデータにおける U = 3.00000
並べ替え検定による正確な P 値 = 0.2321428571 ( = 13 / 56 )

になります。しかし,サンプルサイズが3と5におけるU=3での検定表の値は0.25(両側検定)になっています。実際,手計算で56通りの組み合わせのU値を出して計算すると14/56=0.25となります。この違いは一体何なのでしょうか。

No.03009 Re: 並べ替え検定(U統計量)  【青木繁伸】 2007/03/16(Fri) 23:19

十分に検討していませんが,以下の56例で@をつけた13例ではないかと思うのですが。
x1			x2					U	
0.34 3 2 6 5 50 100 100 0 @
0.34 2 5 3 6 50 100 100 1 @
0.34 3 5 6 2 50 100 100 2 @
0.34 6 2 3 5 50 100 100 2 @
0.34 3 6 2 5 50 100 100 3 @観察例
0.34 2 50 3 6 5 100 100 3 @
3 2 5 0.34 6 50 100 100 3 @
0.34 3 50 6 2 5 100 100 4
0.34 6 5 3 2 50 100 100 4
3 6 2 0.34 5 50 100 100 4
0.34 2 100 3 6 5 50 100 4.5
0.34 2 100 3 6 5 50 100 4.5
0.34 5 50 3 6 2 100 100 5
3 2 50 0.34 6 5 100 100 5
6 2 5 0.34 3 50 100 100 5
0.34 3 100 6 2 5 50 100 5.5
0.34 3 100 6 2 5 50 100 5.5
0.34 6 50 3 2 5 100 100 6
3 6 5 0.34 2 50 100 100 6
2 5 50 0.34 3 6 100 100 6
0.34 5 100 3 6 2 50 100 6.5
0.34 5 100 3 6 2 50 100 6.5
3 2 100 0.34 6 5 50 100 6.5
3 2 100 0.34 6 5 50 100 6.5
3 5 50 0.34 6 2 100 100 7
6 2 50 0.34 3 5 100 100 7
0.34 6 100 3 2 5 50 100 7.5
0.34 6 100 3 2 5 50 100 7.5
2 5 100 0.34 3 6 50 100 7.5
2 5 100 0.34 3 6 50 100 7.5
3 6 50 0.34 2 5 100 100 8
0.34 50 100 3 6 2 5 100 8.5
0.34 50 100 3 6 2 5 100 8.5
3 5 100 0.34 6 2 50 100 8.5
3 5 100 0.34 6 2 50 100 8.5
6 2 100 0.34 3 5 50 100 8.5
6 2 100 0.34 3 5 50 100 8.5
6 5 50 0.34 3 2 100 100 9
3 6 100 0.34 2 5 50 100 9.5
3 6 100 0.34 2 5 50 100 9.5
2 50 100 0.34 3 6 5 100 9.5
2 50 100 0.34 3 6 5 100 9.5
0.34 100 100 3 6 2 5 50 10
3 50 100 0.34 6 2 5 100 10.5
3 50 100 0.34 6 2 5 100 10.5
6 5 100 0.34 3 2 50 100 10.5
6 5 100 0.34 3 2 50 100 10.5
2 100 100 0.34 3 6 5 50 11
5 50 100 0.34 3 6 2 100 11.5
5 50 100 0.34 3 6 2 100 11.5
3 100 100 0.34 6 2 5 50 12 @
6 50 100 0.34 3 2 5 100 12.5 @
6 50 100 0.34 3 2 5 100 12.5 @
5 100 100 0.34 3 6 2 50 13 @
6 100 100 0.34 3 2 5 50 14 @
50 100 100 0.34 3 6 2 5 15 @

U統計量の分布は同値がないことを仮定しているので,二つある 100 を,たとえば 100 と 110 とすれば以下のようになり,14/56 ということでしょう
x1			x2					U	
0.34 3 2 6 5 50 100 110 0 @
0.34 2 5 3 6 50 100 110 1 @
0.34 3 5 6 2 50 100 110 2 @
0.34 6 2 3 5 50 100 110 2 @
0.34 3 6 2 5 50 100 110 3 @観察例
0.34 2 50 3 6 5 100 110 3 @
3 2 5 0.34 6 50 100 110 3 @
0.34 3 50 6 2 5 100 110 4
0.34 6 5 3 2 50 100 110 4
0.34 2 100 3 6 5 50 110 4
3 6 2 0.34 5 50 100 110 4
0.34 3 100 6 2 5 50 110 5
0.34 2 110 3 6 5 50 100 5
0.34 5 50 3 6 2 100 110 5
3 2 50 0.34 6 5 100 110 5
6 2 5 0.34 3 50 100 110 5
0.34 3 110 6 2 5 50 100 6
0.34 6 50 3 2 5 100 110 6
0.34 5 100 3 6 2 50 110 6
3 6 5 0.34 2 50 100 110 6
3 2 100 0.34 6 5 50 110 6
2 5 50 0.34 3 6 100 110 6
0.34 6 100 3 2 5 50 110 7
0.34 5 110 3 6 2 50 100 7
3 2 110 0.34 6 5 50 100 7
3 5 50 0.34 6 2 100 110 7
6 2 50 0.34 3 5 100 110 7
2 5 100 0.34 3 6 50 110 7
0.34 6 110 3 2 5 50 100 8
0.34 50 100 3 6 2 5 110 8
3 6 50 0.34 2 5 100 110 8
3 5 100 0.34 6 2 50 110 8
6 2 100 0.34 3 5 50 110 8
2 5 110 0.34 3 6 50 100 8
0.34 50 110 3 6 2 5 100 9
3 6 100 0.34 2 5 50 110 9
3 5 110 0.34 6 2 50 100 9
6 2 110 0.34 3 5 50 100 9
6 5 50 0.34 3 2 100 110 9
2 50 100 0.34 3 6 5 110 9
0.34 100 110 3 6 2 5 50 10
3 6 110 0.34 2 5 50 100 10
3 50 100 0.34 6 2 5 110 10
6 5 100 0.34 3 2 50 110 10
2 50 110 0.34 3 6 5 100 10
3 50 110 0.34 6 2 5 100 11
6 5 110 0.34 3 2 50 100 11
2 100 110 0.34 3 6 5 50 11
5 50 100 0.34 3 6 2 110 11
3 100 110 0.34 6 2 5 50 12 @
6 50 100 0.34 3 2 5 110 12 @
5 50 110 0.34 3 6 2 100 12 @
6 50 110 0.34 3 2 5 100 13 @
5 100 110 0.34 3 6 2 50 13 @
6 100 110 0.34 3 2 5 50 14 @
50 100 110 0.34 3 6 2 5 15 @

No.03010 Re: 並べ替え検定(U統計量)  【青木繁伸】 2007/03/17(Sat) 00:06

R 2.4.0 で,combn 関数がサポートされたのは,たいへんよいことだなあと実感

No.03011 Re: 並べ替え検定(U統計量)  【後医は名医】 2007/03/17(Sat) 00:12

青木先生,早々にありがとうございました。先生のご指摘通りです。原因は当方の勘違いです。2つある「100以 上」のデータを手計算するときに区別するために便宜上「100」と「101」に分けて計算していました。実際に100と101にして先生のサイトで検定す れば確かに14/56となりました。Mann-Whitneyは同順位がないことを前提にしていることは承知していましたが,n1群とn2群間に同順位が なくてもn1群の中に同順位があれば並べ替え検定ですので当然同順位が入ってくることを忘れていました。夜分にお手数かけました(冷や汗)。

● 「統計学関連なんでもあり」の過去ログ--- 040 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る