「統計学関連なんでもあり」の過去ログ--- 042

No.09568　パラメトリックとノンパラメトリックで結果が違う場合　　【弘】　2009/03/18(Wed) 11:55

初めまして。2群間の平均値の比較に関してお聞きしたいことがあり書き込みさせていただきます。
n数が200以上ある2つの集団のストレスの平均値の点数で有意差が出るかどうかを検定したいと考えています。どちらの集団の点数も正規分布してなく，等分散性は仮定されていません。パラメトリック検定（t検定とウェルチ法）では有意差がなく，ノンパラメトリック検定（Mann-Whitney検定）では有意差が出ました。n数が大きい場合は正規分布していなくてもパラメトリック検定を使っても良いそうですが，両者で結果が違う場合はどちらを優先するべきなのでしょうか？初歩的な質問で恐縮ですが，どうぞよろしくお願い致します。

No.09569　Re: パラメトリックとノンパラメトリックで結果が違う場合　　【青木繁伸】　2009/03/18(Wed) 12:24

本来は，どの検定方法によるかは事前に決定しておくべきで，データを見て考えたり，あれこれやってみるというのは避けるべしと，教科書には書いてあります。
それはさておき，「ストレスの点数」というのは，ストレスに関する複数の質問への回答の合計点みたいなものでしょうか。最低点，最高点とか，分布の形がどんな風かとかを考える必要があると思います。普通に考えればパラメトリック検定で有意になるがノンパラメトリック検定では有意にならないということの方が多いわけで，ボーダーラインではそれが逆になることもあるのですが。P値は幾つと幾つだったんでしょうね。
「両者で結果が違う場合はどちらを優先するべきなのでしょうか」ということですが，大元に立ち返って，測定値の特性・性質などから考えて，ノンパラメトリック検定の方がよいのかパラメトリック検定の方がよいかを，（結果にとらわれずに）再考するのがよいと思いますけど。

No.09573　Re: パラメトリックとノンパラメトリックで結果が違う場合　　【後医は名医】　2009/03/18(Wed) 23:00

南江堂「バイオサイエンスの統計学」（市原清志著）p310には「ノンパラメトリックで有意なら，一応，純確率論的には”統計学的に有意”と判定してさしつかえない」と記載されています。ただし，さらに「統計はあいまいなデータを扱う数学で，それゆえに検定方法によって結論がまちまちのあいまいな（灰色の）領域が存在する（中略）この種の灰色の領域ではあまり断定的なことを言わない方が無難である」とも記載されています。

No.09575　Re: パラメトリックとノンパラメトリックで結果が違う場合　　【ひの】　2009/03/18(Wed) 23:08

　そもそも検定しているモノが違う（t検定は平均値の差の検定，Mann-Whitney検定は中央値の差の検定）なので，中央値には差があったが平均値には差がなかったということになります。

No.09579　Re: パラメトリックとノンパラメトリックで結果が違う場合　　【青木繁伸】　2009/03/19(Thu) 11:20

必ずしも，検定対象が違うからそのような結果になったということではない例。
それぞれの群において平均値と中央値が同じで，二群の分散が等しいというデータです。

> ### パラメトリック検定では有意，ノンパラメトリック検定では有意ではない
> x <-c(1.82208249366043, 0.417468514863367, 3.01924113225667, 0.97869135073461, 
+ 0.641194285981827, -0.581646793019271, 1.42527710310225, 0.636576428839017, 
+ 1.01024634407738, 1.62705590788162, 2.55317407822650, 1.24901702451278, 
+ -0.073245787945683, 2.65854758725580, 1.35157569726435)
> y <- c(-0.258492009659694, 0.724954792930489, -1.17373457669026, 1.42958469568542, 
+ 0.581340181827595, 1.44851196492083, -0.175819275420417, -0.201211383766225, 
+ 0.48386837068619, 0.120215910850285, 1.5565927938839, -0.0636498939967611, 
+ 2.71996448376495, 0.70920910532673, -0.643309562165001)
> fmt <- "%s: Mean = %.8f,  Median = %.8f,  S.D. = %.8f\n"
> cat(sprintf(fmt, "x", mean(x), median(x), sd(x)))
x: Mean = 1.24901702,  Median = 1.24901702,  S.D. = 1.00000000
> cat(sprintf(fmt, "y", mean(y), median(y), sd(y)))
y: Mean = 0.48386837,  Median = 0.48386837,  S.D. = 1.00000000
> t.test(x, y)

	Welch Two Sample t-test

data:  x and y 
t = 2.0954, df = 28, p-value = 0.0453
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 0.01717612 1.51312118 
sample estimates:
mean of x mean of y 
1.2490170 0.4838684 

> wilcox.test(x, y)

	Wilcoxon rank sum test

data:  x and y 
W = 158, p-value = 0.06128
alternative hypothesis: true location shift is not equal to 0 

> ### パラメトリック検定では有意ではない，ノンパラメトリック検定では有意
> x <-c(0.419636115940048, -0.0128562250702561, 0.672260123265524, 
+ 0.217699526204537, 1.23235006423275, -0.424093391804082, -0.560593233220303, 
+ 0.573463180654675, 1.30734920852281, -1.98059416349581, -0.128278513847658, 
+ -0.512514054912623, 2.34210603843254, 0.440563865650573, -0.321005647484697)
> y <- c(0.619255713308288, 1.26490061940391, -1.09529377835144, 2.64214137424783, 
+ 0.571876148194529, 1.18574748279805, 1.75254454789167, 0.947212043548434, 
+ 0.273888626830089, 0.851788661111639, 1.53533181187883, 2.32810705647224, 
+ 1.69916369894470, -0.356773509479761, -0.0117098688667396)
> fmt <- "%s: Mean = %.8f,  Median = %.8f,  S.D. = %.8f\n"
> cat(sprintf(fmt, "x", mean(x), median(x), sd(x)))
x: Mean = 0.21769953,  Median = 0.21769953,  S.D. = 1.00000000
> cat(sprintf(fmt, "y", mean(y), median(y), sd(y)))
y: Mean = 0.94721204,  Median = 0.94721204,  S.D. = 1.00000001
> t.test(x, y)

	Welch Two Sample t-test

data:  x and y 
t = -1.9979, df = 28, p-value = 0.05553
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 -1.47748505  0.01846002 
sample estimates:
mean of x mean of y 
0.2176995 0.9472120 

> wilcox.test(x, y)

	Wilcoxon rank sum test

data:  x and y 
W = 64, p-value = 0.04533
alternative hypothesis: true location shift is not equal to 0

No.09580　Re: パラメトリックとノンパラメトリックで結果が違う場合　　【ひの】　2009/03/19(Thu) 11:29

>それぞれの群において平均値と中央値が同じで，二群の分散が等しいというデータです。

ええと，平均値と中央値とに違いがあるかどうかを見ているわけではないので，無意味。

ではたとえば，平均値と分散の値がそれぞれの群で同じとき，平均値には差があったが分散には差がなかったというのはおかしいですか？それぞれ全然別のことでしょう？

No.09581　Re: パラメトリックとノンパラメトリックで結果が違う場合　　【青木繁伸】　2009/03/19(Thu) 11:38
x: Mean = 0.21769953,  Median = 0.21769953,  S.D. = 1.00000000
y: Mean = 0.94721204,  Median = 0.94721204,  S.D. = 1.00000001
ということなんですけどね。「平均値と中央値とに違いがあるかどうかを見ているわけではないのです」

No.09586　Re: パラメトリックとノンパラメトリックで結果が違う場合　　【ひの】　2009/03/19(Thu) 21:43

>それぞれの群において平均値と中央値が同じで，二群の分散が等しいというデータです。

　このようなデータを用意すること自体が無意味だといっているのです。

私は No. 9575 の発言で「そもそも検定しているモノが違う」と言ったのです。あなたはこれを「検定している値が違う」というように誤解しています。

　平均値と中央値の値がたまたま等しくても，それらが定義の異なる別モノであることには変わりないのです。

No.09587　Re: パラメトリックとノンパラメトリックで結果が違う場合　　【surg】　2009/03/20(Fri) 07:38

びっくりしました．正規性を仮定できればパラメトリックを，そうでなければノンパラメトリックをというように何も疑わずにやっておりましたが，パラメトリックが利用可能な場合もノンパラメトリックを使った方が検出力が高い場合があるという事でしょうか？

No.09588　Re: パラメトリックとノンパラメトリックで結果が違う場合　　【ひの】　2009/03/20(Fri) 13:40

>パラメトリックが利用可能な場合もノンパラメトリックを使った方が検出力が高い場合があるという事でしょうか？

　有意差が出たほうが検出力が高いという単純な話ではありません。同じデータを異なる統計モデルで検定しているのだから異なる結果になるのはよくあることというだけです。