No.22111 分散ゼロの場合の平均値の比較  【ヒロ】 2016/08/18(Thu) 23:22

下記の2つの事例に対する判断の成否を教えてください。いずれものある生物のバイオマス増加量データに関するもので,A,B群(いずれも反復数は3)の平均値に有意差があるか知りたいというのがもともとの動機です。各々の判断は正しいでしょうか?

事例1
A群:20,20,25; B群:10,10,10
B群の分散がゼロであり,パラメトリックの検定はできない。ノンパラを行うにしては反復が少なすぎて有意差はそもそも出ない。よって,2群の間に有意差があるかの判断を保留し,反復数を増やして再試験を行う。

事例2
A群:20,20,25; B群:0,0,0
B群の平均値,分散がともにゼロであり,パラメトリックの検定はできない。ノンパラを行うにしては反復が少なすぎて有意差は出ない。しかし,検定はできないが,B群は明らかにバイオマス増加量がゼロなので,A群の方がバイオマスの増加が大きい,と判断する。

アドバイスをいただければ幸いです。
よろしくお願いいたします。

No.22113 Re: 分散ゼロの場合の平均値の比較  【青木繁伸】 2016/08/19(Fri) 10:03

> B群の分散がゼロであり,パラメトリックの検定はできない。
> B群の平均値,分散がともにゼロであり,パラメトリックの検定はできない。

そんなことないでしょう?実際に計算してみましたか?
検定の計算式を見ても,どちらかの分散が0であっても,計算できる(0での割り算は発生しない)。たとえば,
http://aoki2.si.gunma-u.ac.jp/lecture/Average/t-test.html
にある式をみてみましょう。
R での計算結果も示しておきましょうか。
> t.test(c(20, 20, 25), c(10, 10, 10))

Welch Two Sample t-test # ウェルチの方法

data: c(20, 20, 25) and c(10, 10, 10)
t = 7, df = 2, p-value = 0.0198 # 有意
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
4.495579 18.837755
sample estimates:
mean of x mean of y
21.66667 10.00000

> t.test(c(20, 20, 25), c(10, 10, 10), var.equal=TRUE)

Two Sample t-test # 等分散を仮定

data: c(20, 20, 25) and c(10, 10, 10)
t = 7, df = 4, p-value = 0.002192 # 有意
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
7.039258 16.294075
sample estimates:
mean of x mean of y
21.66667 10.00000

> t.test(c(20, 20, 25), c(0, 0, 0))

Welch Two Sample t-test # ウェルチの方法

data: c(20, 20, 25) and c(0, 0, 0)
t = 13, df = 2, p-value = 0.005865 # 有意
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
14.49558 28.83775
sample estimates:
mean of x mean of y
21.66667 0.00000

> t.test(c(20, 20, 25), c(0, 0, 0), var.equal=TRUE)

Two Sample t-test # 等分散を仮定

data: c(20, 20, 25) and c(0, 0, 0)
t = 13, df = 4, p-value = 0.000202 # 有意
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
17.03926 26.29408
sample estimates:
mean of x mean of y
21.66667 0.00000
しかし,いずれの場合も,サンプルサイズが少ないことにクレームが付く可能性が大。

ついでに,

> B群は明らかにバイオマス増加量がゼロ

私は,「明らかにゼロ」とは思いませんが...

No.22114 Re: 分散ゼロの場合の平均値の比較  【ヒロ】 2016/08/19(Fri) 11:41

青木先生
お返事ありがとうございます。分散ゼロの場合は検定できないと決めてかかっていました。すみません。計算式を見て納得しました。

関 連してもう1点お尋ねしたいのですが,3群以上の多重比較を行う場合で,分散が他の群と異なるものがある場合,2群ずつウェルチのt検定を行い,ボンフェ ローニで補正したP値(3群の場合はP=0.05→P=0.017など)に照らして有意性を判断する,というやり方は適正でしょうか?

再びですが,よろしくお願いいたします。

No.22116 Re: 分散ゼロの場合の平均値の比較  【青木繁伸】 2016/08/19(Fri) 21:11

分散が異なろうが同じであろうが,Welch の方法を使えば良いというのは,実例でも裏付けのあることです。

その上で,多重比較を行えばよいというのも,よく知られていることです。

No.22119 Re: 分散ゼロの場合の平均値の比較  【荒】 2016/08/20(Sat) 09:19

3群以上の場合にはGames-Howell法を試してはどうでしょうか。

- http://aoki2.si.gunma-u.ac.jp/lecture/Average/Tukey1.html
- http://aoki2.si.gunma-u.ac.jp/R/tukey.html

No.22120 Re: 分散ゼロの場合の平均値の比較  【ヒロ】 2016/08/20(Sat) 23:04

青木先生,荒様,
ご返信,ありがとうございます。

荒様ご紹介の方法は知りませんでした。試してみます。

今後もご指導,よろしくお願いいたします。

● 「統計学関連なんでもあり」の過去ログ--- 048 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る