★ ANOVAの3つのグループの比較 ★

1063. ANOVAの3つのグループの比較 AVONA 2003/11/18 (火) 21:45
└1064. Re: ANOVAの3つのグループの比較 青木繁伸 2003/11/18 (火) 22:02
 └1066. Re^2: ANOVAの3つのグループの比較 青木繁伸 2003/11/18 (火) 22:55
  └1067. Re^3: ANOVAの3つのグループの比較 青木繁伸 2003/11/18 (火) 23:08
   └1068. Re^4: ANOVAの3つのグループの比較 AVONA 2003/11/18 (火) 23:31
    └1123. Re^5: ANOVAの3つのグループの比較 DISIR 2003/11/24 (月) 00:42


1063. ANOVAの3つのグループの比較 AVONA  2003/11/18 (火) 21:45
ANOVAを使い,3つのグループを比較しようと思いますが,
Aグループ:270人(実験群)
Bグループ:120人(実験群)
Cグループ:15人(統制群)
という風にバランスの悪い場合には,比較すると信頼性が落ちると思います。なので,ノンパラメトリック検定をしよと思うのですが,やっぱり人数のアンバランスさが気になります。
第三者の意見が聞きたいのですが,どう思われますか?

     [このページのトップへ]


1064. Re: ANOVAの3つのグループの比較 青木繁伸  2003/11/18 (火) 22:02
> バランスの悪い場合には,比較すると信頼性が落ちると思います。なので,ノンパラメトリック検定をしよと思うのですが,やっぱり人数のアンバランスさが気になります。

例数設計は,データを集める前に行われるわけです。
同じ人数を調査するなら,サブグループあたりの人数が同じときがもっとも検出力が高くなります。

特に,実験のような場合には各群を均等に割り当てるのが可能なわけですから,例数をそろえてデータを採るのが鉄則です。

しかし,普通の調査のように,あるいは,データを採ってから群分けをして分析するような場合には,ふたを開けなければ各群の例数がわからないと言うこともあるので,例数のアンバランスは避けられないこともあるわけです。

例数がアンバランスなときには全く問題がないわけではないですが,それはしようがないわけです。

「信頼性が落ちる」ということが何を指すのかにもよるのでしょうが,ノンパラ検定は検出力はパラメトリック検定よりは劣りますからね。

貴方の場合は「実験データ」なんですね。なぜこんなにアンバランスなデータになってしまったんでしょう。
今更言ってもしようがないし,このまま分析を進めるしかないと思います。

     [このページのトップへ]


1066. Re^2: ANOVAの3つのグループの比較 青木繁伸  2003/11/18 (火) 22:55
> 同じ人数を調査するなら,サブグループあたりの人数が同じときがもっとも検出力が高くなります。

独立二標本の平均値の差の検定(t検定)を例にして,R でシミュレーションプログラムを書いてみました。
(シミュレーションなんかしなくても,パワーアナリシスすればいいんですよ。念のため)

effect size=0.5,α=0.05,power=0.80 としたとき,両側検定では各群に65例必要です。

n1= 39,n2= 91 程度のアンバランスなら power = 0.732 ほどなんですが,それ以上に例数がアンバランスになると実際の検出力が急に下がっていきます。
> simulation <- function(n1, n2, alpha=0.05, power=0.8, effect.size=0.5, loop=1000)
+ {
+     cat("n1=", n1, "   n2=", n2, "\n")
+     success <- 0
+     for (i in 1:loop) {
+         x1 <- rnorm(n1)
+         x2 <- rnorm(n2, mean=effect.size)
+         result <- t.test(x1,x2)
+         if (result$p.value < alpha) {
+             success <- success+1
+         }
+     }
+     cat("power = ", success/loop, "\n")
+ }
> 
> simulation(65, 65)
n1= 65    n2= 65 
power =  0.809 
> simulation(52, 78)
n1= 52    n2= 78 
power =  0.803 
> simulation(39, 91)
n1= 39    n2= 91 
power =  0.732 
> simulation(26, 104)
n1= 26    n2= 104 
power =  0.585 
> simulation(13, 117)
n1= 13    n2= 117 
power =  0.322 
> simulation(5, 125)
n1= 5    n2= 125 
power =  0.141 

     [このページのトップへ]


1067. Re^3: ANOVAの3つのグループの比較 青木繁伸  2003/11/18 (火) 23:08
先のプログラムの一部を
result <- wilcox.test(x1,x2)
とすれば,マン・ホイットニーのU検定のパワーをシミュレーションできるので,やってみると,
> simulation(65, 65)
n1= 65    n2= 65 
power =  0.795 
> simulation(52, 78)
n1= 52    n2= 78 
power =  0.765 
> simulation(39, 91)
n1= 39    n2= 91 
power =  0.73 
> simulation(26, 104)
n1= 26    n2= 104 
power =  0.608 
> simulation(13, 117)
n1= 13    n2= 117 
power =  0.373 
> simulation(5, 125)
n1= 5    n2= 125 
power =  0.178 
のような感じですね。

     [このページのトップへ]


1068. Re^4: ANOVAの3つのグループの比較 AVONA  2003/11/18 (火) 23:31
う〜,すみません,上の計算式が全く理解できないのですが,サンプルの数がなぜアンバランスになったかというと,各群それぞれの条件に合う協力者が,集まらなかったからです。
それで,集まらなかったのは仕方がない,ということでやるしかないのかなぁ,と考えています。もちろん人数が揃えば良かったわけですけど…。

     [このページのトップへ]


1123. Re^5: ANOVAの3つのグループの比較 DISIR  2003/11/24 (月) 00:42
> う〜,すみません,上の計算式が全く理解できないのですが,
2群比較の場合のn1群とn2群のサンプルサイズを変えて幾つか検出力を計算されているのだと思います。
経験的にはサンプルサイズは2倍以内位にしておくのが無難だと思います。
それから統制群という意味がわからないのですが,これはマーカーとかポジティブコントロールとか言われるものではなく,本当に同様に比較するものなのですか。データの形式だけでなく結論として何が言いたいかを含め再考されてはいかがですか。
アンバランスの発生理由からすると,無作為割付を前提とした手法を適用することの是非の批判も受けるかもしれないという印象も受けました。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 026 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る