No.21050 Re: データの正規性について 【青木繁伸】 2014/05/21(Wed) 19:12
母集団データも,標本データも,正規分布している必要はない。対応のあるそれぞれのデータは,同一の分布に従っている必要はある。また,対になっていのデータの差は正規分布している必要がある。
シミュレーションでやってみる。
母分布は「指数分布!!!」,対応のあるデータの差は平均値0の正規分布に従う(+rnorm(n, mean=delta.mean))。> sim <- function(n=30, delta.mean=0) {対応のあるデータの差の平均値は0になるはず。しかし,複数回行ったシミュレーションでは,そのうちの5%は「いいや,平均値の差は0じゃないよ!」という結果になるよと言う例。
+ x <- rexp(n)
+ y <- rexp(n)+rnorm(n, mean=delta.mean)
+ t.test(x, y, paired=TRUE)$p.value < 0.05
+ }
> mean(replicate(10000, sim()))
[1] 0.0483
も う一つ。パラメトリックなt検定の仮定が満たされているとき,t検定に比べたウィルコクソンの符号付き順位和検定の検定効率はπ/3≒95.5%。つま り,ウィルコクソンの符号付き順位和検定で必要なサンプルサイズは,t検定で必要なサンプルサイズの比はπ/3であるということ。そんなにひけを取らない ものなんですよ...と。
● 「統計学関連なんでもあり」の過去ログ--- 046 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る