No.20887 母集団が正規分布でないときのカイ二乗値の分布  【活性汚泥】 2014/02/21(Fri) 22:09

初めて質問させていただきます。

母集団が正規分布でないとき,n個の標本xi(i=1..n)から得られる統計量
Σ(xi - 標本平均)^2/(母集団の分散)
は,nが十分に大きいとき,自由度n-1のカイ二乗分布に近似的に従うといえるでしょうか?

手持ちの統計関連書籍(入門レベルですが)では答えを見つけられず,悩んでいます。
また,この疑問は,データの分布の正規性を仮定できない場合でも,標本数が十分に大きければ,パラメトリックな分散分析を使ってもよいか,という疑問に端を発しています。
もしかしたらすごく初歩的な質問かもしれませんが,よろしくお願いいたします。

No.20888 Re: 母集団が正規分布でないときのカイ二乗値の分布  【青木繁伸】 2014/02/21(Fri) 23:33

シミュレーションしましたが,母集団が一様分布などだと示された統計量はカイ二乗分布に従うとはいえませんね。下の図は,n=1000 の場合ですが,あきらかに違いますね。左は正規母集団,右は一様分布母集団の場合。

なお,

> データの分布の正規性を仮定できない場合でも,標本数が十分に大きければ,パラメトリックな分散分析を使ってもよいか

ということならば,一元配置分散分析ならば,等分散を仮定しない Welch の方法によればよいと思いますよ。R では,一元配置分散分析の場合も,等分散を仮定しない Welch の方法がデフォルトです。
trial <- 10000
n <- 1000
chisq.norm <- replicate(trial, {V <- 1; x <- rnorm(n); sum((x-mean(x))^2)/V})
chisq.unif <- replicate(trial, {V <- 1/12; x <- runif(n); sum((x-mean(x))^2)/V})
layout(matrix(1:2, 1))
old <- par(mar=c(3, 3, 1.2, 1), mgp=c(1.8, 0.8, 0))
hist(chisq.norm, breaks=50, probability=TRUE, main="normal distribution")
x <- seq(min(chisq.norm), max(chisq.norm), by=0.01)
lines(x, dchisq(x, n-1), col="red")
hist(chisq.unif, breaks=50, probability=TRUE, main="uniform distribution")
x <- seq(min(chisq.unif), max(chisq.unif), by=0.01)
lines(x, dchisq(x, n-1), col="red")
par(old)
layout(1)


No.20893 Re: 母集団が正規分布でないときのカイ二乗値の分布  【活性汚泥】 2014/02/22(Sat) 12:39

ご回答いただき有難うございました。
シミュレーション結果を見て納得です。カイ二乗値はもとの分布の形の影響を受けたものになりそうですね。
自分でもいくつか異なる分布の母集団でシミュレーションしてみようと思います。

No.20895 Re: 母集団が正規分布でないときのカイ二乗値の分布  【活性汚泥】 2014/02/22(Sat) 13:14

>一元配置分散分析ならば,等分散を仮定しない Welch の方法

これは分布の形が正規分布であることが前提として必要でしょうか?
自分でも調べてみますが,ふと気になったので続けて質問させていただきました。
だったらノンパラメトリックな解析を行えと言われればそれまでですが。

No.20896 Re: 母集団が正規分布でないときのカイ二乗値の分布  【青木繁伸】 2014/02/22(Sat) 13:34

> これは分布の形が正規分布であることが前提として必要でしょうか?

以下を参照

等分散でないときの平均値の差の検定
http://aoki2.si.gunma-u.ac.jp/lecture/BF/index.html
三群以上の比較の場合の結果
http://aoki2.si.gunma-u.ac.jp/lecture/BF/sankouzu.html

No.20910 Re: 母集団が正規分布でないときのカイ二乗値の分布  【活性汚泥】 2014/02/24(Mon) 10:37

ありがとうございます。
リンク先の内容を確認します。

● 「統計学関連なんでもあり」の過去ログ--- 046 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る