No.16590 カイ二乗検定  【タスク】 2012/03/07(Wed) 01:25

統計初学者です。どのうような統計を使えば良いのか教えてください。
例えで申し訳ないのですが, 20x20=400ピクセルの画像があり,これは地図のように排他的なA-Eの5つのラベル(領域)に分割できます。A-Eのピクセル数はそれぞれ, 100, 80, 80, 80, 60です。この画像のうち,40ピクセルで変化が観察されました。変化したピクセル内のA-Eのラベルは,20,10,5,0,5でした。表のようになり ます。
	         A	B	C	D	E	計
画像全体 100 80 80 80 60 400
変化した部分 20 10 5 0 5 40
このようなデータで,ラベル(領域)選択的に変化したかを検定したいと考えています。具体的には,Aは画像全体では100/400=25%ですが,変化した部分では20/40=50%を占めており,これが期待される値より大きいということを言えないかと思っています。
例えば,画像全体をA(100),非A(300), 変化した部分もA(20), 非A(20)に分けて画像全体の値を期待値,変化した部分の値を観測値としてカイ二乗検定をしてもよいのでしょうか?的外れな質問だったらすみません。

No.16591 Re: カイ二乗検定  【ひの】 2012/03/07(Wed) 08:55

以下のように2×5の分割表に整理してχ二乗検定をしてください。


No.16592 Re: カイ二乗検定  【タスク】 2012/03/07(Wed) 15:19

早速のご返事ありがとうございます。

2x5分割表のχ二乗検定で有意だったとすると,「領域と変化に関連性がある」あるいは「領域によって変化する頻度が異なる」と言えると理解してよろしいでしょうか?

私の質問の意図は,特定の領域(A)に着目して,変化した部分に含まれるピクセルが期待される値より大きいかの検定ができないかということだったのですが,2x5分割表のχ二乗検定でこのようなことが言えるのでしょうか?

私の理解不足だったらすみません

No.16593 Re: カイ二乗検定  【青木繁伸】 2012/03/07(Wed) 16:33

残差分析までやればよいと思います。

No.16604 Re: カイ二乗検定  【タスク】 2012/03/09(Fri) 12:09

ありがとうございました。解決しました。
青木先生のmy.chisq.testを使ってRで残差分析をやりました。

> vals <- c(20,10,5,0,5,80,70,75,80,55)
> X <- matrix(vals, nrow=2, ncol=5, byrow=TRUE)
> X
[,1] [,2] [,3] [,4] [,5]
[1,] 20 10 5 0 5
[2,] 80 70 75 80 55
> mytest <- my.chisq.test(X)
> mytestadjusted.residuals
[,1][,2][,3][,4][,5]
[1,]3.8490020.8333333−1.25−3.333333−0.46676
[2,]−3.849002−0.83333331.253.3333330.46676
>pnorm(abs(mytest$adjusted.residuals
[,1] [,2] [,3] [,4] [,5]
[1,] 3.849002 0.8333333 -1.25 -3.333333 -0.46676
[2,] -3.849002 -0.8333333 1.25 3.333333 0.46676
> pnorm(abs(mytestadjusted.residuals), lower.tail=FALSE)*2
[,1] [,2] [,3] [,4] [,5]
[1,] 0.0001186001 0.4046568 0.2112995 0.0008581207 0.6406716
[2,] 0.0001186001 0.4046568 0.2112995 0.0008581207 0.6406716

この残差分析は1つ1つのセルについての期待値=観測値という帰無仮説の検定になると思いますが,多重比較の問題はないのでしょうか?

No.16605 Re: カイ二乗検定  【青木繁伸】 2012/03/09(Fri) 12:40

当然ありますよ

No.16606 Re: カイ二乗検定  【タスク】 2012/03/09(Fri) 12:51

このデータの場合,多重比較補正にBonferroniを使うとすると,有意水準αをセルの数10で割るべきなのでしょうか?それとも領域の数5で割るべきなのでしょうか?

No.16608 Re: カイ二乗検定  【青木繁伸】 2012/03/09(Fri) 13:03

> 有意水準αをセルの数10で割るべきなのでしょうか?それとも領域の数5で割るべきなのでしょうか?

さあ,どうでしょうね。ほかに,従属性を考えると独立性の検定の自由度の4で割るのか?など。

なお,P 値は,summary(mytest) だけで表示されますよ。自分で計算する必要はない。

>> 目的
>>
>> カイ二乗分布を用いる独立性の検定を行い,Haberman による残差分析も行う。
>> 残差分析の結果は summary メソッドで表示する。
> vals <- c(20,10,5,0,5,80,70,75,80,55)
> X <- matrix(vals, nrow=2, ncol=5, byrow=TRUE)
> mytest <- my.chisq.test(X)
> summary(mytest)
調整された残差
[,1] [,2] [,3] [,4] [,5]
[1,] 3.849 0.83333 -1.25 -3.3333 -0.46676
[2,] -3.849 -0.83333 1.25 3.3333 0.46676

P 値
[,1] [,2] [,3] [,4] [,5]
[1,] 0.0001186 0.40466 0.2113 0.00085812 0.64067
[2,] 0.0001186 0.40466 0.2113 0.00085812 0.64067

というのは,
> summary.my.chisq.test
function( obj, # my.chisq.test が返すオブジェクト
digits=5) # 出力桁数
{
cat("調整された残差\n")
print(obj$adjusted.residuals, digits=digits)
cat("\nP 値\n")
print(pnorm(abs(obj$adjusted.residuals), lower.tail=FALSE)*2, digits=digits)
}
が定義されているから。

● 「統計学関連なんでもあり」の過去ログ--- 045 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る