内容 総数なお,追記ですが,後の大きな標本では,糖尿病の数字は千人単位で,記載されております。
糖尿病治療薬服薬者 m1 204
出現率 r1 0.047486034
総数 n1 4296
糖尿病 m2 2469000
出現率 r2 0.028196071
日本人総人口 n2 87565392
r 0.028197017
z0 7.63769253
No.12420 Re: 2つの率の差の検定 【青木繁伸】 2010/04/09(Fri) 11:58
母比率の検定を行った方がよいですね
No.12423 Re: 2つの率の差の検定 【R初心者】 2010/04/09(Fri) 15:28
母比率を行いたいのですが,データの年が違うので,独立した2群の差の検定を行いたいです。そうした場合,Nの大きさがかなり違う集団の検定は,独立した2群の差の検定で差し支えないと,今のところ,解釈していますが,コメントをお願いいたします。
No.12424 Re: 2つの率の差の検定 【青木繁伸】 2010/04/09(Fri) 17:49
> データの年が違うので,独立した2群の差の検定を行いたいです
データの年が違うので母比率の検定ができないというのは,おかしな理由ですね。データの年次が違う2つの集団の比率も比較できないというのと同じでしょう。
サ ンプルサイズが違うといっても,あなたのやろうとしている一方は母集団(成人ということかな)ですよ。その中にサンプルがあるわけで,データ構造的にもお かしい(独立に標本ではない)し,そもそも,いくらサンプルサイズが違っても検定はできるとはいえ,片方がこんなにでかいと,検定をやる前から,有意にな ることが明らかですね。検定統計量(あなたの場合 z0)は,率の差が大きくても,サンプルサイズが大きくても大きくなる(従って,p 値は小さくなる)ということ。
そう言う意味で,母比率の検定をお勧めしたわけです。ですが,今回のデータのように片方のサンプルサイズがばかでかく,さらにもう一方もある程度でかいと,二群の比率の差の検定も,母比率の検定も,ほとんど同じになりますね。
プールした比率 r ≒ r2
1/n1 = 0.0002327747 ≒ 1/n1+1/n2 = 0.0002327861 で
母比率の差の検定
abs(r1-r)/sqrt(r*(1-r)/n1) = 7.637505
二群の比率の差の検定
abs(r1-r2)/sqrt(r*(1-r)*(1/n1+1/n2)) = 7.637693
有意になったのは,n2 のせいじゃなくて,n1 が十分に大きいから(r1 と r2 の差も大きいけど)
No.12436 Re: 2つの率の差の検定 【R初心者】 2010/04/12(Mon) 11:26
標本の大きさが大きく違う場合,2つの差の検定と母比率の検定の分散は,おっしゃるように,ほとんど同じで,検定結果もほとんど同じになります。ありがとうございました。
● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る