No.12418 2つの率の差の検定  【R初心者】 2010/04/09(Fri) 09:13

お世話になっております。たとえば,下の表のように,2つの集団の母数が,大きく異なっている場合でも,普通に,2つの率の差の検定
z0=|r1-r2|/sqrt(r(1-r)(1/n1+1/n2))を使って差し支えないでしょうか?
内容                総数
糖尿病治療薬服薬者 m1 204
出現率 r1 0.047486034
総数 n1 4296
糖尿病 m2 2469000
出現率 r2 0.028196071
日本人総人口    n2 87565392
r 0.028197017
z0 7.63769253
なお,追記ですが,後の大きな標本では,糖尿病の数字は千人単位で,記載されております。

No.12420 Re: 2つの率の差の検定  【青木繁伸】 2010/04/09(Fri) 11:58

母比率の検定を行った方がよいですね

No.12423 Re: 2つの率の差の検定  【R初心者】 2010/04/09(Fri) 15:28

母比率を行いたいのですが,データの年が違うので,独立した2群の差の検定を行いたいです。そうした場合,Nの大きさがかなり違う集団の検定は,独立した2群の差の検定で差し支えないと,今のところ,解釈していますが,コメントをお願いいたします。

No.12424 Re: 2つの率の差の検定  【青木繁伸】 2010/04/09(Fri) 17:49

> データの年が違うので,独立した2群の差の検定を行いたいです

データの年が違うので母比率の検定ができないというのは,おかしな理由ですね。データの年次が違う2つの集団の比率も比較できないというのと同じでしょう。

サ ンプルサイズが違うといっても,あなたのやろうとしている一方は母集団(成人ということかな)ですよ。その中にサンプルがあるわけで,データ構造的にもお かしい(独立に標本ではない)し,そもそも,いくらサンプルサイズが違っても検定はできるとはいえ,片方がこんなにでかいと,検定をやる前から,有意にな ることが明らかですね。検定統計量(あなたの場合 z0)は,率の差が大きくても,サンプルサイズが大きくても大きくなる(従って,p 値は小さくなる)ということ。

そう言う意味で,母比率の検定をお勧めしたわけです。ですが,今回のデータのように片方のサンプルサイズがばかでかく,さらにもう一方もある程度でかいと,二群の比率の差の検定も,母比率の検定も,ほとんど同じになりますね。
プールした比率 r ≒ r2
1/n1 = 0.0002327747 ≒ 1/n1+1/n2 = 0.0002327861 で
母比率の差の検定
abs(r1-r)/sqrt(r*(1-r)/n1) = 7.637505
二群の比率の差の検定
abs(r1-r2)/sqrt(r*(1-r)*(1/n1+1/n2)) = 7.637693
有意になったのは,n2 のせいじゃなくて,n1 が十分に大きいから(r1 と r2 の差も大きいけど)

No.12436 Re: 2つの率の差の検定  【R初心者】 2010/04/12(Mon) 11:26

標本の大きさが大きく違う場合,2つの差の検定と母比率の検定の分散は,おっしゃるように,ほとんど同じで,検定結果もほとんど同じになります。ありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る