No.05569 SE  【R初心者】 2008/01/28(Mon) 15:05

疾病Cについて,
A年で,抽出調査で比率がu1 標準誤差がSE1
B年で,抽出調査で比率がu2 標準誤差がSE2
であるとき,
z0=(u1-u2)/SQRT(SE1^2+se2^2)
として,A年の疾病Cについての推定比率u1とB年の推定比率u2を,正規分布表で検定してよろしいでしょうか?

No.05572 Re: SE  【青木繁伸】 2008/01/28(Mon) 15:21

比率とSE1, SE2 しかわかっていないというなら仕方がないですが,普通は
http://aoki2.si.gunma-u.ac.jp/lecture/Hiritu/diff-p-test.html
にしたがっておく方が無難でしょう。
両方で計算してみて比較すると良いでしょう(結果は大きく違わないことがほとんどではありましょうが)

No.05582 Re: SE  【R初心者】 2008/01/29(Tue) 16:44

標準誤差率(%)の場合
A地区 SE1% 3.933333333
B地区 SE2% 4.26
A地区推定比率 u1 0.001134024
B地区推定比率 u2 0.001261854
A地区SE SE1=u1*SE1%/100=4.46049*10^-5
B地区SE SE2=u2*SE2%/100=5.3755*10^-5
z0=(u1-u2)/sqrt(SE1^2+SE2^2)=-1.830031248
の計算となります。
よろしいでしょうか?

No.05584 Re: SE  【青木繁伸】 2008/01/29(Tue) 17:34

推定比率がそんなに低い(0.1%程度)んですか?
地域の死亡率か何かでしょうか?
u1 に対する n1 は 569329,u2 に対する n2 は 436137 ですものね。
もし,そう言うことでしたら,こういう全数調査データは検定することは不適切だと思います。

計算自体は合っていると思います。

No.05587 Re: SE  【R初心者】 2008/01/30(Wed) 10:36

上の数字は,疾病の新生物の2000年と2005年の0-4歳階級での,患者調査の数字です。標準誤差は,各県調査での推計患者数,分散がもとまり,全国値を出したものです。
n1,n2を出して,Fisherの直接計算では,z0=-9.1148879となりました。
比率が低いと,u=d/nとしたときの,d自体が少ないので,信頼性が少ないので,検定の意味が無いということでしょう。ありがとうございました。

No.05590 Re: SE  【青木繁伸】 2008/01/30(Wed) 13:07

> 比率が低いと,u=d/nとしたときの,d自体が少ないので,信頼性が少ないので,検定の意味が無いということでしょう

そう言うことではないです

標本調査でないならば検定は不適切といったまでですが,患者調査ならば標本調査ということなので検定しても問題はないでしょう。
ただし,標本調査を元にした推計患者数・分散を用いて検定するというのは誤りでしょう。

> Fisherの直接計算では,z0=-9.1148879

おかしいですね。Fisher's exact test では z は出ませんよ。

● 「統計学関連なんでもあり」の過去ログ--- 041 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る