No.00909 Re: 発現率が0%の場合の信頼区間 【青木繁伸】 2006/08/16(Wed) 20:43
http://aoki2.si.gunma-u.ac.jp/R/p-conf.html
の後半を参照してみてください。
No.00937 Re: 発現率が0%の場合の信頼区間 【マスオ】 2006/08/23(Wed) 23:10
> http://aoki2.si.gunma-u.ac.jp/R/p-conf.html
> の後半を参照してみてください。
教科書にも載っている方法かと思いますが,ほんとにこれでよいのでしょうか?
試しに母比率 p=0.26,サイズ n=10の標本を,信頼確率 conf=0.95で 10000回ほど試行してみると,観察される確率は 0.95未満(0.9268前後)ではありませんか?
両側信頼区間は標本比率 0または 1の場合も両側確率に基づいた方がよいと思うのですが.
> p <- 0.26
> n <- 10
> nn <- 10000
> x <- rbinom(nn, n, p)
> cia <- sapply(x, prop.conf, n=n, conf=0.95)
> sum(cia[1,]<=p & cia[2,]>=p)/nn
[1] 0.9224
> cib <- sapply(x, function(x) binom.test(x, n, conf.level=0.95)$conf.int)
> sum(cib[1,]<=p & cib[2,]>=p)/nn
[1] 0.973
No.00938 Re: 発現率が0%の場合の信頼区間 【青木繁伸】 2006/08/23(Wed) 23:56
ちょっと,気になっていたところで,夕方 R に binom パッケージが加わっていたのにも気づいたところです。
p <- 0.26
で, 発生された二項乱数は,当然ながら0〜10の範囲の整数値を取るわけで,問題となるのは0の場合の区間推定値です。prop.conf では [0, 0.2588656] ですから p はこの信頼区間の外になりますね。binom.test では [0, 0.3084971] なので p は常にこの信頼区間に含まれます。
p <- 0.2588655
とすると,[0, 0.2588656] に含まれるので,以下のようになります。> p <- 0.2588655
> n <- 10
> nn <- 10000
> set.seed(12345)
> x <- rbinom(nn, n, p)
> cia <- sapply(x, prop.conf, n=n, conf=0.95)
> sum(cia[1,]<=p & cia[2,]>=p)/nn
[1] 0.9767
> cib <- sapply(x, function(x) binom.test(x, n, conf.level=0.95)$conf.int)
> sum(cib[1,]<=p & cib[2,]>=p)/nn
[1] 0.9767
同じ結果になります(当然なのですが)。
しかし,この確認法は観察値が0であるときの計算方法の確認にはならないと思います。
あれこれ考察中。。。
No.00944 Re: 発現率が0%の場合の信頼区間 【青木繁伸】 2006/08/24(Thu) 00:55
分布が左右非対称なものだから,両側から2.5%の点というのがとれないことが一つの問題。
だから, 95%信頼区間は片側だけで5%を削って95%をとるしかない。両側を考えて,片側で2.5%削ろうと思っても,じゃあ反対側の2.5%はどこにあるの? ということになるとそんなものはなくて,結局97.5%信頼区間を求めたことになってしまっているのではないかな?> prop.conf(0,10,conf=0.975)
$lower.p
[1] 0
$upper.p
[1] 0.3084971
> binom.test(0,10,conf.level=0.95)
Exact binomial test
data: 0 and 10
number of successes = 0, number of trials = 10, p-value =
0.001953
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
0.0000000 0.3084971
sample estimates:
probability of success
0
No.00948 Re: 発現率が0%の場合の信頼区間 【青木繁伸】 2006/08/24(Thu) 13:12
いろいろ調べている途中ですが,
http://www.graphpad.com/articles/AnalyzingData.pdf
の,130ページに "The meaning of "95% confidence" when the numerator is zero" というのがあり,大意は以下の通り。
--begin quote--
母比率が0,1のときに 95% の信頼区間を求めると,実際には 97.5% の信頼区間が表示されるのは,それ以外の場合との一貫性をとるからであり,その立場に従わないなら 90% 信頼区間を求めれば実質的な 95% 信頼区間が求まる。
--end quote--
No.00963 Re: 発現率が0%の場合の信頼区間 【マスオ】 2006/08/25(Fri) 00:25
いろいろありがとうございます.
> 教科書にも載っている方法かと思いますが
すみません.見直したら x=0のとき 1-(alpha/2)^(1/n)で両側確率でしたので,これは取り消します.
> prop.conf では [0, 0.2588656] ですから p はこの信頼区間の外になりますね。binom.test では [0, 0.3084971] なので p は常にこの信頼区間に含まれます。
違いがあるとすれば,この間の母比率の場合だろうということで,p=0.26でやってみたわけです.
> 両側を考えて,片側で2.5%削ろうと思っても,じゃあ反対側の2.5%はどこにあるの?ということになるとそんなものはなくて,結局97.5%信頼区間を求めたことになってしまっているのではないかな?
これもそのとおりでしょう.
だからといって,(片側確率を使って)x=0の場合を削ると
> dbinom(0, 10, 0.26)
[1] 0.0492399
も削ることになり,今度はおよそ 92.6%になってしまうということではないでしょうか.
おつりのない相手に 95円払うとして,10円玉しかないとき,100円払うか,90円にまけてもらうか.
90円にまけてもらった方が,
> 90% 信頼区間を求めれば実質的な 95% 信頼区間が求まる。
ということなんですかね?
それでも,ほんの一部の母比率の場合のみとはいえ,公称の 95%を下回ることがあるのはどうかと思うのですが.
● 「統計学関連なんでもあり」の過去ログ--- 039 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る