No.12405 Re: Poisson分布のパラメータの信頼区間 【後医は名医】 2010/04/07(Wed) 18:23
「統計解析のはなし」(石村貞夫著,東京図書)p179では2kになっていますが,どちらが正しいのか,私も興味のあるところです。
No.12412 Re: Poisson分布のパラメータの信頼区間 【韮澤】 2010/04/08(Thu) 08:15
どちらが正しいかは知りませんが,品質管理関係では,不良発生数の分布予測などに,2k+2を使っています。これのオリジナルはMILなので,アメリカ流の統計学が出元と思われます。
石村さんの本は,元はイギリス系の推定統計学の流派だったかな?
No.12430 Re: Poisson分布のパラメータの信頼区間 【知ったかぶり】 2010/04/11(Sun) 11:42
以下のようなシミュレーションを行ってみました.#サンプルサイズ20,パラメータの真値が5であるとして,これは信頼区間に真値が含まれなかったケース数なので,どれも2500になるべきもの.当然のことながら,自由度を2k+2とした方が,区間は狭くなる.この傾向は,パラメータの真値が小さいほど顕著で,mu=1とすると,
set.seed(123)
alpha <- 0.05; n <- 20; N2 <- 2*n; mu <- 5
rep.n <- 100000
res <- rep(0,3)
for(i in 1:rep.n){
k <- sum(rpois(n,mu)) #平均5のポアソン乱数20個の総計
df1 <- 2*(k+1)
df2 <- 2*k
ub <- qchisq(1-alpha/2, df1)/N2
lb1 <- qchisq(alpha/2, df1)/N2
lb2 <- qchisq(alpha/2, df2)/N2
if (ub < mu) res[1] <- res[1]+1 #上側信頼区間が真値以下
if (lb1 > mu) res[2] <- res[2]+1 #下側信頼区間(df=2*(k+1))が真値以上
if (lb2 > mu) res[3] <- res[3]+1 #下側信頼区間(df=2*k)が真値以上
}
> res
[1] 2365 2851 2269[1] 2212 3411 2162自由度を2k+2とすると,下側信頼区間は本当の区間よりも狭くなるが,全体としては,設定した水準に大体収まる(上側信頼区間が本当の区間よりも広いので).下側の自由度を2kとするとかなり保守的な結果になる,ということのようです.
No.12438 Re: Poisson分布のパラメータの信頼区間 【surg】 2010/04/12(Mon) 17:00
(Garwood F, 1936) が原典のようなので取り寄せてみたのですが,これは lower が 2k+2 で upper が 2k でした.
一 方で (Agresti A & Coull BA, 1998) によれば,2項分布のみならずポアソン分布においても「正確な」信頼区間よりもスコア信頼区間の方が被覆確率が正確だとされています.ということで,個人 的にはポアソン分布のパラメータの信頼区間も,今後はスコア信頼区間を使うことにしようと考えています.
【参考文献】
Garwood F: Fiducial limits for the Poisson distribution, biometrika, 28, 437-442, 1936.
Agresti A, Coull BA: Approximate is better than exact for interval estimation of binomial proportions, American Statistician, 52, 119-126, 1998.
● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る