★ 比率の信頼区間(Coverage Probability) ★

4870. 比率の信頼区間(Coverage Probability) 悩める獅子 2004/11/07 (日) 05:35
└4871. Re: 比率の信頼区間(Coverage Probability) 青木繁伸 2004/11/07 (日) 09:02
 └4876. Re^2: Coverage Probabilityって一体? 悩める獅子 2004/11/07 (日) 20:47
  └4878. Re^3: Coverage Probabilityって一体? 青木繁伸 2004/11/07 (日) 21:14


4870. 比率の信頼区間(Coverage Probability) 悩める獅子  2004/11/07 (日) 05:35
今,比率の信頼区間の解釈で非常に悩んでいます。

信頼区間の定義はPr[PL<p<PU]=1-αですよね。
左辺は一般にCoverage Probabilityと呼ばれ,
真のpを含む確率とも言えます。
これは例えば,1つのp(0<p<1)を固定して
10000回信頼区間を作ったとして,そのうち,
9999回pを含むとすると,Coverage Probabilityは
0.9999という解釈で合っているのでしょうか?

比率の信頼区間はたくさんありますが,例えば95%区間を作った
としても,標本サイズnおよびpの値によっては
Coverage Probabilityが0.95を上回ったり,下回ったり
すると思います。
結局,信頼係数を0.95としたにもかかわらず,
Coverage Probabilityが0.95に等しくないと言うことは,
それだけ信頼度も変わってくるということですよね。
実際の信頼係数を真のpを含む確率と解釈すると,
何か矛盾があるような・・・。

今SASでプログラムを書いているのですが・・・。
(要はCoverage Probabilityそのものを求めたい!)
xの情報がないのでpを指定して,二項乱数を発生させて
信頼区間を作っています。

疑問に思うのが,Coverage Probabilityを求める式もあるんで
す。

http://www.is.seikei.ac.jp/~iwasaki/kouginote/B/B.03.One-Sample/B.03.5.5.Coverage.htm


その式に当てはめると,何もxの乱数を発生させなくとも,
Coverage Probabilityが求まるし,きれいなグラフが
書けます。(グラフは横軸pと縦軸Coverage Probability)

ちなみにプログラムを書いて,グラフを書いても似通っては
いるのですが,Coverage Probabilityの式に代入したような,
きれいなグラフにはなりません。


これは一体どういう風に解釈していいのでしょうか?
式から求める方が正しいのか,それとも乱数を発生させて
求めた方が正しいのか・・・。
ちなみに多くの論文では,式から求めたようなきれいな
グラフしか見たことがありません。
私のやっていることは一体何なんだろうか?と路頭に迷って
います。

長くなりましたが,どなたか助言してくれる方がいれば
幸いです。

http://www.littera.waseda.ac.jp/faculty/stok/menu06/6_95pct.html
での解釈も気になるところです。

     [このページのトップへ]


4871. Re: 比率の信頼区間(Coverage Probability) 青木繁伸  2004/11/07 (日) 09:02
> http://www.littera.waseda.ac.jp/faculty/stok/menu06/6_95pct.html
> での解釈も気になるところです。

は, 信頼区間の考え方(理解の仕方)を書いているわけであり,実際に信頼区間をそのようにして(悩める獅子さんのようにして)求める必要はないです。貴方の やっていることは,シミュレーションですね。シミュレーションではやるたびに結果は変わりますし,試行回数ノン問題もあります。理論式から求めるやり方で 何の問題もありません。

     [このページのトップへ]


4876. Re^2: Coverage Probabilityって一体? 悩める獅子  2004/11/07 (日) 20:47
ご返事ありがとうございます。

http://www.littera.waseda.ac.jp/faculty/stok/menu06/6_95pct.html
を見れば,見るほど,Coverage Probabilityの解釈が分からなくなってきたので,再度質問させて下さい。

比率の信頼区間の定義はPr[PL<p<PU]=1-αですよね。左辺がCoverage Probabilityで,真のパラメータpを含む確率…。と,ここまでは理解できるんです。これはいわばX=xを観測する前の事前確率と解釈していいのでしょうか?
理論に基づいて,シミュレーションで何万個とランダムにxを発生させたとしても,そのxはもはや推定値となり,Coverage Probabilityを言及することは無理なのか?

例 えば,n=10(ベルヌーイ試行数)とするとXの取り得る値は0〜10です。この時点ではXは確率変数ですし,調査者は事前にXが0〜10まで変化するこ とを知っている…だから理論式に当てはめて0<p<1のCoverage Probabilityを求めることができる???

そ うすると右辺の信頼係数とCoverage Probabilityとの関係をどう説明すればいいのか分かりません。例えば,95%Exact区間では比率pのCoverage Probabilityは1-αをかなり上回るし,95%Wald区間(nが小さい時)ではかなり下回ります。これをどう説明すればいいのか分かりませ ん。
区間100個のうち,95個含んでいるはずなのに実際は95%含んでいないと解釈すると,0.95という信頼係数は偽物ということになるのではないのでしょうか?
往々にして比率の信頼区間において右辺と左辺は一致しません。
左辺と右辺は別物と考えた方がいいのでしょうか?

上手く説明できなくて&長くなり申し訳ありまん。
Coverage Probabilityと信頼係数の関係を,分かりやすく説明する方法をどなたか教えて下さい。


     [このページのトップへ]


4878. Re^3: Coverage Probabilityって一体? 青木繁伸  2004/11/07 (日) 21:14
> 例えば,95%Exact区間では比率pのCoverage Probabilityは1-αをかなり上回るし,95%Wald区間(nが小さい時)ではかなり下回ります。これをどう説明すればいいのか分かりません。

比率の信頼区間の場合は,計数データについての推定なので取りうる値がとびとびであるためということでは?
母平均の信頼区間を求めることをかんがえてみてください。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 031 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る